今日のcodesearch

ソースコード検索のcodesearch.codelibs.orgですが、ちょっとずつ更新はしてきているけど、今日はファセット表示まわりを変更してみた。ファイルの種類のところがクエリーファセットだったので、数が多い順とかの表示ができなかったので、フィールドファセットに変更することで、多い順に表示されるようになった。

検索結果の方でも利用しているファセットが一通り表示されるようにしたり、細かいところだが、githubのorganizationのアイコンも表示されるようにしたりしてみた。

JSP上で、fess_label.propertiesに登録されていたら、そのメッセージを使ってなければデフォルト文字列を表示するというのをできるようにするため、Fess側にはfe:message(key, default)的なものを追加してみた。

課題にいろいろと対応してきているけど、大きめな課題としては、ファイルの種類の判定がおかしいものを調査していく感じだろうか。一度、再クロールすれば、そこそこ解決される可能性もあるが、Tikaの判定ロジックの怪しさが残る部分はある気もする…。

ファイルの種類判定問題は、地道にみていくとして、そろそろ本題の検索としての付加価値を付ける、というところに取り組んでいかねばならない。今考えている一つのネタとしては、意味での検索を実現する、というところかなと。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です