Fessはオープンです

Fessはオープンソースでやっていますが、現状、大部分のコードを私が書いている感じです。オープンソースなので、いろんな開発者の方々にも加わってもらったりしてほしいな~、とは思っているのですが、近頃ではかなり高機能化しているため、Fessの全体を把握しようとすると結構難易度が高い気がしてきています(学生の方とかにもテキスト系の研究とかで使って欲しいな~とか思ったりはしてます)。全体を見ようとすると難易度が高いですが、部分部分を見ると全体を把握しなくてもできる残タスクが結構あったりします。たとえば、表示部分で検索条件を入力しやすくしたり、Solrの部分でschema.xmlとかをチューニングしたりとかとか。というような感じで、Fessはオープンな感じでやっていこうと(前から)思っているので、お気軽にコードをいじったりしてみてくださいー。(最近、高機能化していきているので、ここいらで言っておきたかった…)

クリックログ機能

Fessで検索結果を表示したときにどれをクリックしたかを把握できるようにクリックログ機能を追加しました。検索ログ機能を有効にしておけば、検索ログの詳細ページでクリックした結果の一覧が表示されます。検索ログとクリックログはデフォルトでは1分毎にまとめて処理しています(検索するたびにDBを叩きに行くのも微妙だしね…)。最新の4.0.0-SNAPSHOTで利用可能なので、興味がありましたらぜひご利用ください。そして、問題があれば教えてもらえると嬉しいですー。

障害URL一覧機能

他に良い呼び名が思いつかなかったので、クロールしてExceptionが発生したURLを障害URLという感じで呼んでいるのだけど、それを確認できる機能を追加してみた(4.0.0-SNAPSHOT)。これは要望頂いた機能を実装してみた感じです。障害URLを保持することができるようになったので、次はこれを元に次回クロール時には障害URLはスキップする機能を付けようかと思っています。

あとは、細かいところですが、管理画面の左側にあるメニューの数が20個を超える感じになり、ぱっとみでどこに何があるかわかりにくいので、分類してみました。

4.0のリリースまではまだ時間がある感じですが、やることとしては、

  • クリックログ
  • ログ集計
  • NTLM認証対応(どこまでやるか未定)

な感じでしょうか。既にクロール処理に関しては Commons HttpClient 3.1 から HttpComponent HttpClient 4.1系に移行済みなので、NTLMまわりもいろいろとできるはずかと思っています。

そんな感じですが、Fess の新しい機能を見てみたい(または、テストしていただける)方は、ぜひ、4.0.0-SNAPSHOT を使っていただければ助かりますー。