もう少しでベータ

現在、新規に機能追加はしないでバグ修正&テストに専念している(テストといってもインデックスの自動実行を放置しているだけだけど)。Mobyletのリリース待ちにもなっている感じだけど、問題が無ければ 1.0 beta1 としてリリースする予定。beta1 とか付けるけど、普通に使えるかと。そもそも、5月末くらいにリリースしようと思いつつ、あれこれ加えていたら、今になってしまった(もともとローカルファイルまでインデックスしたり、モバイル対応する予定はなかったし)。Google Mini に対抗できるようなもになると良いのだけどね。Google Mini は一日に50万ドキュメントいけるらしい。Fess は丸一日とかインデックスするものがなくて、一日は試せていないけど、チューニングとかなしで観測している感じでは7時間で12万ドキュメントはいける感じだな。まぁ、Google Mini のように上限もないし、分散したりもできるし、ドキュメントのインデックス性能は Solr の構成次第になるからね(Solrも1億ドキュメントをインデックスしているような話もあるし)。そんなわけで、越えることはできるしょー(楽観的だけど)。ひとまず、リリースしていかないと始まらないから、利用可能な状態に早くしたいと思います。Seasar Conference では、Fess も紹介するつもりです~。ということで、Javaフレンドリーな全文検索システム Fess をよろしくですー。

Google Wireless Transcoder

Fess でモバイルの検索結果を表示した時に、リンク先が PC ページの時はどうしたものかと考えていたのだけど、Googleモバイルの用にモバイル用にコンテンツ変換するのが良いかと思ったら、Google Wireless Transcoder っていうのがあるのね。これを有効にできるようにしておこ。

S2Robotのテスト

S2Robot も 0.1.0 のリリースに必要なところは直し、現在、Fess に入れてテスト中。今のところ、問題がないと思うので近日中にリリースすると思う。Fessについてもいろいろと改良を加えた。S2Robotはマルチスレッドで動くけど、Fess 内ではS2Robotを複数のインスタンス立ち上げてクロールさせたりしている(という感じで、すんごいマルチスレッドな感じになっている気がしている)。対応フォーマットについてもTika を導入したので、柔軟にいろんなファイルが処理できるようになった。Fess についても、まだ加えたい機能はあるけど、今でも十分に使えると思うので、ベータリリースをしておこうかと思う今日この頃。

修正とか

近頃、某所で火消チームに加えられ、先週とか忙しかった…。まぁ、今週はいつものようなペースで働くことにしようかと。そんなわけで、S2Robot と Fess の作業を進める。まず、Fess はローカルファイルに対して数十万ドキュメントでインデックスをひたすら繰り返す感じのランニングテストを始めた。そこで発見したS2Robotの問題を修正(PDFの読み込みでPDDocumentをcloseしてなかった)。そんでもって、前々からやろうと思いつつ、手が回っていなかったFessの携帯対応を始めた。もちろん、Mobyletを使っておく。0.8.0からcharsetのjarをJVMに突っ込む必要がなくなったので、Fessへの投入は楽になった。でも、いくつか問題に遭遇したりして、Mobyletにチケットを上げたりしたけど、さっくり修正してもらったので、修正版を投入しないとね。そんな感じで、地道に更新中。