スナップショットバージョン

FessのHudsonでビルドして、スナップショットバージョンをサイトにアップするようにしました。というわけで、サイトから最新のものもダウンロードできるようになりました。1.0.0 に比べて、同時実行のクロール数の調整ができたりと細かな修正が入ってます。今はBASIC認証の対応作業中…。

S2Robotに細かい修正を入れる

来週か再来週あたりに Fess をリリースしたいと考えていて、それに併せて、細かい修正を S2Robot にポツリポツリと入れている。という感じなので、Fess のリリース前には、S2Robot 0.1.1 をリリースする予定でいます。0.1.1 の後には、拡張的な機能も追加したい感じです。

Fess 1.0.0 をリリース

http://sourceforge.jp/projects/fess/ に Fess 1.0.0 を置きました。6月頃にリリースしようと思い、3ヶ月も過ぎ、やっとこリリースできました。ようやくスタート地点に立ったので、引き続き研いていこうと思います。インストール方法は http://fess.sourceforge.jp/ja/setup.html です。細かい設定方法の情報などは地道に増やしていこうかと。

サイトを更新

サイトを作る。必要なところのドキュメントを書いてみた。英語の方は現在余力的に無理なので、そのうち考えることにする。Mavenサイトで作ったのだけど、skin を作ったり、scpexe で sf.jp に Maven でアップロードできるようにするなど、そっちに想定外な時間がかかった気がする…。今は Maven 2.0 を使っているけど、プラグインが 2.0 向けでないものとか存在し始めているから、2.2 にいった方が良いのかな。

http://fess.sourceforge.jp/ja/

次はリリース物に向けて活動。

Seasar Conference でしゃべります

ここのところ力を入れてきた、S2Robot と Fess について話します。

http://event.seasarfoundation.org/sc2009autumn/Session#S3044

2本立てな感じだけど、S2Robot はクローラフレームワークです。ウェブやファイルシステムなど自由に巡回して、指定した内容を取得することができます。HTML をクロールできるのはもちろんだけど、MS Office 系ファイル、画像、音声、圧縮ファイルなど文字列を取得できるファイルは情報取得が可能です(画像や音声はメタ情報を取ることになりますが)。たぶん、使っていただければわかると思いますが、S2Robot はなかなか高機能なクローラな感じです。

Fess については、Java フレンドリーな全文検索システムです。クローラの部分は S2Robot を利用しているので、ウェブやローカルファイルシステムをクロールしてインデックスが可能です。インデックス対象も S2Robot が処理できるものになるので、さまざまな形式のファイルを検索対象にできます。そして、検索エンジン部分には、Apache Solr を持ってきています。Wikipedia によると、Solr は約 2 億ドキュメントもインデックスしているサイトもあるようで、実際に Fess で使っていますが快適です(どこかのアプライアンスのような数万、数十万ドキュメントまでなどのようなちっちゃなことは言いません)。Fess では、Solr サーバをグルーブ化設定できたりと、インデックスできる最大ドキュメント数は構成次第です。あとは、Java フレンドリーというキャッチコピーで書いていますが、システム自体は SAStruts です。なので、Fess のアプリ自体は war ファイルで完結してます。デザイン等は jsp をいじればよいですし、Tomcat のようなサーブレットコンテナがあれば使えます。そうそう、重要なことを一つ忘れてた。Fess はモバイル対応をしています(たぶん、これはほかになかなかないような気が)。これは Mobylet の機能のおかげなのですが、各携帯用にも検索結果を最適に表示できたりします。ちなみに Fess は グッジョブ で稼働させたりしています(様子を見ながらな感じですけど)。

という感じで、並びのコマも Blogopolis、DBFlute、T2 と強力な感じなので、集客活動を頑張らないといかんな~と思っています。S2RobotとFessではネームバリューもないので、竹内さん のところで触れてもらったりと(^^; ぜひ、皆様、Seasar Conference にお越しください~。