検索システム用テストデータリポジトリ

Fessでどのような種類のファイルを検索対象としてサポートしているか、っていうのを聞かれるけど、ファイルの種類も無数にあるし、Fessとしてはすべてのファイルに対してベストエフォートでがんばってテキストを抽出しにいくのでなかなか回答に困る。他社のものを見ても、同じ感じでまるっとしたことしか書いていないので、実際にどうなのかは結構謎な感じなものが多い。Google検索アプライアンスも220種類というような記述を見たけど、実際にそれもどうなのかよくわからん。まぁ、そもそもこの辺のテスト用データ的なものが存在しないから、他の検索システムも含めてまるっとした話しかしないわけで…。というわけで、テスト用のファイル置き場をここに作ってみました。こんなファイルがあるよ、っていう場合はプルリクエストをしてくださいー。

Fess 9.2のリリース

リリースしました。Solr 4.9ではなく、Solr 4.8.1を利用しています。一応、3ヶ月に一度くらいはリリースしたいと思っているので、今回は予定通りかと思います。今回のリリースは特に大きな変更という感じはなく、細かいところの修正が多かった気がします。まぁ、それだけ安定してきているのかな。今後は、サジェスト周りとかを改善していきたいところではあります。あとは、SolrのRerankとかもつかってみたいかな・・・。そんな感じで、引き続きよろしくお願いしますー。

Elasticsearch Cluster Runner

Elasticsearch関連の開発をしていると、クラスタ環境とかでのテストとかを使いたくなるケースがあると思う。Elasticsearchはクラスタ環境を簡単に作れるけど、わざわざ複数のインスタンスを立ち上げてとかは面倒だな、と思っていたので、ElasticsearchのInternalNodeを使って、Ⅰつのインスタンスで複数のElasticsearchのノードを起動できるElasticsearch Cluster Runnerを作ってみました。
JavaとMavenがインストールされた環境であれば、

git clone https://github.com/codelibs/elasticsearch-cluster-runner.git

として、プロジェクトをcloneして、あとは

mvn exec:java

とすれば、3ノードのElasticsearchクラスタが起動します。
-basePathオプションでElasticsearchのルートディレクトリを指定することはできるけど、デフォルトではes_homeディレクトリが作成されてそこを利用されます。logsとかはノードごとにそこ以下にディレクトリが作成されます。
-numOfNodeを変更すればノード数も変更することができます。
あとは使いながら、改善していこうかと…。