Fessのインデックス生成が遅い的なコメントをもらうケースがあるので、コメントしておきます。Fessでのインデックス生成プロセスはクロールと (Solrでの) インデックス生成がパラレルに実行されています。まぁ、実際に多くの時間を使っているのがクロールの部分になります。クロールの時間の方はクロールの多重度とクロールの間隔に依存します。ですので、インデックス生成を実行しているマシンに合わせて、多重度を上げて、間隔を短くすればクロールの時間を短くすることができます。一方、Solrでの インデックス生成はSolr的にコミットまたはオプティマイズを実行するだけなので、クロールの時間と比べると微々たるものです。というわけで、クロールの多重度と間隔を調整すれば多くの場合で問題にならない気がします。まぁ、その辺の実装は工夫されていると思います(Solrを熟知している人が作れば話は別ですが、そうでない人がSolrでゼロから作ったりしたものよりはパフォーマンスは良いはずかと…)。そんな感じで、遅いようなら多重度と間隔を調整してね、という感じで、それ以上の調整が必要なら商用サポートをよろしくお願いします、という感じになるかと思います。
カテゴリー: Fess
Solr 3.6のschema.xmlにあるtext_*フィールドたち
Solr 3.6で各言語用にtext_*的なフィールド型が追加されているけど、ざっくりどんな言語が使えるかまとめておく。
Arabic | ar |
Bulgarian | bg |
Catalan | ca |
Czech | cz |
Danish | da |
German | de |
Greek | el |
Spanish | es |
Basque | eu |
Persian | fa |
Finnish | fi |
French | fr |
Irish | ga |
Galician | gl |
Hindi | hi |
Hungarian | hu |
Armenian | hy |
Indonesian | id |
Italian | it |
Japanese | ja |
Latvian | lv |
Dutch | nl |
Norwegian | no |
Portuguese | pt |
Romanian | ro |
Russian | ru |
Swedish | sv |
Thai | th |
Turkish | tr |
CJK | zh, ja, ko |
まぁ、言語検出のところもそうなんだけど、zh問題は大丈夫なのかなっていうのは気になる(つまり、zhは扱いが微妙だから、zh_CNとzh_TWを厳密に分けて考えたほうが良い。まぁ、技術的な理由じゃなくて、政治的な感じだけど・・・)。
Fessでもtext_*のフィールド型は使えるようにする予定。それらに対応するダイナミックフィールドも追加します。そんでそれらをハンドリングできるように実装します(この辺もうまく扱えるのがFessのメリットになっていくのかも)。
Fessの予定
次はFess 7の予定ですが、以下のことを考えています。
- Java 7
- Servlet 3.0&JSP 2.2
- 管理API
- お気に入り機能
Java6も今年でEOLになるので、FessのオープンソースとしてサポートするバージョンもJava 7にします。管理APIの都合でServlet 3.0以上にしようと思います。つまり、Tomcat 7以上が必要になります。まぁ、既にTomcat 7ベースで動いているので、その辺は問題ない気がするけど。そんな感じで考えて入るものの、結構作業量がある気がしてます。5月中にはベータを作るかもしれませんが、夏前くらいまでにはFess 7をリリースしておきたいところです。