Solr 3.6のschema.xmlにあるtext_*フィールドたち

Solr 3.6で各言語用にtext_*的なフィールド型が追加されているけど、ざっくりどんな言語が使えるかまとめておく。

Arabic ar
Bulgarian bg
Catalan ca
Czech cz
Danish da
German de
Greek el
Spanish es
Basque eu
Persian fa
Finnish fi
French fr
Irish ga
Galician gl
Hindi hi
Hungarian hu
Armenian hy
Indonesian id
Italian it
Japanese ja
Latvian lv
Dutch nl
Norwegian no
Portuguese pt
Romanian ro
Russian ru
Swedish sv
Thai th
Turkish tr
CJK zh, ja, ko

まぁ、言語検出のところもそうなんだけど、zh問題は大丈夫なのかなっていうのは気になる(つまり、zhは扱いが微妙だから、zh_CNとzh_TWを厳密に分けて考えたほうが良い。まぁ、技術的な理由じゃなくて、政治的な感じだけど・・・)。
Fessでもtext_*のフィールド型は使えるようにする予定。それらに対応するダイナミックフィールドも追加します。そんでそれらをハンドリングできるように実装します(この辺もうまく扱えるのがFessのメリットになっていくのかも)。

第2回Solr勉強会

話してきました。やっぱり 30 分だと時間が足りない感があるな…(もっとポイントをまとめた方がよかったんだろうけど…)。まぁ、Fessをざっくりと知ってもらう意味ではよしとしておくか。別なところで not 検索はできないのと言われたことがあったけど、今回はor検索やファセット検索ができないのという意見をいただきました。範囲検索、ファジーやクエリーブーストとかは投げられるのだけど、notやorは今のところ対応していない。これはこれで次のバージョンでどうするか考えよう(QueryHelperImplあたりをいじればよいだけだと思うけど)。あとはロールを聞かれたけど、聞かれた人に説明できてない…(ごめんなさい、来月初めあたりまでにはドキュメントを書きます…)。それ以外には、ビジネス的な話もよくいただくのですが、FessはN2 Searchとしてコンサルやサポートなどを含めて扱っています。来週後半に無料セミナをしますので、ビジネス的なお話がありましたら、そちらもよろしくお願いします。

http://www.n2sm.net/products/n2search-seminar.html