Solr 3.6で各言語用にtext_*的なフィールド型が追加されているけど、ざっくりどんな言語が使えるかまとめておく。
Arabic | ar |
Bulgarian | bg |
Catalan | ca |
Czech | cz |
Danish | da |
German | de |
Greek | el |
Spanish | es |
Basque | eu |
Persian | fa |
Finnish | fi |
French | fr |
Irish | ga |
Galician | gl |
Hindi | hi |
Hungarian | hu |
Armenian | hy |
Indonesian | id |
Italian | it |
Japanese | ja |
Latvian | lv |
Dutch | nl |
Norwegian | no |
Portuguese | pt |
Romanian | ro |
Russian | ru |
Swedish | sv |
Thai | th |
Turkish | tr |
CJK | zh, ja, ko |
まぁ、言語検出のところもそうなんだけど、zh問題は大丈夫なのかなっていうのは気になる(つまり、zhは扱いが微妙だから、zh_CNとzh_TWを厳密に分けて考えたほうが良い。まぁ、技術的な理由じゃなくて、政治的な感じだけど・・・)。
Fessでもtext_*のフィールド型は使えるようにする予定。それらに対応するダイナミックフィールドも追加します。そんでそれらをハンドリングできるように実装します(この辺もうまく扱えるのがFessのメリットになっていくのかも)。