Solr 3.6で各言語用にtext_*的なフィールド型が追加されているけど、ざっくりどんな言語が使えるかまとめておく。
| Arabic | ar |
| Bulgarian | bg |
| Catalan | ca |
| Czech | cz |
| Danish | da |
| German | de |
| Greek | el |
| Spanish | es |
| Basque | eu |
| Persian | fa |
| Finnish | fi |
| French | fr |
| Irish | ga |
| Galician | gl |
| Hindi | hi |
| Hungarian | hu |
| Armenian | hy |
| Indonesian | id |
| Italian | it |
| Japanese | ja |
| Latvian | lv |
| Dutch | nl |
| Norwegian | no |
| Portuguese | pt |
| Romanian | ro |
| Russian | ru |
| Swedish | sv |
| Thai | th |
| Turkish | tr |
| CJK | zh, ja, ko |
まぁ、言語検出のところもそうなんだけど、zh問題は大丈夫なのかなっていうのは気になる(つまり、zhは扱いが微妙だから、zh_CNとzh_TWを厳密に分けて考えたほうが良い。まぁ、技術的な理由じゃなくて、政治的な感じだけど・・・)。
Fessでもtext_*のフィールド型は使えるようにする予定。それらに対応するダイナミックフィールドも追加します。そんでそれらをハンドリングできるように実装します(この辺もうまく扱えるのがFessのメリットになっていくのかも)。