同義語処理の変更

Fessはstandard_analyzerで同義語を展開して検索できるようにしていますが、次のリリースで処理をちょっと見直そうしています。

現在は、A, Bを同義語として登録した場合、インデックスにはAとBが登録されます。これをAだけにする予定です。つまり、同義語展開してインデックスをしないようにします。これにより、インデックスサイズを減らす想定です。(まぁ、微々たるものなので、ほとんど減らないと思いますが…)

あとは、現状だと、同義語に内包されている単語がヒットできないのですが、同義語処理前の元の単語に内包される単語にヒットできるようにする予定です。なので、長い単語を登録したときとかにヒットしない問題を解決します。

そんなわけで、fessインデックスの設定が変わるのと、elasticsearch-analysis-extensionプラグインの更新で対応する予定です。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です