Fess 14.0.1のリリース

Fess 14.0.1をリリースしました。メンテナンスリリースです。主な修正内容は以下の感じです。

#2636はJSPの一時ファイルの出力が/var/tmpになっていたのを/var/lib/fessに変更しました。1ヶ月全くアクセスされないような状況からアクセスされると、JSPの一時ファイルが消されてしまう場合があるので、意図しない削除が発生しないように出力先を変更しました。

 #2635はメンテナンスページでボタンのラベルが.crawlerインデックスとなっていたので、ラベルの文言を正しくしました。

#2633はテキストファイルをクロールすると、Tikaが返す不要な文字列までインデックスされてしまっていたので、不要な文字列がインデックスされないようにしました。

#2632はメンテナンスページでログのダウンロードをしたときに、古いエイリアスを参照していたので、修正しました。

#2630はリクエストヘッダーの情報も検索ログに含められるようにしました。

#2629は$がハイライト文字としてあるとエラーになるので、修正しました。

今回は細々とした修正を入れた感じではありますが、何かあれば、フォーラムをご利用ください。

fess-ingest-vectorizer

fess-text-vectorizerを起動しておいて、Fessにfess-ingest-vectorizerをインストールしておけば、OpenSearchの利用時にはcontent_vectorフィールドをknn_vector型で作って、embeddingを入れてくれるようになりました。

これでインデックスするときにベクトルを入れることができるようになったので、次に検索のクエリーでこのベクトルに当てられるようにする必要がある感じです。fess-webapp-vectorizerみたいのを作る必要がありそうですね。

Fess用のEmbedding環境の準備

そろそろFessでも、セマンティックな検索ができるか?というところに挑戦していくために準備を始める。まずは、テキストを渡したら、ベクトルを返してくれるようなサーバーを用意しないことには始まらないなと思い、実験していくたたき台として、fess-text-vectorizerを作ってみた。Fessは多言語対応しているので、一応、言語を渡して、contentにテキストを渡せば、ベクトルを返してくれる的な感じ。Transformerを使って、ざっくり作ってみただけなので、試しながら変わっていく感じになるとは思っている。

次は、fess-ingestでfess-text-vectorizerを呼び出すようなプラグインを書く感じかなと。その次にはFessのQueryHelperをいじって、検索クエリーを調整できるようにするはず。

という感じで、とりあえず、一歩前進した感じではある。