storage:// を追加

Fess 13.5からはMinIO連携が入る予定ですが、MinIOへのアクセスをstorage://という新たなプロトコルで追加します。なので、ファイルクロールの設定でstorage://バケット名/ とすることでクロールすることができます。

まず、MinIOを以下のような感じで起動しておきます。

docker run -p 9000:9000 \
   -e "MINIO_ACCESS_KEY=AKIAIOSFODNN7EXAMPLE" \
   -e "MINIO_SECRET_KEY=wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY" \
   minio/minio server /data

Fessのクロール設定的には、たとえば、fessというバケット名であれば

パス:storage://fess/
設定パラメータ:
client.endpoint=http://localhost:9000
client.accessKey=AKIAIOSFODNN7EXAMPLE
client.secretKey=wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY

という感じになります。あとは、普通にfessバケット配下をインデックスしてくれます。

MinIOはバックエンドで動いている想定なので、検索結果のリンクをクリックすると、Fessのコンテンツプロキシ機能によって、MinIOに直接ではなく、Fess経由で取得することができます。これにより、Fessへのアクセス権限を用いて管理することもできます。

MinIO自体はゲートウェイ機能もあるので、AWS S3を対象にできたり、GCPやAzureなども同様にクロールすることができるようになります。

FessのEOL日付の変更

現在は、バージョンx.y.zのときはバージョンx.y.0をリリースした日付から18ヶ月後にしていたのですが、FessはElasticsearchがリリースされてからちょっと時間が経ってからリリースしていることもあり、Fessより先にElasticsearchがEOLされてしまっている状態になってます。これはこれで微妙だなと前から思っていたのですが、微妙なのでシンプルに、対応するElasticsearchのバージョンのEOLに合わせようと思います。EOL期限以上のサポートが必要な場合は商用サポートを参照してください。

Fess 13.5系を始める

Fess 13.4系にもちょこちょこ機能追加していってしまった気がするが、あまりやりすぎると商用での導入で問題が置きても困るので、そろそろ大きめな機能追加も入れたいところなので、13.5系を始めることにした。

13.4系はcodesearchを意識した変更が多く入った気がするけど、13.5系は分析基盤として使えるような機能追加をしたいと考えているところ。細々とした修正は、13.4系にも必要に応じてバックポートしていくけど、大きめのやつはストレージとの連携が必要かなと考えている。画面とかいろいろと作るのは面倒なので、とりあえず、S3互換だし、minioを上手く使えないかなと考え始めている。ちょっとうまくいくかは不明だけど、これから検討しようかと。minioを使っておけば、導入時に場合によっては普通にS3とかもできるだろうし。

まぁ、その後はPython連携とかを考えないといけないと思っているけど、まずは、一歩ずつ…。