同義語処理の変更

Fessはstandard_analyzerで同義語を展開して検索できるようにしていますが、次のリリースで処理をちょっと見直そうしています。

現在は、A, Bを同義語として登録した場合、インデックスにはAとBが登録されます。これをAだけにする予定です。つまり、同義語展開してインデックスをしないようにします。これにより、インデックスサイズを減らす想定です。(まぁ、微々たるものなので、ほとんど減らないと思いますが…)

あとは、現状だと、同義語に内包されている単語がヒットできないのですが、同義語処理前の元の単語に内包される単語にヒットできるようにする予定です。なので、長い単語を登録したときとかにヒットしない問題を解決します。

そんなわけで、fessインデックスの設定が変わるのと、elasticsearch-analysis-extensionプラグインの更新で対応する予定です。

チームをSlackへ招待するを消す

一人Slack的な状態だと、「チームをSlackへ招待する」が3分の1くらいのスペースを取って邪魔だったので、何とかできないかと思っていたけど、GMailとかのアドレスを使って登録しているなら、yourname+slack@yourdomain.comみたいな感じで、自分を招待すれば良いとのこと。まぁ、ダイレクトメッセージに自分がもう一人表示されちゃうけど、3分の1のスペースが開放されるからよいか。

Fione 13.6.0 betaのリリース

docker-composeとして提供しているので、zipとかのリリース物はないのですが、v13.6.0というタグを打ちました。というわけで、Fioneを13.6.0 betaとしてリリースすることができました。タグにはベータとは書きませんが、まだまだ使いながら進化していくと思われるので、しばらくはbetaを名乗っておこうとは考えています。

現状では、クイックスタートにもあるように、AutoMLでポチポチやっていけば学習モデルができます。それをDockerにしてAPIにするのでも良いし、テストファイルをアップロードしてKaggleにサブミットできるファイルを生成するのでも良いし、画面でポチポチとやればいろいろとできると思います。

ひとまず、リリースしましたが、今後やっていきたいこととしては、

  • 過去のKaggleコンペのデータを適用する流れをQiitaに書いてみる
  • セッションのクリアなどの処理が怪しいので、そこら辺を整備
  • アップロードしたデータの可視化
  • 学習結果の保存
  • テキストデータを処理できるようにする

あたりの課題を認識しています。他にもいろいろとある気もしますが、いろいろと使ってもらって、フィードバックとかをもらいながら改善できると良いかなと考えています。何かあれば、フォーラムに投げていただければと。

あとは、基本的にはFione自体はオープンソースなので、自由に使ってもらえればよいかと思いますが、Fessのように商用サポートも提供しているので、Fioneを使ったりして、AIや機械学習の仕事があれば、株式会社コードリブズにお知らせいただければと思います!