Fess 4.1.0リリース

4.0.0から半年以上経過してしまいましたが,ようやく4.1.0をリリースしました.新機能の追加というよりバグなどの対応が主になるかと思います.まぁ,バグと言ってもFess自体のはあまりなくて,Tikaとか,PDFBoxとか,HttpClientとか利用しているものたちに起因するものがほとんどかと思います.そういうこともあって,ここまで来るのに時間がかかった気もします.一応,新機能的なところとしては,Solrの持つファセットも利用できるようになりました.という感じで,4.x系はバグ対応的なリリースしか今後はせずに,基本は5.x系に注力していく予定です.っで,次のFess 5.0では,Tomcat 7とSolr 3.2の採用を考えています.これらがさくっとできれば,すぐに5.0がリリースされると思いますし,そうでなければちょっと時間がかかるかも.そんな感じですが,引き続きよろしくお願いしますー.

http://fess.sourceforge.jp/ja/

pdfbox 1.5 で扱えるpdfのエンコーディング

pdfのエンコーディングにもいくつかあるけど、ネットから拾い集めてテキストが抽出できるか試してみた。

  • Identity-H → OK
  • 90ms-RKSJ-H → OK
  • 90pv-RKSJ-H → OK
  • 83pv-RKSJ-H → NG

というわけで、pdfboxで83pv-RKSJ-Hのpdfからテキスト文字列を抽出すると文字化けする。はて、Fessではどうしようかな・・・。

ロードマップ

ちょこちょことドキュメントやバグ的なのはいじったりしていますが,4月あたりにはバージョン4.1を目指したいところです.今のところ,追加しようとしているのはファセット検索関連です.まだ,インターフェース的なところをどうするかを考え中ですが,たぶん,REST API 的なところでのサポートが対象かなっと思っています.という感じで,地道に進めていきます.