Fess 1.1.0 リリース

Fess 1.1.0 をリリースしました。1.1.0 では、Solr へのドキュメント追加の効率化、BASIC/DIGEST認証対応、設定情報のバックアップ・リストア機能、ログファイルのダウンロード機能が主な改良点です。設定情報をバックアップとリストアできるようになったので、今後、Fess をアップグレードして入れ替える際にはその設定情報をリストアしてもらえれば簡単に移行ができるかと思います(DBを直接いじる必要がなくなりました)。より便利になっていると思いますので、ぜひ、ご利用ください~。

最終確認中

上がっていたチケットを一通り処理した。現在、サイトに置いてあるスナップショットが特に問題なければ、それが 1.1.0 になる予定。今から数日間ランニングテストして、特にエラーがでなければリリースします~。かなり便利になっていると思うので、お楽しみに~。

PDFからのテキスト抽出

S2Robot の Extractor に PDF からのテキスト抽出をするコードがあるのだけど、内部的には Apache の PDFBox を利用していて、S2Robot のテストケースにあるテスト用の PDF からは普通に抽出できるのだが、そこいらの PDF から日本語を抽出すると文字化けする。Apache の JIRA には PDFBOX-420 ていうのがあがっていて、一度は修正されたみたいだけど、テストケースが通らんから revert されているみたい…。これないと、そもそも使いものにならんのだけど、PDFBox 以外の方法として何かないかと iText の PdfTextExtractor とか試してみたりしたけど、これはこれで日本語がとれない…。そんで、また、PDFBox に戻り、revert された PDFont クラスを元に戻すと動くので、それを使うことにするかな。