対応クエリーの強化

Fessで検索語のシンタックスはSolrとほぼ同じなのだけど、Solrに投げる前にFess自体が解析して検索クエリーをSolr用に組立て直している。というわけで、Solrのシンタックスとは微妙に違う部分もあったのだけど、その中でも括弧が利用できなかったのは大きい違いかも。たとえば、aaa (bbb OR ccc)みたいなものとか。そんなわけで、Fessでの処理できるクエリーを見直して括弧対応をしてみた。まぁ、これはこれで大変だったのだけど、次のFessではより複雑な検索語を組むことができるでしょう。括弧とかはもちろんそうなのだけど、()[]{}\*+の文字を検索するには\でエスケープが必要。それ以外のSolrでエスケープ対象文字はFessで勝手にエスケープします。

次のFess

次は6.1あたりにして、あまり変更がなくても良いかな、とか思っていたのだけど、諸事情により、そうはならず、7になります。たぶん、6月頃にリリースする感じかも。まぁ、その頃にはSolrも新しいのが出てそうな気もするし。うーん、Fessもやることが尽きないな…。

FessでLibreOfficeを使う

標準のFessはオフィス系ドキュメントのクロールはApache POIを用いているのだけど、こいつも完璧でない場合があるのでLibreOffice/OpenOfficeに任せたい場合もあったりする。というわけで、前にS2RobotにJodConverter経由でLibreOfficeを使える機能を実装したものの、Fessでどう使うのかまとめていなかったのでまとめてみました。設定方法をすっかり忘れていたので、いろいろと確認し直しちゃいました…。まぁ、そんな感じですが動くと思います。
http://fess.sourceforge.jp/ja/6.0/config/use-libreoffice.html