コマンドでBOMを操作する

困ったことに 世の中にはBOM付きのUTF-8のHTMLファイルなどあったりする。わざわざBOM付きにする必要もない気がするけど、Fessとかではそれらも対応しないといけないのだけど、それを作るためにBOMのコマンドによる操作方法を確認してみた。
BOMの追加

$ uconv -f utf-8 -t utf-8 --add-signature test.html > test_bom.html

BOMの削除

$ uconv -f utf-8 -t utf-8 --remove-signature test_bom.html > test.html

Fessのいいねっぽい機能

Fess 3くらいの頃にもう新規に機能追加するネタもないだろうと思っていたけど、相変わらずに、ガンガン機能を追加してFess 6まで来ています。そんでもって、またまた今までのように機能を追加して、Fess 7を目指しています。Fess 7ではメジャーバージョンアップに相応しい感じの機能追加がされることでしょう。たとえば、今までは bigramベースの検索でしたが、次はSolrの機能も使ったりして、言語自動判別して、bigramと形態素解析のハイブリットで検索がデフォルトになります。あとは、いいねっぽい機能を追加して(Fess的には投票機能になります)、良い検索結果を送信してもらって、そのドキュメントの検索スコアが上にくるような機能も付け加えてあります(デフォルトではHttpSessionベースになりますが、汎用的に作ってあるので実装すれば他のシステムとかとも連携できるはず)。あとは、何をしたかいまいち思い出せないくらい細かい機能修正をしてます(チケット見ないと思い出せない)。そんな感じで、いつになったら、機能を追加しなくて良くなるのかわかりませんが、引き続きよろしくお願いしますー。