Tikaで日本語RTFが化ける

TIKA-422にパッチを貼り付けました。FessのMLであるこの話題を解決するために取り組んだのだけど、参考になりそうなコードもそこにあり、それをそのまま使えそうだから楽かもとか思い、作業を始めたのだけど、残念なことにそのまま使える感じではなかった…。そんなわけでゼロからRTF 1.9.1の仕様をちら見しつつ、RTFEditorKitが処理する前にunicodeに変換するようなパッチを作った。っていうか、JavaのAPIのくせにRTFEditorKitが残念な感じの実装だからより一層に手間を増やしてくれた。あまりの面倒くささで挫折しそうになったけど、ひとまずよしとしよう。Tikaが取り組んでくれたらS2RobotとFessに反映させようっと。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です