Extractorのリファクタリング

Extractorをリファクタリングしてしまった。ほぼ、APIはフリーズで良いかと思っていたのだけど、Tikaを導入することで S2Robot がサポートするファイル形式がかなり増えることになるので実施した。docxなどの新MSOffice系からオーディオや画像まで対応できることになる。まぁ、オーディオや画像はメタデータになるのだけどね。という感じで S2Robot が扱えるファイル形式は ここ にあるやつ(現時点では 0.4)。来週中には残り2つのタスクを処理してリリースしよう。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です