第二回Solr勉強会

3/11(木)に第二回Solr勉強会が開催されます。そこで Fess について話す予定です。

http://atnd.org/events/3142

何を話すか、細かいことは決めてないのだけど、Fess のデモベースに何かできればな~と思っています。タイトルも何かキャッチーなものにしたかったのだけど、考える時間がなかった。という感じなのですが、興味がありましたらどうぞ、お越しください。

Tomcat 6.0.24のclearReferences系のエラーログ

Tomcat 6.0.24では(22あたりから?)、clearReferenceまわりの処理が強化したのか、以下のようなエラーログがでるようになってしまった。これはどうすれば良いのかね。Tomcatのコードをよく読まんとわからん…。

2010/02/09 6:26:01 org.apache.catalina.loader.WebappClassLoader clearReferencesJdbc
致命的: A web application registered the JBDC driver [org.h2.Driver] but failed to
unregister it when the web application was stopped. To prevent a memory leak, the
JDBC Driver has been forcibly unregistered.
2010/02/09 6:26:01 org.apache.catalina.loader.WebappClassLoader clearReferencesJdbc
致命的: A web application registered the JBDC driver [org.h2.Driver] but failed to
unregister it when the web application was stopped. To prevent a memory leak, the
JDBC Driver has been forcibly unregistered.
2010/02/09 6:26:01 org.apache.catalina.loader.WebappClassLoader clearReferencesThreads
致命的: A web application appears to have started a thread named [Seasar2-TimeoutManager]
but has failed to stop it. This is very likely to create a memory leak.
2010/02/09 6:26:01 org.apache.catalina.loader.WebappClassLoader clearReferencesThreads
致命的: A web application appears to have started a thread named [H2 Log Writer FESS]
but has failed to stop it. This is very likely to create a memory leak.
...

差分クロール

Fess 3.0 のやりたいことリストで書き忘れてたけど、差分クロールを実装してみた。今までは Last Modifed を気にせず、GET しにいっていたけど、前回クロールで取得していたら、HEAD で Last Modified を取得・比較して、更新されていたら GET しにいって、インデックスを更新する。差分クロールをするかどうかは管理画面から変更可能な感じ。差分クロールすると外部へのコンテンツ取得の負荷は下がるけど、前回データが Solr の中にあるので(つまりSolrに聞きにいくことになる)、Solrへの負荷が上がる感じ。というわけで、それを踏まえて利用するかどうかを決めるのが良いかと。

次は、外部から接続可能なAPIを作ることかな…。