HttpEntityは必ずconsumeすべし

HttpClient 4 系でいろいろとクロールすると途中でコネクションプールのコネクションが枯渇して、フリーズ状態になる問題に遭遇した。いまいち、原因を特定するのに無駄に時間を使ってしまったのだけど、結果的にはHttpEntityは必ずconsume(つまりclose)する必要があることだ。このHttpEntityはHttpClientのexecuteをした時に返ってくるHttpResponseから取得して利用するものだけど、レスポンスのステータスだけ見たければ、HttpResponseから値を取得してHttpEntityを使う必要がない。なので、利用したコネクションが解放されず、フリーズに陥る。というわけで、HttpEntityはレスポンスのボディが必要なくても取得してconsumeして終わるのが良いらしい…。

HttpClient 4 へ移行してみた

HttpClient 4 のチュートリアルもざっくり眺め、S2Robotのコードを書き換えてみた。 S2Robot の CommonsHttpClient を捨てて置き換えかなっと始めは思っていたのだけど、別に CommonsHttpClient はまま残せるじゃん、みたいな感じでわかったのでそのまま残し、HcHttpClient なるものを追加しておいた。CommonsHttpClient のは dicon 上は有効にしていないので、今まで通りに使いたければ、s2robot_client.dicon を編集すれば良い(と思う)。まぁ、今後的には CommonsHttpClient の方はメンテしていくかはわからないけど。そんな感じで、HttpClient 3 を卒業して、HttpClient 4 使いになることができました。これで新しい機能の恩恵を受けることができるようになった…。