URLEncoder/URLDecoderが悩ましい変換をするので、仕様的な点でURLエンコードについて確認する。RFC 3986 の 2.1 Percent-Encoding のところに、まずあった。まぁ、% HEXDIG HEXDIG で構成するべしという感じ。そんで、大文字でも小文字でも一緒だけど、大文字を使うべしと書いてある(そうなのか…)。そんで、2.3. Unreserved Characters に ALPHA (%41-%5A and %61-%7A), DIGIT (%30-%39), hyphen (%2D), period (%2E), underscore (%5F), tilde (%7E) ていうのは、正規化により %XY から文字に変換されるべしと言っている。Wikipedia の Percent-encodingには、結果として、URL が短くなるから好まれるみたい、というように書いてある。HTML 的には、application/x-www-form-urlencoded あたりだな。RFC 1738を参照しているけど、これは RFC 3986 でアップデートされているし。Firefox とかは、%41 は A とかとして URL で扱ってくれるようだ。URLEncoderは %41 ではく。URLDecoder はこの辺を柔軟にやらんから、マルチバイトで化けるわけで(過去との互換性を維持し続けるためなのかな…)。そんなわけで、間違いとは言わないけど、世の中についていっていないから、URLDecoder は使いにくい…。
ServletRequest.getServerName()
Apache とかで連携したときに getServerName() の値は大丈夫なのだろうか、と思ったら、「You can use the proxyName and proxyPort attributes on the <Connector> element to configure these values.」だそうな。
http://tomcat.apache.org/tomcat-6.0-doc/proxy-howto.html
http://tomcat.apache.org/tomcat-6.0-doc/proxy-howto.html
rownumの動き
Oracle の rownum の動きについて調べる。例えば、次のようなSQL文を実行すると、
select * from A where B order by C
rownum が振られるタイミングは以下みたいな感じ。
rownum = 1 for x in ( select * from A ) loop if ( x を条件 B でチェック) then 行を出力 rownum = rownum + 1 end if; end loop; C でソート
という感じで、
- FROM/WHERE 句を処理
- 行を吐き出しと ROWNUM 増やして割り当て
- SELECT を適用
- GROUP BY を適用
- HAVING を適用
- ORDER BY を適用
という感じの順に処理していく。そんなわけで、
select * from A where ROWNUM > 1
みたいなことやっても行は得られん(rownumが増えないから)。
という感じで、On ROWNUM and Limiting Resultsに書いてあった。一つ賢くなった