読売新聞のオンライン版である YOMIURI ONLINE (以下、読売) が想像に反してきっちりと作りこまれていたことに驚きました。何年か前に見た時はもっとゆるい HTML で書かれていて、ブラウザの表示モードも後方互換モード
だったような気が……気のせいですね、きっと。
一方、朝日新聞の asahi.com (以下、朝日) は RSS の配信も行なっていて、情報の持ち出しについて開放的な姿勢から読者も多いんじゃないかと思います。そのインターネットに対する積極的な姿勢から、しっかりした HTML で書いていると思っていただけかもしれません。
実際に書かれている HTML の文書型を見てみると、朝日が HTML 4.01 Transitional なのに対し、読売は XHTML 1.0 Transitional で先進的。文字コードでは朝日が EUC-JP、読売が Shift_JIS でした。朝日は UNIX 系の OS で、読売は Windows 系の OS で更新しているんでしょうかね?
どちらもニュースサイトなので、ほとんどの環境で表示できることが必須条件。よって Strict は厳しいとしても、無駄な要素を省こうとする努力が見受けられます。その証拠に、どちらのサイトからも font 要素や hr 要素などは見つかりません。文法的には Strict に極めて近い Transitional ってところでしょうか。
あと、こだわりなのかどうなのか知りませんが、読売のサイトのソースを見ると、XML 宣言、文書型定義宣言 (DTD 宣言) と続き、html 要素が始まってから head 要素が始まるまでに長い空白があるのですが、これは一体どういう意味なんでしょうかね。まさか、簡単にソースを盗み見られないようにするため
という、中学生みたいな考えでは? いやいや、そうでないことを信じていますけどね。
とりあえず、読売は RSS の配信こそしていないけれど、HTML はまともに書かれているようです。