Google は読めるものを読む

以前、Google が XML ファイルの読み込みにも対応していたというようなことを書いたのですが、実際にはあれ、読める部分だけ読んでいるみたいですね。プレーンなテキストだけ読んでいる、というか。

拡張子を xml にし、text/xml として XHTML のページを作ったことがあるのですが、多分 XHTML として解釈されていませんね。どう見ても XML 形式のテキストファイルだと思われています。まあ、実際そうなんですけど。

head 要素内の要素が普通のテキストとして読まれているんですよ。title 要素が title 要素になっていないから、Google の検索結果でページ名が出てこなかったりします。だってテキストだもんという感じで。

というわけで、そのうち 4mat.jp ブログのページを XHTML から違う形式に変えてみようかな、と思っていたりします。XHTML 以外にもいろいろな HTML がありますし。例えば i モード対応の CHTML とか、厳しい規格で知られている ISO-HTML とか、感情表現を目的とした yhtml とか。

まあ、何かと実験台にされるページですね。CSS も書き換えないといけないので、別のページを新たに作りましょうかね。