悪のニュース記事悪のニュース記事では、消費者問題、宗教問題、ネット事件に関する記事を収集しています。関連するニュースを見つけた方は、登録してください。 また、記事に対するコメントや追加情報を投稿することが出来ます。 |
2003年06月19日(木) 00時30分
Google の誤認(japan.internet.com)「クローラーにページが認識されない!」という声を耳にすることがある。よくよくサイトを拝見すると、拡張子が微妙に違うファイルが複数存在している。クローラーがデフォルトで認識するファイルは「index.html」「index.htm」のいずれかである。例えば、Google の検索 BOX に次の検索式を入力してみて欲しい。 「link:http://www.seo-ch.jp/」 「link:http://www.seo-ch.jp/index.htm」 「link:http://www.seo-ch.jp/index.html」 検索結果は皆同じである。 しかし、弊社サイトの TOP ページは「default.asp」である。「link:http://www.seo-ch.jp/default.asp」で検索しても何も見つからない。クローラーは ROOT のデフォルトファイルを「index.html」「index.htm」として認識するのである。 上記のことから言えることは、現状で「index.html」「index.htm」の2ファイルを別ファイルとして存在させていても、クローラーが認識するファイルは「index.html」のみなのである。もし、サイト内で「default.asp」などを TOP ページとして設置している場合は、クローラーの誤認を防ぐ為、TOP ページへリンクを「/」(スラッシュ)で終わらせておくと良いだろう。サイト外からリンクを取得する際も「/」で取得しておけば、サイト TOP ページへのリンクが確実となるのだ。 上記のファイル認識以外にも、サーバーのマルチドメイン設定などは、クローラーは認識できないのである。マルチドメインを使用して、2サイト立ち上げたつもりでも、クローラーは1サイトの認識しか出来ないのである。URL の変更などを考えた場合、新 URL を認識させる為には、マルチドメインは避けた方が良いだろう。 (執筆:棚橋繁行、監修:信太明) 記事提供: アウンコンサルティング株式会社 最新ITニュースメールの購読申込はこちら http://japan.internet.com/mail/newsletters.html (japan.internet.com) http://headlines.yahoo.co.jp/hl?a=20030619-00000001-inet-sci |