2003年11月26日(水) 19時41分
訪れたユーザーの足跡を解析する(2)(japan.internet.com)
前回 はブラウザ(ユーザーエージェント)から送信される HTTP のリクエストの情報について説明しましたがいかがでしたでしょうか? 今回はブラウザ(ユーザーエージェント)から送信されたリクエストは Web サーバーでどのように保存されるかを見ていきましょう。
■Web サーバーのログ
Web サーバーソフトウェアの種類は数多くありますが、ここでは世界的に最も多く利用されているオープンソース ソフトウェアの Web サーバーである Apache *1 を例にとって見ていきましょう。
Apache ではさまざまなログ形式がサポートされます。デフォルトでは共通ログ形式(Common Log Format)でデータは書き込まれますが、LogFormat 指示子により形式をカスタマイズすることも可能です。
デフォルトの LogFormat 指示子
カスタムログ形式として利用される LogFormat 指示子
これらの指示子を組み合わせ、ダブルクオーテーションで囲んで指定すれば、望みどおりの書式でログを記録できます。ありがたいことに、必要そうな書式はあらかじめ Apache の開発者側で httpd.conf 設定ファイルにあらかじめ用意されています。
■共通ログ形式
共通ログ形式(common)では7つのトークン(データフィールド)が空白により区切られ、以下の形式で情報を表示します。
・表示順
ホスト名 識別情報 認証ユーザー 日時 リクエスト ステータス バイト数
・指定方法
LogFormat "%h %l %u %t "%r" %s %b"
・ログ出力の例
192.168.100.xxx - - [01/Nov/2003:18:26:23 +0900] "GET http://www.melpod.com/index.html HTTP/1.0" 200 18167
■combined 形式
サイトを訪れたユーザーの詳細な足跡を追うためには、カスタムログ形式を設定して参照元ページである Referer と User Agent を取得する combined 形式を指定する場合が多いようです。
・表示順
ホスト名 識別情報 認証ユーザー 日時 リクエスト ステータス バイト数 リファラー ユーザーエージェント
・指定方法
LogFormat "%h %l %u %t "%r" %>s %b "%{Referer}i" "%{User-Agent}i"" combined
・ログ出力の例
210.197.104.30 - - [24/Nov/2003:22:27:06 +0900] "GET /index.html HTTP/1.0" 200 17319 "http://www.netage.co.jp/" "Mozilla/4.0 (compatible; MSIE 6.0; Windows 98; Win 9x 4.90; T312461)"
combined 形式のログ出力の例をみてわかるように、ブラウザ(ユーザーエージェント)からの1リクエストに対して1行のログが出力されます。それではこの combined 形式のログを例にとってユーザーの足跡を実際に辿ってみましょう。
「このユーザーは日本時間の2003年11月24日22時27分に 210.197.104.30 から Windows 98 の Microsoft Internet Explorer で index.html へアクセスしてきており。参照元は www.netage.co.jp です。」
このようにユーザーの残した足跡の詳細は Web サーバーのログファイルとして克明に残されます。あとはこの残したログをどのように解析するかによって、サイトアクセスの状態を知る上であなたの必要な情報を引き出すことができます。
例えば、あなたのサイトのどのページが一番アクセスされているか、あなたのサイトへはどのサイトからのアクセスが一番多いかなど、様々なサイト統計データが得られます。
ログを解析するためのログ解析ツールには様々なソフトウェアが存在します。さて、次回はこのログデータを利用した、サイトのログ解析について説明したいと思います。
*1 Apache Jakarta Project
http://jakarta.apache.org/
(執筆:後藤 康成)
記事提供:
株式会社ネットエイジメルポッド開発チーム
デイリーリサーチバックナンバー、コラム、セミナー情報等はこちらから
http://japan.internet.com/
デイリーでお届けする最新ITニュースメールの御購読申込はこちらから
http://japan.internet.com/mail/newsletters.html (japan.internet.com)
http://headlines.yahoo.co.jp/hl?a=20031126-00000029-inet-sci