WebMarketingLaboでは論理的なウェブマーケティングについて研究していきます

ウェブ解析を始めるにあたってWeb Analysis

【STEP1】解析ツールの選定(ログ収集方法別のメリット・デメリット)

  • ウェブ解析を行うにあたって、当然ながら最初に解析ツールを選定しなければなりません。解析ツールは世の中にたくさん存在しますが、ログの収集方法によっては、計測したいデータが取得できないケースもあります。

    GoogleAnalyticsのような無料ツールであればいざ知らず、基本的に解析ツールは高価なものが多いので、ログ収集方法別のメリット、デメリットを十分に理解したうえで、どのようなデータを取得したいのかを予め明確にしておきましょう。

    <サーバログ方式>
    ユーザーのブラウザに対して配信したファイル名をログファイルに保存する方式です。

    【メリット】
    「過去」に遡った分析が可能
    ・PDF、Flash、画像、音声ファイルなど、「どのようなファイル」でも計測可能
    「エラー」も記録可能
    「クローラー」の訪問頻度も記録可能

    【デメリット】
    ・アクセスが多かったり、複数のウェブサーバがある場合は、ログファイルの取り回しに「手間がかかる」
    ・ログフォーマットは固定的で「拡張することが難しい」
    ・ユーザー判別は、IPアドレスとユーザーエージェントとの組み合わせを利用するため、cookieを利用した場合に比べて「ユーザー判定精度が低い」
    ・検索サイトのロボット、クローラー等、「人間以外のアクセスログ」も残ってしまう
    ・ブラウザやプロキシサーバの「キャッシュ」を閲覧した場合には記録が残らない
    「Flash内の遷移」は計測不可


    <パケットキャプチャ方式>
    ウェブサーバと同じネットワーク上のスイッチなどから、ウェブサーバとユーザー間を流れるデータ(パケット)をキャプチャする方式です。

    【メリット】
    ・PDF、Flash、画像、音声ファイルなど、「どのようなファイル」でも計測可能
    ・ログファイルを管理する手間やウェブコンテンツに手を入れる「手間が必要ない」
    「リアルタイム」で集計が可能
    ・複数サーバのアクセス状況を「一元管理」できる
    HTMLのtitleタグ、ユーザーが購入した商品の金額など、配信する「コンテンツ内容を基にした分析」も可能

    【デメリット】
    ・ネットワークに「専用の機器」を設置する必要がある
    ※ネットワークを管理するハブにミラーポート(ネットワークを流れる全データを出力するポート)がないと設置が困難
    ・基本的に「高価」なツールしかない
    収集する情報を「あらかじめ設定」する必要がある
    「過去」に遡った分析は不可能
    ・検索サイトのロボット、クローラー等、「人間以外のアクセスログ」も残ってしまう
    「キャッシュ」へのアクセスは解析結果に含まれない
    「Flash内の遷移」は計測不可


    <ウェブビーコン方式>
    配信するウェブサイトのページにウェブビーコンと呼ぶ画像ファイルを挿入し、その画像ファイルへのページビュー数を調べる方式です。

    【メリット】
    ・ウェブコンテンツに計測コードを挿入するだけなので「導入の敷居が低い」
    ・ユーザーの判定にcookieを使用しており、IPアドレスベースの解析より「ユーザーの判定精度が高い」
    ・複数サーバのアクセス状況を「一元管理」できる
    サーバーやネットワークの「場所に依存しない」
    ・画面解像度やjavascriptなど、「ユーザー環境」に関する情報をベースとした解析ができる
    ウェブサーバに「アクセスが発生しないユーザーの行動」を記録可能
    HTMLのtitleタグ、ユーザーが購入した商品の金額など、配信する「コンテンツ内容を基にした分析」も可能

    【デメリット】
    「過去」に遡った分析は不可能
    ・ウェブコンテンツに計測コードを挿入する手間が発生する為、大量の「コンテンツが適切に管理されていない」場合は、実装が困難
    「Javascriptが実行できないブラウザ」からのアクセスを収集することができない
    ・PDF、Flash、画像、音声ファイル等「ウェブビーコンの挿入が難しいコンテンツ」へのアクセス状況は収集不可
    「フレームセットを使ったページ」では参照元情報を正しく収集できないケースがある


    ■ログ収集方法の比較一覧
       サーバログ
    方式
     パケット
    キャプチャ方式
     ウェブ
    ビーコン方式
     主なユニーク判定手法  IPアドレス IPアドレス  cookie 
     主な提供形態  ソフトウェア  ソフトウェア  ASP
     ユーザー環境(画面解像度等)
    に関する情報収集
     × ×  〇 
     配信するコンテンツの内容を収集  ×  〇  〇
     過去の履歴を分析  〇 ×  × 
     非HTML(PDF・画像・音声・RSS等)の計測  〇 〇  × 
     エラーの計測  〇 〇  × 
     無償・安価ツールの充実 ×  ×  〇 
     検索サイトのクローラー訪問の計測  〇 〇  × 
     ノン・ヒューマンアクセスの除外  × ×  〇 
     キャッシュされたコンテンツ閲覧の計測  × ×  〇 
     JavaScriptやFlash上の動きを計測  × ×  〇 


アクセスログ解析の教科書

中古価格
¥90から
(2012/10/28 10:27時点)

繁盛するWebの秘訣「ウェブ解析入門」 〜Web担当者が知っておくべきKPIの活用と実践

新品価格
¥1,869から
(2012/10/28 10:29時点)

【STEP2】主な解析ツールのご紹介

  • 主な解析ツールについて、上記でご説明させて頂いたログ収集方式別にまとめたものが以下になります。

    いろいろなアクセス解析ツールがありますが、無償で高機能、使い勝手も良いということで、やはり個人的にはGoogleAnalyticsの導入をお勧め致します。。。

    <サーバログ方式>
    ウェブサーバが記録するアクセスデータを利用する方法。過去データ、検索エンジンのクローラーや、リクエストされた全ファイルのアクセス情報が記録されるが、ブラウザのキャッシュで表示されたページなど、ウェブサーバにリクエストが届かない場合は、正確なページ閲覧行動が取得できない。

    ・Urchin(アーチン)
    ・SiteTracker※
    ・WebTrends※
    ※ウェブビーコン方式での利用も可能


    <パケットキャプチャ方式>
    ウェブサーバを出入りするパケットデータを利用する方法。サーバログ方式と同様に、ウェブサーバ側でのデータ取得を行う。こちらは過去の履歴データは取得できないが、postメソッドによるリクエスト情報の収集が可能。
    尚、ブラウザのキャッシュで表示されたページのログ情報も、サーバログ方式と同様に取得不可。

    ・RTmetrics※
    ※ウェブビーコン方式/サーバログ方式での利用も可能(?)


    <ウェブビーコン方式>
    JavaScriptなどの計測タグをページに記述することで、アクセスデータを収集します。手軽で安価なことがメリットだが、検索エンジンのクローラーなどのアクセスや、計測タグを記述出来ないファイル(PDF・画像・音声ファイル等)へのアクセスデータは取得されない。

    ・GoogleAnalytics
    ・SiteCatalyst
    ・Visionalist
    ・WebAntenna
    ・LOGエビス
    ・ADPLAN SP
    ・Sibulla(シビラ)

集客力を飛躍的に向上させるGoogleAnalyticsアクセス解析の極意

新品価格
¥1,890から
(2012/10/28 10:30時点)

【STEP3】アクセスログファイル(ローデータ)の理解

  • ログ解析では、ウェブサーバへのアクセス状況を記録したファイル(アクセスログ)を取り扱うことになります。

    アクセスログには訪問者の様々な情報が含まれていますが、その情報の意味を正確に知っておくことで、アクセスログ解析の効果的な活用、重要性などが深く理解できるようになります。

    例えば、ログのどの部分が、どの情報に当たるのかを示すと、以下のようになります。

    ・だれが?    ⇒IPアドレス/ユーザーエージェント
    ・いつ?     ⇒転送日時
    ・どこから?   ⇒リファラ(参照元URL)
    ・どのページを? ⇒リクエストされたファイル名
    ・どのブラウザで?⇒ユーザーエージェント
    ・表示状態は?  ⇒ステータスコード


    <ログフォーマット例>※Combined Log Format
    214.154.136134-1156281[05/Sep/2012:09:07:08:13+0900]"GET/product/index.htm HTTP/1.1"
    (IPアドレス)  (認証ID)     (転送日時)        (リクエストファイル名)(プロトコル)
        200 12455 "http://www.google.co.jp/search?sourceid=〇〇〇〇〇〇"
    (ステータスコード)(転送速度)   (参照元ページ名)
    "Mozilla/4.0(compatible;MSIE 6.0;Windows NT 5.1)""-"
    (ユーザーエージェント)


    ★IPアドレスとホスト名
    IPアドレスとは、ユーザーがインターネットに接続するときに与えられる識別子で、ホスト名はIPアドレスと比べて人間が識別しやすい名称のこと。


    ★ステータスコード
    主なステータスコードは以下のとおり
    ・200:リクエストは正常に受け付けた
    ・403:リクエストされたコンテンツへのアクセスは禁止されている(Forbidden)
    ・404:リクエストされたコンテンツは存在しない(Not Found)
    ・500:サーバー内でエラーが発生した(Internal Server Error)



    ★転送速度
    バイト単位で表示される。この情報はステータスコード200の場合のみ記録され、それ以外は0バイト。


    ★ユーザーエージェントの構造
    ユーザーエージェントは、ユーザーが使用しているブラウザによって規定されている情報であり、ブラウザの種類やバージョン、OSの種類やバージョンなどが含まれています。

    特に重要なのは、ユーザーエージェント末尾の「Version Token」「Platform Token」の2項目。
    ・Version Token・・・上記「MSIE6.0」の部分
    ・Platform Token・・上記「Windows NT 5.1」の部分

    ※ユーザーエージェントの確認方法
    ブラウザのアドレスバーに次のコマンドを入力します。
    javascript:alert(navigator.userAgent)

【STEP4】ウェブ解析におけるデータの見方

  • アクセスログの情報と合わせ、ウェブサイト上でのユーザーの行動も重要なデータです。ログ解析ツールによっていろいろなデータが取得できますが、各データの見方や、指標の示す意味をしっかり理解することが重要です。

    <ページビュー数>
    ページビュー数とは1つのユニークなURLで判別出来るページを、ユーザー(訪問者)にどれだけ見られたかをカウントした回数であり、ウェブサイトがどのくらい閲覧されているかの指標になります。

    ●興味関心指数

    そのページに興味関心が高いほど、ページビュー数は多くなる傾向にあります。つまり、ページビュー数の多さは、モチベーションの高さを表しているということになります。

    ●期間比較
    ページビュー数を見るときに、前日の数値や、前月の数値など、"点"の数値だけを見ても意味がありません。
    前年同期比、前月比等との"期間比較"を見ることで、どの期間に、どの程度、数値が増減したのかがわかります。
    大幅な増減が見られた場合は、更に深堀して増減要因を探ります。

    ●原因探索法
    例えば、あるサイトのページビュー数が減少したときには、サイトにアクセスするユーザーの参照元ごとのページビュー数、キーワードごとのページビュー数、検索エンジンごとのページビュー数について、期間比較を行うことで、何が原因でページビューが下落したかを分析します。


    <セッション数>
    セッション数とはウェブサイトに訪問・接続・ログインしたユーザーが、サイト内を閲覧し、離脱・切断・ログオフするまでの一連の行動をまとめたものをいいます。同義として「ビジット数」「訪問数」とも呼ばれています。

    測定方法として、IPアドレスやユーザーエージェントが同じものを同一セッションとする方法と、クッキーを使って同一クッキーを持つものを同一セッションとする方法があります。

    セッションが切れる条件は、ブラウザを閉じたり、インターネットの接続をやめたときなどです。計測対象のウェブサイトから去っただけではセッションは切れません。


    ●流入元・検索フレーズ分析

    セッション数はウェブサイトへの訪問回数であり、多ければ多いほど良い指標です。ページビュー数と同様、興味関心が高いほど、セッション数も多くなります。ECサイトにおけるセッション数は「見込み客」という考え方もできます。

    このセッション数を増やすには、現状 どのようなサイトからどれくらいの数のユーザーが来訪しているか、など流入元の分析が必要です。

    セッション数が少ない、伸びない場合などは、流入元や検索フレーズを分析したうえで、SEO対策やキーワード広告を展開することも非常に有効です。

    ※但し、セッション数が増えたからといって、平均滞在時間や平均ページビュー数が増えるとは限りません。

    ●分析時の注意点
    同一セッションで同じユーザーがAページ、Bページを見た場合、セッション数は1、ページビュー数は2になります。尚、セッションは一般的には30分で切れます。


    <ユニークユーザー数>
    ユニークユーザー数とは、ウェブサイト内の特定ページを訪問した人数を指します。同じ人が何度訪問しても1ユニークユーザーとしてカウントされます。

    同義として「ビジター数」「訪問者数」とも呼ばれています。

    ユーザーの識別には、主にクッキー(cookie)という機能を利用して判別しますが、ユーザー側で自由に有効・無効の設定が可能なため、正確なカウントは難しいとされています。

    ●ユニークユーザー数からわかること
    ユニークユーザー数を測定すれば、訪問した人の数を知ることが出来ます。どの程度ページを見たかはページビュー数であり、どの程度訪問する回数が増えたかはセッション数になります。

    ユニークユーザー数が増えたならば、今まで訪れたことのないユーザーがウェブサイトを見るようになったと考えることができます。

    ●分析時の注意点
    1.ユニークユーザー数は延べ人数ではありません。セッション数とは異なりますのでご注意ください。

    2.クッキーを使った計測方法では、同じ人が違うブラウザで同一サイトを閲覧した場合、ユニークユーザー数は閲覧したブラウザの数だけ増加します。その他の計測方法では数値が異なりますので注意して下さい。

    3.IPアドレスを使った計測方法で、1台のパソコンを複数名で扱うケースでは、正確なユニークユーザー数が計測できませんので注意して下さい。


    <平均閲覧PV(ページビュー)数>
    平均閲覧PV数とは、1人あたりの閲覧ページ数の平均値で、通常、1セッションあたりのPV数で算出します。

    この値はサイトへの関心の高さを表しますので、多ければ多いほど良い指標です。

    ●分析時の注意点
    上記のとおり多ければ多いほど良い指標ですが、必ずしもそうではないケースもあるのでご注意ください。
    ブログなどでは新着記事のみ閲覧してサイトを離脱するユーザーも多いので、サイトの目的を考慮したうえで、数値の大小を判断するようにして下さい。

    ☆平均閲覧PV数の計算方法
    例えば、あるECサイトでAさんが5ページを閲覧し、Bさんが9ページを閲覧した場合、平均閲覧PV数は7ページになります。
    (計算式)Aさん:5ページ + Bさん:9ページ =合計14ページ ÷2人 = 平均閲覧PV数 7ページ


    <直帰率>
    直帰率とは、サイトにアクセスして最初の1ページだけを見て、他ページに移動せずにサイトを離脱(ブラウザを閉じたり、他のサイトに移動)してしまう割合のことです。

    ●直帰率の高いページの問題点
    ユーザーがサイト訪問前に閲覧していたページと、最初に見た入口ページの関連性が低いことが考えられます。 
    もしくは、入口ページの内容がユーザーにとってわかりにくい可能性もあります。

    ☆直帰率の計算方法
    直帰率(%)=Aページのみ閲覧して離脱したセッション数÷最初にAページを訪れたセッション数の合計×100


    <離脱率>
    離脱率とは、ユーザーがサイト内でのコンバージョン(成果)に至らず、サイトから離脱(ブラウザを閉じたり、他のサイトに移動)してしまう割合のことです。

    ●離脱率と直帰率の違い
    離脱率はサイトを訪れたユーザーが、サイト内を回遊したうえでサイトを離脱した割合ですが、直帰率はサイト内の他のページに遷移することなくサイトを離脱する割合です。 離脱率には、当然 直帰率も含まれるので、直帰率が高ければ離脱率も高くなります。


    <新規ユニークユーザー率>
    新規ユニークユーザー率とは、集計対象となる期間中に "初めてサイトを訪問したユニークユーザー数" を、集計期間内の "全ユニークユーザー数" で割った割合です。

    ●分析時の注意点
    よく似た指標に新規セッション率がありますが、解析ソフトによって算出方法が異なります。計算の分子にくる
    「新規セッション数」は「新規ユニークユーザー数」と同じ意味になりますが、分母に「セッション数」を用いる場合があります。


    <サイト滞在時間>
    サイト滞在時間とは、同一セッションにおいて、ユーザーがサイト内に滞在していた時間のことです。
    具体的には、ユーザーが最初に訪れたサイトの閲覧開始時間と、離脱したページの閲覧開始時間の差になります。

    ●分析時の注意点
    上記のとおり、離脱したページの閲覧開始時間を基準に滞在時間を計測する為、最後に閲覧したページの滞在時間は含まれません。


    <ぺージ滞在時間>
    ページ滞在時間とは、該当ページに滞在していた時間のことです。
    具体的には、該当ページをリクエストした後、次のページをリクエストするまでの差になります。

    ●分析時の注意点
    離脱したページや直帰したページについては、PVはカウントされますが、滞在時間は計測されない為、実際の滞在時間とは異なります。


    <カート破棄率>
    カート破棄率とは、ECサイトでショッピングカートに商品を入れたにもかかわらず、購入に至らなかったセッションの割合のことです。 


【STEP5】解析データの理解と各データの関係

  • それぞれのデータの持つ意味を理解したら、次にそれらの関係性についても整理しておきましょう。

    <各アクセス解析データの関係>
    ●ページビュー数/セッション(訪問数)/ユニークユーザー(訪問者数)の関係
    ユニークユーザー数 ≦ セッション数 ≦ ページビュー数

    あるユーザーが、特定のサイトを「2回訪問」して、それぞれの訪問において「3ページ閲覧」したとします。

    そうすると、2回訪問して3ページづつ閲覧しているので、「ページビューは6」となります。
    一方、訪問回数は2回なので、「セッション数は2」となります。また、この例だと訪問者は1名なので、
    「ユニークユーザ数は1」となります。

    尚、あるサイトに、あるユーザーが、その日、初めて訪問すると、ユニークユーザー数は1つ加算されますが、そのユーザーが、その日、何度訪問しても訪問者数1のままですが、セッション数はそのたびに加算されます。

    また、1訪問中に、複数ページを閲覧するとページビュー数は加算されますが、セッション数は加算されません。


    ●直帰数と離脱数の関係
    直帰数 ≦ 離脱数

    直帰数とは、ある特定のページ"のみ"閲覧して離脱してしまったセッション数のことです。
    一方、離脱数とは、ある特定のページを"最後に"離脱してしまったセッション数のことです。

    通常、ある特定のページのみ閲覧して離脱した数の中には、そのページを最後に離脱した数が含まれるので、上記の関係式が成り立ちます。


    ●コンバージョン数/セッション数/ページビュー数の関係
    コンバージョン数 ≦ セッション数 ≦ ページビュー数

    ページビュー数とは、そのサイトのページが閲覧された回数のことです。
    セッション数とは、そのサイトに訪問した回数を表しています。
    また、コンバージョン数とは、コンバージョンページ(=サンキューページ)まで達したセッション数のことを表しています。

    尚、全てのセッションにおいてコンバージョンページに達するわけでは無い為、上記の関係式が成り立ちます。


    ●サイト上でのコンバージョン後の商談率・受注率集計
    コンバージョン後の商談率や受注率の集計は、ウェブサイト経由以外での内容を加味する必要があります。

    商談率や受注率は、顧客訪問時での決定や電話問い合わせなど、複数の経由元が常にあります。
    このため、どの販売手法が効率的なのかマーケティング上、販売企画の立案を行うために、複数の経由元を比較検討する必要があります。


    <ユニークユーザーの特定方法>
    ユニークユーザーとは、アクセスしてきたユーザー、つまり訪問者の事です。ユニークユーザーを識別するには、主に次の2つの方法があります。

    @パケットキャプチャ方式やサーバログ方式での特定
    ブラウザから送信されてくる、ユーザーエージェントやIPアドレスおよび時間などから識別を行います。

    Aウェブビーコン方式での特定
    cookieの中にアクセス解析ツールで生成したユニークな番号(訪問者ID)を保存することにより、ユニークユーザーの特定を行います。


    <ノーリファラについて>
    リファラ(遷移元ページのURL)が存在しない状態を、ノーリファラーといい、データの解析が出来ません。
    ノーリファラの理由として、以下の4つの場合が考えられます。

    @ブラウザのアドレスバーに直接URLを入力した場合
    Aブラウザに登録されているブックマークからページを閲覧した場合
    Bメールなどに埋め込まれているリンクを、メールソフト上からクリックした場合
    CSSLで暗号化されているページから、暗号化されていないページへ遷移した場合


上記の各STEPの内容を十分に理解されてから、実際にウェブ解析に入られることをお勧め致します。

より実践的な内容はコチラ


このページの先頭へ


トップページ

マーケティング戦略

リスティング広告運用

各種用語集

リンク集

サイトマップ