課題解決のためのデータ分析3つのポイント

ページビュー、ユニークユーザー数、コンバージョン率、直帰率、回遊率、滞在時間など、今日のビジネスでWebサイトを活用していれば、多くのデータを目にしていることだろう。だが、どれだけの人がこれらのデータを正しく分析できているだろうか?

「Googleアナリティクス」や「Adobe Analytics」の画面を眺めて、今日はPVが多かっただの少なかっただのと一喜一憂するだけなら、せっかくのデータを活かせているとはいえない。自らの仮説に基づいてA/Bテストを行って評価するのもいいが、そもそもの問題として、正しい仮説を設定できなければ、テストすべき改善案もつくれない。

では、どうすればよいのだろうか?

その答えは「どう分析するのか」という定石を身につけることである。

多くの人が、データを分析しようとしてもどこから手をつけていいかわからず、円グラフや折れ線グラフで「見える化」をして満足しているようである。しかし、実はたった3つのポイントだけを押さえていれば、誰にでもデータ分析は可能なのである。

その3つのポイントとは「アウトカム」「解析単位」「説明変数」だ。何やら難しいように思えるかもしれないが、普段のビジネスを遂行する上で出てくるものを言い換えたものであるともいえる。では、それぞれを説明していこう。

│データ分析の3つのポイント│

正しいデータ分析を行うためには、明確な「アウトカム」を設定し、そのために最適な 「解析単位」と「説明変数」を選ぶ必要がある。

アウトカムは、「KGI(Key Goal Index)」「結果変数」「従属変数」、あるいは「外的基準」などと表現される場合があるが、要するに「どの数字を最大化/最小化したいのか」という指標のことである。Webサイトがどのようなビジネスモデルで運用されているかにもよるが、たとえばECサイトであれば商品の総購買金額であり、定額課金モデルの会員制サイトなら有料会員者数であり、広告モデルで運営される媒体なら広告のクリック数になるだろう。いずれにしても、どのような指標の増加あるいは減少が、最終的な利益に直結するのかということだ。

ここで注意しなければいけないのは、目的と手段、あるいはゴールとプロセスを混同しないことだ。たとえば、ECサイトでは、PV(ページビュー)が増えれば基本的には利益が増えるはずだ。だが、PVを増やすのは、その先にある購買金額を増やすための途中過程に過ぎない。極論をすると、まったく購買する意図のないユーザーが何億回アクセスしてこようと、何の利益にもつながらないのである。同様に、「購入回数」「購入商品数」といったものもECサイトのアウトカムとしては不十分である。10円のものが100回買われようとも利益にはつながらない。それよりは1万円のものが1回購入されたほうがよいわけである。だとすると、分析対象は、ユーザーによってもたらされた売り上げ金額自体にすべきということだ。可能であれば、原価に関するデータ(掛け率など)を使って、ユーザーから得られる粗利の総額を分析するのが理想的である。こうした原価や売り上げ金額にかかわるデータを分析に用いることができないという場合は、カートから決済に進んだ回数などをアウトカムと考える方法もあるが、あくまでも代替的なものである。とにかく、このアウトカムの設定を間違うと、高度な手法やツールを使っても、意味のない分析になってしまうので、何が最終的なゴールであり、そのための指標として最適なものなのかをよく考えて選ぼう。

 

「アウトカム」は、「ゴール」を定義する指標

ビジネスのゴールが何であり、その指標として最適なものを設定する。このとき、目的と手段、ゴールとプロセスを混同しないように注意しよう

アウトカムが決まれば、今度はそれを分解して比較しよう。先述のECサイトなら、「ユーザー」を解析単位にする。つまり、「購入金額の高いユーザーと低いユーザーの違いを見つけようとする」ということになる。このほかには、商品を解析単位として「購入された金額の多いヒット商品とそうでない商品の違いを見つけようとする」という分析を行ってもいいだろう。

解析単位を選ぶ際には、数十~数百件程度の母数が必要である。扱う商品がたった2個しかないのであれば、「ヒット商品とそうでない商品の違いがどこにあるか」をデータ分析で明らかにすることはできない。もちろん2つの商品の間にはさまざまな違いがあるのかもしれないが、そうした違いのうちどの要素が売れ行きを左右しているかはわからない。逆に、取り扱う種類が数十~数百以上に及んでいたとしても「商品ジャンル」は解析単位にしてはいけない。なぜなら、その違いが「自明すぎる」からだ。たとえばアパレル系のECサイトで、「ジャケットと靴の違いはどこにあるか?」といった問いを立てる人はいないだろう。ジャケットはジャケットで、靴は靴だ。これが自明すぎる違いがあるという状況である。ユーザーやセッションであれば、「このユーザーとこのユーザーの違いは何か?」という問いに対して多様な答えの可能性が存在しているはずだ。

 

「解析単位」は、「注目する要素」の単位

同じアウトカムに対しても、何に注目するかで分析結果が変わってくる。「何に注目するか」ということが 「解析単位」である。解析単位には複数の選択肢があり、それぞれ独立して分析することも可能である

この「違い」、言い換えるなら「解析単位の特徴」のことを「説明変数」と呼ぶ。説明変数として、さまざまな要素を考えられる解析単位のほうが、最終的に得られる結果がリッチになる。たとえば、ユーザーを解析単位にした場合、性別や年代だけを説明変数とすればよいわけではない。ユーザーを特徴付ける要素であれば、アクセスしてくる時間帯、曜日、リファラ、アクセスしているページの種類なども、説明変数となる。回遊率や滞在時間といったKPIも説明変数だ。

ただし、分析に用いるデータは、「解析単位と一対一」でなければならない。たとえば、ユーザーが解析単位であれば、ユーザーIDに対してユニークなデータが必要となる。そうすると、一人のユーザーに対して複数行存在するアクセスログなどは、何らかの方法で集計する必要がある。ユーザーごとに「全訪問回数に占める時間帯ごとの割合」「全訪問回数のうちTwitterからの割合」「全PVに占める商品検索結果の割合」といったものを考えるというわけだ。

ここまでくれば、分析はほぼ終わったも同然である。本格的な統計解析ツールを使わなくても、Excelで散布図を書くといったことは、すぐにできる。縦軸にアウトカムの値をとり、「どの説明変数を横軸に取った場合に強く相関するのか」を探してみるだけでも、さまざまな発見は得られるはずだ。具体的な手法については、本特集の「Excelを使ってデータを『見える化』しよう」が参考になる。

 

「説明変数」は、「アウトカム」を左右する特徴

こうした分析結果をもとに仮説を立て、サイトデザインや出稿する広告の内容についてA/Bテストの案を練る。たとえば、「PVに占める商品検索結果の割合が高いものほど総購買金額が高い」という結果が出ているのであれば、検索窓の位置やサイズ、色などについて、さまざまパターンを試してみよう。

そうすることで、これまで指標としていたKPIなどがアウトカムにはつながっていなかったという発見が得られることもあるはずだ。たとえば、回遊率や滞在時間を重視して施策を考えていたものの、こうしたKPIで「優良」とされるユーザーが売り上げをもたらしていなかったという状況である。

適切なデータ分析を行えば、こうした直感に反する真実に早くたどり着けるし、取得したデータを見て一喜一憂しているだけなのはもったいない。

本稿を読んだ多くの読者が、こうした分析にチャレンジしていただければ幸いである。

 

Text:西内啓
東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバードがん研究センター客員研究員を経て、2014年11月より(株)データビークルを創業。自身のノウハウを活かしたデータ分析ツールの開発と、官民のデータ活用プロジェクト支援に従事。著書に『統計学が最強の学問である』『統計学が最強の学問である[実践編]』(ダイヤモンド社)、『1億人のための統計解析』(日経BP社)などがある。
  • URLをコピーしました!
目次