去る11/16(水)、ルグランと株式会社ロフトワークさんが運営するウェブエキスパート共催による、3回目のワークショップを開催しました。
今回のテーマは「デジタルマーケティングのための統計学入門」。これまでのワークショップでは、日々行っている業務の中で、データをどのように活用し、マーケティングROIを最大化していくべきか、ということをテーマに取り上げてきましたが、今回は趣向を変えて、データ分析の基本となる統計学的な考え方について考えてみることにしました。
【まずは統計の定義から】
デジタルマーケティングに携わっていると、データを前にして話す機会が多くなりますが、時に、同じデータを見ているにも関わらず、「データの捉え方が違う」と感じることがあります。このようなズレを少なくするためには、統計学的なセンスや見方を身につけることが重要になります。
例えば、何かの数字が増減した、もしくはABを比較してAが良かった、ということが分かった時、その違いや変化は、普遍性を持つ発見なのか、もしくは、たまたま出た数字なのかを見極めるための手がかりを与えてくれるのが統計学的な考え方です。
ワークショップでは、ドラマの視聴率調査を例にあげて、更に詳しく解説をしました。
視聴率というのは、全国民の視聴状況を全量調査しているのではなく、あくまでも、一部のサンプルデータをもとに算出された数値です。この時に考えなければいけないことは、この一部の視聴率データを全国民の視聴率と考えて、本当に誤差は生じないのか、ということです。
【「正規分布表」の見方を学びました】
まして、母集団が特定できないネットマーケティングの世界においては、「全量調査」をすることは不可能です。それゆえ、今手元にあるデータは、常にある一部を抜き出したサンプルデータと考える必要があり、そのデータを分析・解釈するためには、常に「誤差」の可能性と向きあう必要があります。そこで、限られたサンプルの中で実現した結果を、普遍的な法則と考えてよいかどうかを検証すること必要であり、統計学の世界では、そうした作業を「検定」と呼んでいます。
特に、みなさんの分析結果をもとに、例えばサイトを全面的に作り変えたり、商品やプロモーション戦略を見直すといった大きな決断を行おうとする場合には、みなさんの発見や分析結果が、偶然の産物ではないということを科学的に証明することが必要であり、そうした時に役に立つのが統計学の考え方なのです。
続いて、平均値とバラつきを分布に表した「正規分布表」の見方を学ぶため、いよいよ演習の開始です。まずは、偏差値を使いながら分布を考える作業からスタート。参加者の皆さんが、電卓を片手に真剣に課題に取り組んでいる姿は、まさに学校の授業そのもの。会場は、ピリッと張りつめた心地よい緊張感に包まれていました。ここでは、偏差値を出すことによって、その集団に対して自分が上位何パーセントに位置するかが見えてくるといったことを、演習を通して学んでいきました。
【電卓を片手に課題に没頭。学生時代を思い出す?!】
次に、正規分布表と公式を使いながら、いま話題のテレビ番組「南極大陸」と「家政婦のミタ」の視聴率を例に、視聴率調査の誤差を計算したり、また、A/Bテストの結果が99%間違いないと言えるために必要なサンプル数を計算するといった演習を通し、サンプル数が多ければ多いほど誤差の確率は少なくなり、一方、サンプル数が少なければ少ないほど、誤差の確率は高くなることを学びました。
こうしてみると、デジタルマーケティングにおいて「スモールスタートで始める」=「リスクをおさえる」ことには必ずしもならないということが見えてきます。なぜなら、サンプル数が多ければ多いほど正しい判断につながる確率は高まる訳ですから、もし月々のキャンペーン予算が少なければ、その分、必要なサンプルデータが蓄積するまでに、結局長い時間待たなければなりません。
デジタルマーケティングのキャンペーンを計画する際には、こうした期間と予算のバランスを考えることも重要である、というお話で締めくくり、今回のワークショップは終了しました。
ルグランでは、今後もこのようなワークショップを定期的に開催していく予定です。開催の時期については、弊社ブログやニュースレター、あるいはフェイスブックページなどでご連絡をさせて頂きます。