adv.yomiuriトップページへ

ojoトップ  > コラム  > 数字を読む  > Vol.7 小笠原道明

コラム数字を読む

(Thu Feb 05 12:36:00 JST 2015/2015年2・3月号 数字を読む)

Vol.7 小笠原道明 株式会社マクロミル マーケティングリサーチプロダクト本部 ソリューション部 マネジャー

Michiaki Ogasawara

1977年長野県生まれ。千葉大学文学部行動科学科卒業、同大学院修士課程修了(文化人類学専攻)後、インタースコープ(現マクロミル)に入社。入社時から、市場調査の調査企画~設計/分析~レポーティング業務を担うリサーチャー部門に所属、現所属部門マネジャー。これまで、様々な業界の定量調査/定性調査/購買データ分析に携わり、年間100本以上のプロジェクトに関与。

ミスリードを起こすような分析を避ける

  私自身は、生活者意識の調査データや購買データの収集/集計/分析を行うことを生業(なりわい)としている人間である。ここ数年は、1年間に100本以上のプロジェクトに関わっている。普段の業務において意識していることは多々あるものの、そのうちの1つとして「ミスリードを起こすような分析を避けること」がある。数字は端的に○%というかたちで示されるものの、データの分析(集計)の仕方によっては、何の意味ももたない数値となることが起こってしまう。
  小学生の時に習う【時速の算出方法…速さ=距離÷時間】も、当然ながら、割り算をあべこべにしたら、全く違う数値が算出される。ちなみに、時間÷距離の場合は、【距離あたりにかかる時間】となる。もし知りたいことが【1km進むとどのくらいの時間が経過するのか】であれば、後者の計算が正しいことになる。
  ミスリードを起こさないためには、【知りたいこと】を明確に定義する必要がある。そして適した分析手法を選択することができれば、ミスリードを避けることはある程度可能である(当然、データが誰から/いつ/どのように取得されたものなのか、というデータそのものが意味するものを正しく認識することが前提とはなるが)。
  ○○分析/××解析などと聞いたり、複雑な数式を目にしたりすると、思わず避けたくなる人もいるかもしれない。ただ、誤った計算結果からミスリードを起こし、結果として誤った判断をしてしまうことを回避するツールとして考えると、それを使うメリットは大きい。
  本稿では、数字を読む際に、起こりがちなミスリードを紹介する。マルチアンサーのアンケート結果の数字の読み方において、回答者数の多い項目を組み合わせても最適な結果にはつながらない、という例だ。なぜミスリードが起こるのか、どうすれば回避できるのか、ご覧いただきたい。

人気上位の3人が組んでも最適のユニットとは限らない

  仮想の話になるが、例えばこんなケースを想像してほしい。
  48人編成のある人気アイドルグループでは、毎年「誰が1番人気なのか」をファンの投票によって決めていた。トップの座は、絶大な人気を誇る3名のメンバーで常に争われる状況が数年続いた。世間では「48人いるけれど、あの3人は別格だよね」という評判と「神スリー」という呼び名が定着し、どこからともなく「この3人で新ユニットを結成すればすごい事になるぞ」という企画が持ち上がった。3人による新ユニット結成準備は順調に進み、デビューまでもう間もなくというタイミングで、突如この話に待ったをかける人物が現れた。アイドルユニットの産みの親である某有名プロデューサーA氏である。氏曰(いわ)く「せっかくなら3人組のユニットも人気投票をして決めたら?」と。
  この人気アイドルグループに対して絶大なる発言力を持つA氏の鶴の一声により、早速ファンによる新ユニット選抜投票が行われた。今回は3人組を決めるため、ファンからは48人のメンバーから3人を選んでもらった。開票した結果、投票数の1位~3位は、「神スリー」と呼ばれる3名となった。
  投票数の結果を受けて、「やっぱ不動の神スリーで決まりだよね」と合意形成されそうになった。が、またも周囲の意見に待ったをかけたのが某有名プロデューサーA氏。氏曰く「4位のメンバーや5位のメンバーって、何か3位までのメンバーとは異なるファン層がついてそうなんだよね。それって確認できないの?」と。A氏の指示で、早速、あるスタッフがファン投票のうち10票を抜き出して、結果を確認してみた(表)。
  投票数で3位までのメンバーでユニットを編成した場合は、7人のファンに支持される。ただ、3位のメンバーを4位のメンバーに入れ替えると、なぜか9人のファンから支持される。更に1位と4位と5位のメンバーでユニット編成した場合は、なんと全10人のファンから支持される状況が確認された。
  必ずしも投票数が多いメンバーを選べば良い訳ではないことは明らかになった。なぜこのような状況が起きたのか。それは、端的に3位までを選んでいる人が重複しているからである。

  この話は、シンプルな3つの円の重なり状況で考えるとより理解は進む。それぞれの円の大きさはA>B>Cの順番になるが、2つの円を合計した面積の大きさは、AとBではなく、重複している部分が少ないAとCが最大になる(図1)。
  さて先ほどのアイドルグループの話に戻る。早速、投票結果の集計を見直すことになった。ただ国民的アイドルグループである。投票数は数十万票もある。しかも48人の中から3人の組み合わせで最大の投票数となる結果が何かを確認しなければならない。ということは、48C3の組み合わせ数となる。実に17296通りの組み合わせを確認しなければならない。ロジックとしてはシンプルだ。ただ、すべての投票数を開票して、最終的にどの組み合わせが最大となるか突き詰めるには、どうも膨大な計算量が必要になりそうだ……。

膨大な分量を簡単に計算できるTURF分析

  この膨大な計算量を自動的になおかつ簡単に計算する手法として【TURF (Total Unduplicated Reach and Frequency)分析】というものがある。もとは、メディアキャンペーンの効果を分析するために考案された手法であるため、分析手法の名前にReach(リーチ/到達率)という表現が使われている。
  TURF分析は、2つ以上の組み合わせの中から獲得数が最大になる組み合わせを探るための分析手法である。例えば「組み合わせ数を4人や5人や6人などに変更していった場合のベストな組み合わせはどれか」という検証だけでなく、「その時の最大獲得数がどのくらいか」ということも手軽に把握することができる。組み合わせを1つ1つ増やしていっても、獲得数の増加率は一定であるとは限らない(図2)。1つ増やすごとのコストを考慮した場合、コストパフォーマンスとして優れている組み合わせ数の検証も可能である。

  この手法は、マーケティングリサーチのデータ分析では、昨今しばしば使われるようになってきた。例えば『商品ラインアップとしてどのアイテムをそろえることが最適なのか』『既存ブランドに新アイテムを増やす際にカニバリゼーションを起こさないアイテムはどれか』といった課題を検証するために活用される。また、広告関係者においては『どの組み合わせで広告案を投下すれば、伝えたい情報をより多くの人に伝えることが可能か』といったことが手軽に確認できる(図3)。

数字を読む強力な分析ツールを活用する

  解析ソフトを使えば、短時間でTURF分析は実施可能である。また今回紹介をしたTURF分析に限らず、計算量の多さや煩雑さのために、これまで実際のビジネス上の課題解決を行うために使われることが少なかった【コンジョイント分析】や【第2世代多変量解析】などの分析手法は、解析ソフトの発達のおかげで、より手軽に使えるようになってきている。
  こうした分析手法の話になると、ややハードルの高さを感じてしまう人もいるかもしれない。ただ分析手法の詳細な計算過程はさておき、どのようなことが分かるのか、ということだけでも理解をしてもらえれば、ミスリードを起こさずに数字を読む強力なツールとして活用することができる。
  ぜひ機会があれば、豆腐一丁ならぬ【TURF一丁】という気持ちで分析をしてみることをお勧めしたい。

News & Report

〈No.849 リーディングトレンド〉

月末の金曜日に退社時間を早める「プレミアムフライデー」が、いよいよスタートする。午後3時に退社し、余暇を楽しんでもらおうという取り組みは、クールビズのように新たなビジネススタイル、ライフスタイルとして定着し、ビジネスチャンスとなることを目指している。

〈No.849 ojo interview〉

砥川 直大さん(アサツー ディ・ケイ クリエイティブディレクター)

〈No.849 読み解き読者調査〉

新製品からロングセラーまで商品が多彩な食品ですが、生活者はその銘柄をどのように選んでいるのでしょうか。銘柄の選定状況や理由、食品ジャンル別の購入パターンを調べました。

インタビュー

第一三共ヘルスケア
小さな広告シリーズ500回記念で全面広告を掲載 4コマ漫画下の小枠広告の継続の力を実感