adv.yomiuriトップページへ

ojoトップ  > コラム  > 数字を読む  > Vol.3 西内 啓

コラム数字を読む

(Thu Jun 05 12:36:00 JST 2014/2014年6・7月号 数字を読む)

Vol.3 西内 啓 統計家

Hiromu Nishiuchi

1981年生まれ。東京大学医学部卒(生物統計学専攻)。東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバード がん研究センター客員研究員を経て、現在はデータに基づいて社会にイノベーションを起こすための様々なプロジェクトにおいて調査、分析、システム開発および戦略立案をコンサルティングする。著書の『統計学が最強の学問である』(ダイヤモンド社)は35万部を超えベストセラーとなり、2014年度ビジネス書大賞を受賞。

Hiromu Nishiuchi

  統計学的な数字の読み解き方、すなわち統計リテラシーは多くの社会人にとって必要不可欠なスキルになりつつある。私自身の仕事の場でも、多くの人から「統計学を勉強したいんですがどうすればいいんですか?」という質問を頂(いただ)くようになった。しかしながら、統計学の教科書にも、その中に含まれる内容にも多種多様なものがあり、具体的に自分が今何を学ぶべきなのか、という次の一歩を見つけられていない方が多いようだ。
  そこで本稿では多くの社会人にとって最も身近な統計学のツールであろう、シンプルな集計グラフから一歩踏み出すための具体的なアイデアについて述べようと思う。

グラフに示されていない3つの情報。データが得られた状況は?

  シンプルな集計グラフとは例えば次のようなものである(図1)。
  自社の新製品の満足度を調査した結果、80%の人が満足していることになる、という結果だ。私はテレビなどでこうしたグラフを見る度に、そこにいくつか関心のある情報が示されていないことに対してモヤモヤする。おそらくこうしたグラフからモヤモヤを感じられるかどうか、というのが現代的な統計リテラシーを持っているかどうかの境目なのだろう。
  このグラフに示されていない情報は大きく分けて3つある。
  1つは、データが得られた状況である。例えばテスト・マーケティングの一環として、全国から無作為に得られた老若男女のモニターに対して80%が満足したというのであれば、自分がこの製品を使った場合にもおよそ80%の確率で満足できるのではないかと考えられるだろう。一方、製品に同梱(こん)されたアンケートハガキを用いて、グッズ欲しさにわざわざ切手を貼って回答してくれたユーザーが80%程度満足していた、というのでは話が変わってくる。つまり、回答するのは製品に満足したユーザーに偏りがち、という状況なのだから、実際にはその分の偏りを割り引いて捉えるべき数字である。

比較対象は存在している? 統計学ではグラフの使い分けも重要。

  2つめに、比較対象が存在しているかどうか、という点も注意が必要である。例えばテスト・マーケティングを行った結果、他社の競合製品の満足度が次のようになっていたらどうだろうか?(図2)

  こちらを見ると他社の競合製品では90%の人が満足している。つまり10%ほど他社製品より満足度が低いという結果である。80%だから何となく高いあるいは低いというのではなく、こうした比較軸があって初めて数字を用いたビジネスの判断を下すことができるのだ。なお当然この時点でも、先に述べたデータの取得方法について、果たして両製品を公平に比較できるようなものなのか留意しておきたい。
  余談だが、他社の競合製品との比較では円グラフではなく棒グラフや帯グラフを用いるべきである、といったグラフの使い分けも統計学における大事な定石の1つである。人間の目は角度の大小を読み取ることより長さの大小を比較することの方が得意なため、複数の集団や項目の間での比較を行いたい場合には円グラフは適さないのだ。実は私自身、仕事で円グラフを作ることはほとんどない。

そのデータはどのくらい信頼できる? 信頼性を示す“n”と“p”。

  少し話がそれてしまったが、3つめの問題はどの程度信頼できる値なのか、言い換えるならこの「80%が満足」という調査結果は何人に対する調査なのかという点である。極端な話、5人に聞いて4人が満足した、という状況でも最初のグラフは成立する。しかしながら、もし新たに1人回答者を追加した状況を考えてみると、たった5人の調査結果から得られた80%という値の信頼性がどれほど頼りないものかわかるはずだ。その新たな1人の回答者が「満足した」と答えればその割合は83.3%(6人中5人が満足)となり、逆に「不満だ」と答えれば66.7%(6人中4人が満足)という結果となる。一方、これがもし1000人に対する調査で80%(800人が満足)という結果であれば1人追加された回答者がどう答えようと0.1%ほどしか変化しない。
  こうした信頼性を示すため、統計学では調査対象者の数をn=という書き方で示すほか、標準誤差という指標を用いてどの程度ブレうる値なのかを示す。あるいは比較対象が示されている場合、p値という指標を用いてその差に意味があるのかという判断基準を示す。先ほどのグラフに、対象者数(n)、標準誤差、p値の各値を示すと次のようになる(図3)。

  棒グラフの上端に伸びている線は専門用語で「ひげ」と呼ばれるものであり、80%という集計値±標準誤差の2倍という範囲を示している。今回の場合、自社製品、他社製品ともにn=100人ずつの調査となっており、自社製品の80%という満足度の標準誤差は4%と計算されるため、±標準誤差の2倍の範囲は72%〜88%ということになる。同様に他社製品については標準誤差が3%で、84%〜96%という範囲がひげによって示されている。このような範囲のことを95%信頼区間と呼び、調査の性質としてこの程度の誤差は見込んでおかなければならないという目安になる。
  調査の結果に個人差がある以上、もし新たに100人ずつ調査した場合に全く同じ80%あるいは90%の満足度が得られるということはないが、だからといって極端に異なる調査結果が得られるということも考え難い。ではどの程度異なる結果が得られる可能性があるのか、というのがこの標準誤差を使って求められる95%信頼区間である。95%というのは、同様の調査を同時に100回行っていた場合にそのうち95回はこの範囲に集計値が収まるだろう、という意味である。当然ながら先ほど挙げた5人という極端な調査対象者の数ではこの信頼区間はかなり広いものになり、「本当のところ満足度がどうなのかよくわからない」という結果になってしまう。
  また、グラフ中に示したp値が0.048というのは、このような満足度の差が偶然の誤差だけで今回たまたま生じてしまったものだ、と考えられる確率が4.8%しかない、という意味である。統計学では慣例的にこのp値が5%より小さい場合「偶然とは考え難い意味のある差が生じている」つまり「有意差」と呼ぶ。信頼区間を見る限り、自社製品に関する満足度は調査の誤差を考慮して多く見積もってもせいぜい88%にしかならないのだから、それを超える90%という満足度を示す他社製品は、明らかに自社製品よりも満足度が高い商品なのではないか、ということである。
  以上が、最初に示したような円グラフを見た時にいつも私が感じるモヤモヤである。図3にあって図1にはないものが無意識レベルで気になり出したらあなたの統計リテラシーは大きなレベルアップをとげたことになるのだろう。
  本稿では標準誤差や信頼区間、p値などの詳細については述べなかったが、そうした統計学の基本的な概念について説明する入門書は書店にいくらでも並んでいるはずである。気になった方々はそれらの計算方法や、なぜそうした指標によって精度の高い意思決定ができるのか是非学んで頂きたい。
  おそらくそれこそが、多くの社会人にとって重要な統計学を身につけるためのネクストステップとして相応(ふさわ)しいのではないかと私は思う。

News & Report

〈2016年12月・2017年1月号 ojo interview〉

山根 哲也さん(ライトパブリシティ コピーライター)

〈2016年12月・2017年1月号 CYBATHLONリポート〉

10月8日(土)にスイス・チューリヒ空港に程近い街クローテンにある「スイスアリーナ」で、「CYBATHLON」(主催:スイス連邦工科大学、協賛:読売新聞社など)が開催された。本社広告局員による視察リポートをお届けする。

〈2016年12月・2017年1月号 読み解き読者調査〉

インタビュー

ウフル
新聞はITベンチャーに魔法をかけるメディア