社会人になると数々の統計データに触れる機会があります。プレゼンのスライドであったり、企画会議でも資料であったり、新聞のニュースであったり。そして、それらの統計データの中には、真実をありのままに伝えずに読み手をミスリードするようなものが少なくありません。

〇〇ランキングとか、〇%の人が△△だった! とかそういうものは、おもしろさを重視して細かいところを無視したものも少なくありません。

今回は、そんな統計データに騙されないために、典型的なミスリードの例をご紹介します。

相関関係か因果関係か

多くの人は、相関関係と因果関係をごちゃまぜにして考えてしまっています。大切なのは、相関関係があるからといって因果関係があるわけではないということです。

ひと昔前、マンションに関してこんな統計データが話題になりました。
「女性(33歳以上)の流産経験の割合が、マンションの居住階によって異なる。5階以下では21~22%台だが、6~9階では38.1%、10階以上では66.7%に跳ね上がっている」
いつかマンションの高層階に住んでいい景色を見ようとしている夫婦からすれば驚きの数字です。それに高いところに住むことが、流産の確率に影響を及ぼすとは考えにくいですよね。ではなぜこのような数字が出たのでしょう。

高層階の部屋は低層階に比べ値段が高い傾向があります。そこに住む人たちは世帯年収が高く、共働きでバリバリ働いていた女性が多かった。そしてキャリアを積み重ねていく中で、子どもを作るタイミングが遅くなり、結果的に流産の可能性も上がってしまった。そんな風に解釈すれば納得できるのではないでしょうか。

上記データは、マンションの階数と流産率の相関関係を示しているにすぎません。そこに因果関係があるかどうかは、私たちがしっかり見極める必要があります。

nozakisama-ec
1日1時間、わずか90日の『時短型英語学習』 2歳の双子の育児をしながら成し遂げたTOEIC200点アップ。
人気記事

理由はそれだけか

2016年4月、文部科学省が発表した「2015年度の英語教育実施状況調査」の結果も非常に話題になりました。

その内容とは、文部科学省が公立中高の英語教員に求めている「英検準1級以上」(同水準のTOEICスコア730点以上、TOFELiBT80点以上)の取得率です。全国平均の取得率は30.2%で、トップの福井県は51.7%と唯一半数を超えていましたが、この先、グローバル人材の育成は大丈夫なのかと波紋を呼びました。

たしかに危なそうなこの数字ですが、はたしてどう見るべきでしょうか。大切なのは、子どもの教育に影響が出ているかというところです。そこで実際に子どもの英語力を調べてみました。中学生は英検3級相当、高校生は英検2級相当の英語力を持っているかが評価軸です。

結果は、千葉県が1位、秋田県が2位でした。千葉県の教員は、先ほどのデータでは15位で、全国平均と大差ありません。秋田に至っては33位と、かなり下のほうです。ちなみに福井県は5位でした。他の都道府県のデータを見ても、教員の英語力と生徒のそれは相関関係がないことがわかりました。生徒の学力は、必ずしも教員の学力で決まるものではなく、他の要因も探す必要があるということですね。

suji-damasarenai02

どうやって計算したの

統計データからある結論を出すときは、なんらかの数式を使うことが多いですが、その計算方法に問題がある場合もあります。

『週刊ダイヤモンド』2014年10月18日号では、「最新 大学評価ランキング」において、ビジネスマン1854人に「使える人材輩出大学 ベスト5・ワースト5」を挙げてもらった結果、法政大学がワースト1位でした。

このデータの計算方法は、「使えると評価した数字」から「使えないと評価した数字」を引くというものでした。法政大学は、使えるが125、使えないが348で得点は「-223」。トップの慶応大学は使えるが2170、使えないが536で、得点は「1634」でした。

しかし、この評価方法は本当に正しいと言えるのでしょうか。大学によって、出てくる数字の大きさが全く違うのに、引き算の結果で比べてしまってよいのでしょうか。例えば、A大学について使えるが500、使えないが200とします。得点は300です。B大学はA大学の2倍の規模で、使えるが1000、使えないが400、得点は600です。得点だけ比べるとB大学のほうが高いですが、「使える」「使えない」の割合は同じです。

つまりこの評価方法はあまりあてにならないということです。本当に見るべきは、使える人材の割合などではないでしょうか。また、そもそも「使える」「使えない」という言葉の定義を厳密にしておく必要がある、などと色々な疑い方ができそうです。

数字に騙されないようにするためには?

3つの例から言えることは、数字には常に疑いの目を持って接する必要があるということです。数字で示されるとそれだけで説得力があるような気がして、多くの人が考えることをやめてしまいます。しかし、数字は示し方によっては真実と異なることをあたかも真実であるかのように見せてしまうので、気をつけないといけません。

「多くの人は、見たいと思う現実しか見ない」これは古代ローマの英雄ユリウス・カエサルの残した名言です。数字やデータを使って何かを伝えようとするとき、私たちは無意識のうちに主張を補強するためのデータを集めたり、主張に反するデータを無視してしまったりする傾向があります。

そこで解決策を考えてみます。まずは、主張と反対の情報に当たってみることです。たいていの主張には、賛成している人と反対している人がいます。その両方の根拠や論理展開に目を向けることで、広い視野で物事を見ることができます。また、時間軸で比較することも効果的です。過去にはどのようなデータが見られたか、どのように数字が変化してきているかなどを確認しましょう。

***
統計データは人を説得するのに大変有効です。だからこそデータの見せ方を間違えてはいけないし、間違ったものを見抜く力が必要になります。これから統計データに基づく主張を見たときは、それが本当に正しいのかを、少し疑ってみることです。

(参考)
小林直樹(2016),『だから数字にダマされる』,日経BP社.
『週刊ダイヤモンド』2014年10月18日号,ダイヤモンド社.
Wikipedia|相関関係と因果関係
文部科学省|公立中学校・中等教育学校における英語教育実施状況調査平成27年度