データをどう読み解けばいいかわからない。どのデータを信用したらいいかわからない。そう悩んだことはありませんか。
プレゼンテーションに対するよくある批判として、「データがないから説得力に欠ける」というものがあります。確かに、統計などのデータを用いていない主張は、どこまでが事実でどこからが憶測なのかの区別が全くつきません。また、バズワード的に使われるビッグデータという言葉や、エビデンスに基づく政策決定(EBPM)の必要性の議論など、今の社会はとにもかくにもデータを重要視します。
確かに、もっともらしいデータが添えられた主張は、良い主張、正しい主張のように見えるもの。しかし、そこには落とし穴があります。もっともらしいデータが添えられているからといって、その主張が正しいかどうかはわからないのです。
「もっともらしさ」に対して意識的に疑問を挟んでいかなければ、私たちは気が付かぬ間に損をしたり、間違った意思決定をしてしまう可能性があります。今回の記事では、統計がいかに人々を騙すのかを紹介し、統計に騙されないようにするにはどうしたらいいかを考えていきます。
統計の悪意
例えば、こんな文章をテレビのコマーシャルで見たことがあるのではないでしょうか。
医師の97.5%が当社製品の使用を推奨しています。
これを見て、「そんないい商品なのか。使ってみようかな」と一瞬でも思ってしまう人は多いのではないでしょうか。しかし、これは故意に誤解を誘導する、悪意のある文章である可能性が高いもの。なぜなら、このデータには次のような背景が隠されているかもしれないからです。
製品の広報担当者は、実態はさておき、その商品を優れたものと消費者に信じ込ませたい。そこで、権威のある人たちである医師に意見を求めた。その医師はランダムに選んだ医師ではなく、製品を作っている会社の研究に協力し、報酬を得ている医師たち。そして、医師たちに「この製品を使ってもよい」「この製品を使うべきではない」という2択式のアンケートに回答させた。医師たちは、契約や金銭の関係があることも手伝い、ほとんどの人が「この製品を使ってもよい」に〇をつけることになった――。
この統計の取り方には、様々なおかしい点があることに気づくと思います。まず、サンプルが偏っていること。そして、回答の選択肢が偏っていること。「使ってもよい」という選択肢には、「ぜひとも使いたい」という強い気持ちから「他が無いならこれでも致し方ない」という程度までを網羅した幅広い回答が含まれる一方、「使うべきではない」という選択肢は、強い拒否しか当てはまらないような範囲の狭い回答であり、不公平です。
ここで示したものは、極端でかつ分かりやすい例ですが、これと同じように、見る側に疑問を抱かせないような巧妙なデータは世の中には多くあるのです。
こうしてあなたは騙される!
統計の悪用方法には、主に二つのものが挙げられます。
1. 相関関係と因果関係の混同
何かの主張に対し統計データを用いて理由付けを行う際、頻繁に使用されるのが、相関という概念。その相関関係とごちゃまぜにされやすいのが因果関係です。
例えば、「一日の摂取カロリーが多い人は、体脂肪率も高い傾向にある」「一日の学習時間が長い生徒は、良い成績を出しやすい」といった主張があるとします。
統計を取ると、これらは明らかな傾向として出るでしょう。そして、これが往々にして因果関係として説明されることとなるのです。ですが、「摂取カロリーが多いということは、その人はすなわち肥満体形である」「勉強を一日20時間しているから、その生徒は確実に一位を取る」といった論理になると、これは一気に正確さを欠きます。
摂取カロリーが平均の倍あっても、その人はアスリートかもしれません。勉強を20時間していても、スマートフォンをいじってばかりで成績が上がらない人がいるかもしれません。このように、相関と因果関係は全く別物なのです。
2. 因果関係の逆転
因果関係の逆転というのも、よく使われる手法です。例えば、「バスケットボール選手は、そうでない人と比べて背が高い」というデータがあったとします。これはややもすると、バスケットボールをすることによって骨などに何かしらの刺激が行き、身長が伸びやすくなると解釈したくなりますね。しかし、現実は違います。バスケットボールは競技の性質上、身長の高い人が圧倒的に有利です。競技を続けるうえで、活躍してモチベーションを保つことが大切であることを考慮すれば、高校生、ましてやプロにもなるとバスケットボール選手に身長の高い人が多くなるのもうなずける話ではないでしょうか。
このように考えると、「バスケットボールを続けることによって身長が高くなった」のではなく、「身長が高い人がバスケットボールを続ける」という風に、直感とは逆の因果が存在しているのです。
統計の悪意に負けないために
では、私たちはこうした統計の悪意をどのように見抜けばいいのでしょうか。
悪意のある統計データに負けない第一の方法は、「本当にそうなのか?」と疑う心を持つことです。インターネット上で検索すれば、情報はいくらでも出てくるもの。その中には、一見して明らかに間違っている情報が数多く存在します。そうした情報に対して、「どうしてこの情報は間違いだと言えるのか?」を考えるようにしてみてください。情報を疑い、真意を追究する癖がつきます。
また、一見納得してしまいそうな情報であっても、その情報には問題がないのか、意図的な操作がないのかを考えることも必要です。統計を取る人たちは、何かの意図を必ず持っており、アンケート調査に私たちがどう回答するかやどう誤解するのかを、非常によく理解しています。アンケートの主催者側が回答者たちを操作しているかもしれないのだということを踏まえ、そのデータや文章の背景にある、情報発信者の考えを推理しましょう。
*** 統計は人を動かす力を確かに持っています。しかし、それは必ずしも正しい方向であるとは限りません。背後にある考えを見抜こうという姿勢が必要なのです。
(参考) 佐々木彈著(2017),『統計は暴走する』,中央公論新社. 伊藤公一朗著(2017),『データ分析の力 因果関係に迫る思考法』,光文社. キャリアサプリ|分析データに騙されるな!正しい「因果関係」の考え方を身につけよう