(photo by dracorubio)
さて、前回に引き続き「データのトリック」の例を紹介してゆこう。
◆ケース4 東京では国際結婚が多い
最近、東京では国際結婚が多いと聞くことがある。
10組に1組に国際結婚だとなにかの記事で読んだ記憶がある。
しかし、本当に東京では国際結婚が多いのかどうか、東京以外の地域の国際結婚の割合と比較しないと単純にそうだとは言い切れない。
ひょっとしたら、日本全国的な現象であるかもしれないからだ。
東京だけの傾向なのか、それとも日本全体の傾向なのか、この違いは、データを読み解く上で大きな意味を持つであろう。
また、都会の特徴的な現象かもしれないので、大阪、名古屋、横浜、福岡などのデータと比較する必要もあるはずだ。
(実際は、2005年データで全国の国際結婚率は6.1%、東京は2005年のデータで国際結婚率は9.1% 厚生労働省のデータより)
◆ケース5 ブラックマンデー
株式投資の世界では、リーマンショック以前においてその相場の急落を表す場合、ブラックマンデーでの暴落を引き合いに出されることが多かった。
念のために、ブラックマンデーを紹介しておくと、ブラックマンデーとは、1987年10月19日に起こった大規模の世界的株価暴落である。
この時、ニュウヨーク市場では、ダウ30種平均の前週末の終値(約2600ドル)より508ドルも下落した。下落率にして22.6%の大暴落である。
しかし、その後の相場の暴落においてよく持ち出されるのが、なぜか下落率ではなく下落幅の508ドルであった。
例えば、ダウ30種平均が10000ドルを超えているような状態にも関わらず、500ドルほど下落したとすると、「ブラックマンデーに次ぐ暴落!」「ブラックマンデーに匹敵する下げ幅」などと報道される事が少なくなかった。
本来、10000ドルを超えるようなダウ30種平均で、ブラックマンデーの下落幅508ドルと比較する意味はほとんどないのである。
つまり、注目すべきはブラックマンデーの下げ幅でなく下落率なのだ。
したがって、このような視点をもっていないと、データを使いた報道に振り回される危険性があるだろう。
◆ケース6 都道府県別子供の数ランキング
2009年の都道府県別子供の数のデータを見ると、次のようになっている。
1.東京都 1,526,000人
2.大阪府 1,207,000人
3.神奈川県 1,201,000人
4.愛知県 1,086,000人
5.埼玉県 969,000人
6.千葉県 818,000人
7.兵庫県 771,000人
8.福岡県 702,000人
9.北海道 663,000人
10.静岡県 508,000人
このデータを見れば、東京に子供が多く住んでおり、続いて大阪に多いことが判る。
しかし、実際はそれだけでこのデータを見てはいけない。
なぜなら、それぞれの都道府県には住んでいる人口がまったく違うからだ。
そこで、このデータを人口100人あたりで見ると、次のようになる。
1.沖縄県 17.73人
2.滋賀県 14.95人
3.愛知県 14.64人
4.福井県 14.23人
5.佐賀県 14.20人
6.福岡県 13.89人
7.岐阜県 13.86人
8.熊本県 13.84人
9.福島県 13.82人
10.鹿児島県 13.82人
つまり、子供の割合は沖縄県が一番多く、続いて滋賀県、愛知県と続いており、
前記の結果とは、まったく異なった順位となるのだ。
これは、同じデータでも色々な面から分析しないと、その実態を把握できない典型的な例のひとつだろう。
◆ケース7 世界の気温偏差
さて、今回の最後に前回の復習をかねて、実際の統計グラフを見てみよう。
次のグラフは、気象庁が発表した1891年から2011年までの世界の気温偏差のグラフである。
このグラフを見る限り、この100年あまりで、気温が急上昇しているように見える。
「地球温暖化対策は待ったなし!」の印象を与える。
しかし、同じデータを使って(大変なので10年毎にプロット)、
次のようなグラフを書くと、確かにここ100年あまりで気温は上昇しているが、
緩やかな上昇なので、それほど慌てることはないのではないか? という印象を与える。
果たしてどちらが正しいのか、あるいは真理はその真ん中あたりにあるのかはよく判らないが、どちらにしろ我々は、データには時としてトリックが隠されてることを忘れてはいけないのだ。