サイエンスメディアな日々   インフォグラフィクスな日々

サイエンスのこと・テクノロジーのこと・ビジュアリゼーションのこと

県民性の隠れた相関を探る:都道府県別統計とランキングで見る県民性

http://todo-ran.com/
県民性の違いをテーマにしたテレビのバラエティ番組があるが、結構面白い。自分が育った地域では当たり前と思っていたことが、他の場所では奇異だったりする。僕は生まれてから大学院を修了するまで関西にいて、その後東京の会社に就職した。関西人にしては関西色は強くない方だとの自信があり、東京にもすんなり対応できているとずっと思っていたが、後で関東出身者に聞くと、色々とおかしなことをやっていたらしい。特に言葉は自分ではわからない。標準語で話しているつもりでも、端々に「関西色」が出ているようだ。今では、自分では絶対に気がつかないことも世の中には存在するものだ、と諦めている。(自己言及型命題を証明することは理論上不可能なのだ。)

県民性の違いを可視化してくれるサイト、「都道府県別統計とランキングで見る県民性」は、様々なテーマごとに都道府県を分類・ランキング化するものだ。テーマ一覧には、「年間降水量」や「人口密度」などお役所的なものから、「食器洗い機普及率」「カレールウ消費量」「コンビニ勢力図」、さらには「郷土愛」「魅力」など、どうやって測ったんだろうと思うものまでバラエティにとんでいる。

面白いのは、各データに対して、相関の高いデータ、低いデータを同時に表示してくれることだ。相関が高い意外な組み合わせには、例えば、

  • 軽自動車普及率と最低賃金(相関係数0.88)
  • 睡眠時間と自殺者数(同0.84)
  • 教育費とマルエツ店舗数 (同0.71)

などがある。

さらには、

  • 公共事業費と公務員数 (相関係数0.81)
  • カレールウ消費量と共働き率(同0.71)

などもあるが、これは想定内といったところか。

楽しくデータマイニングしているうちに、何か新しい研究やビジネスのタネがひらめかないものだろうか。

copyright(c) 2008-, Atsuhiko Yasuda All Rights Reserved.