サイエンスメディアな日々   インフォグラフィクスな日々

サイエンスのこと・テクノロジーのこと・ビジュアリゼーションのこと

警察に殺された人々のデータベース The Counted by the Guardian

f:id:yasuda0404:20150603112257p:plain

ショッキングな可視化だ。

英紙ガーディアンが公開した"The Counted: People killed by the Police in the US"は、今年、米国で警察によって殺された人のデータベース。


サイトでは、人種や州別の人数といった総括的なデータが可視化されている。たとえば人種別の数をみると、殺害されたアフリカ系アメリカ人の数は白人の半分程度だが、米国の白人の割合は約70%、アフリカ系は約12%であることを考えると、やはり殺害されたアフリカ系アメリカ人の数は多いことがわかる。また、人口あたりの「殺された」人数では、オクラホマ州が飛び抜けている、米国全体では毎月90人前後、すなわち毎日平均約3人が、警察によって命を奪われている、といったようなことが読み取れる。


全体的なデータだけでなく、「殺された」人に関する詳しい情報ーーーーー名前や年齢、武器携帯の有無、管轄警察、報告された罪状、殺された時の状況などーーーーーも知ることができる。サイトに並んだ顔写真の中にはスナップショットや微笑んだ顔もある。


'The Counted'に使われたデータは、警察やその他の公的機関が公開したものではなく、ガーディアンがクラウドソースなどから独自に入手・整理したものだ。そして、このデータは公開されていて、誰でもダウンロードできる。


危険を未然に防ぐ手段として武器を使うこと、そしてその結果、相手の命を奪うことは、違法ではないかもしれない。しかし、より強力な組織と武器を持つ警察が、現場で本当に武器を使わざるを得なかったのか、という疑問は、米国内でしだいに強くなっているようだ。

市民から発信されたオープンデータが、市民が公権力について考え、何かを変えるきっかけになるかもしれない。

小惑星のビッグデータ 'Asterank'

f:id:yasuda0404:20150602072855p:plain

私達の太陽系に無数に存在するといわれる小惑星。そんな小惑星の膨大なデータベースが、Asterankだ。

Asterankには60万個を超える小惑星のデータが蓄えられている。それらはNASAなどの既存のデータベースからあつめられただけでなく、科学論文などから質量や軌道を計算したものもある。

しかも、それら小惑星の膨大なデータを美しい3Dビジュアリゼーションとして見ることができる。角度を変えたり、拡大・縮小したり、表の中の小惑星のデータのテキストをクリックすると3D可視化の中の対応する点に視点が移動する、といったインタラクティブな機能も備わっている(これだけのデータを3Dで可視化しているにもかかわらず、操作は軽く、ストレスがない)。

しかも、アステロイドデータベースのユーザーは、小惑星の発見者になれるかもしれない。'Discover'のページに表示される星空の写真を見比べて「動く点」を探すことで、まだ誰も知らない小惑星を探すことができるのだ。現時点で30万近くの写真がユーザーによって分析され、1,700名を超える人々によって11,600以上の「小惑星候補」が発見されている、と書かれている。シチズンサイエンス(市民参加型科学)のメッカである'Galaxy Zoo'とよく似た方法だ。

f:id:yasuda0404:20150602070921p:plain

Asterankにはまた、太陽系外惑星(その多くはケプラー衛星によって発見された)や銀河内のダークマターを可視化したページもある。

f:id:yasuda0404:20150602071645p:plain

f:id:yasuda0404:20150602071715p:plain

太陽の周りをまわる無数の光点は眺めているだけでも美しいが、その背後にしっかりとした科学的な土台があるからこそ感じられる神秘なのだ。'Asterank'は、データも可視化も、第一級のサイエンティフィック・ビジュアリゼーションだと思う。

食品と健康についての研究成果に一喜一憂するのはやめるべし

f:id:yasuda0404:20150601103052p:plain

よく◯◯は体にいい、とか、☓☓を食べると癌になる、といった「研究成果」が発表されて一般メディアでも話題になる。でも、中にはお互いに矛盾するものもある。とにかく健康に関する「知見」や情報はあふれていて、消化しきれない感じがする。


冒頭の図は、各食品の癌リスクについて調べたさまざまな論文の結論をプロットしたものだ(*)。この図では、癌の誘引となるものが右側、癌を抑制するものが左側にプロットされている。

ワイン、トマト、紅茶、ミルク、コーヒー…など、さまざまな食品がプロットされているが、一目見て明らかなように、その評価はかなりばらついている。たとえば最近、健康によいと言われることが多いワインも、癌の原因となるという論文もある。一方、健康については旗色の悪いバターにも、癌を抑制する効果があるとする研究結果もある。僕はコーヒーをよく飲むので、「コーヒーは健康に良い」という記事をみつけるとつい喜んでしまうのだが、この図によれば癌を誘引するか抑制するかは拮抗している。残念ながら、コーヒーは「中立」と考えたほうがよさそうだ。

この図から言えるのは、発表される研究成果に一喜一憂するのはあまり意味が無い、ということだ。それぞれの評価が定まるには、まだかなり長い議論と淘汰の時間が必要だろう。そして、その結論が出る頃には、僕自身はもはや健康についての情報を必要としなくなっているかもしれない。


灰色のものに無理に白黒をつけるのは、非科学的な行為なのだ------。

そう納得して余分なストレスがなくなったおかげで、少し長生きできそうな気がする。



(*)同図はVOXの"Science is often falwed. It's time we embraced that."に掲載されていたものを転載した。データの出典は"American Journal of Clinical Nutrision"にのったShoenfeldとLoannidisの論文と記されている.

平均値の罠:「シンプソンのパラドックス」

f:id:yasuda0404:20150531081356p:plain


たとえば、ある国の政府がこんな分析結果を公表したとする。

> 年収1000万円以上、年収500万円〜1000万円未満、年収500万円以下、どの階層でも平均所得が上がっている

この分析は正しいと仮定して、これだけでこの国全体の平均所得は上がっている、と結論づけていいのだろうか?


部分の平均がすべて上がっているのだから、それを合わせた全体の平均も当然上がっているはず。そんなの当たり前だ、と直感的には思う。実は、これは神永正博著「直感を裏切る数学」で紹介されている事例。ほんのタイトルから察せられる通り、各層の平均値は上がっていても全体の平均値は下がっていることがありうる、というものだ。本の中にある具体的な例で説明する。


今、国民を、年収500万円を境にして「高所得者」と「低所得者」を分けるとする。そして国民は4人からなり、「高所得者」には年間所得1400万円と600万円の二人が、「低所得者」には300万円と200万円の二人がいるとする。(わかりやすく単純化した説明なので、国民が4人しかいない国なんてありえない、というツッコミはおいておく。)

この時、

  • 「高所得者」層の平均所得:(1400+600)÷2 = 1000万円
  • 低所得者」層の平均所得:(300+200)÷2 = 250万円

である。

ここで、不景気になって全員の所得が2割減ったとする。4人の年間所得は1120万円、480万円、240万円、160万円となる。ポイントは、第2位の人が「高所得者」層から「低所得者」層へ移ることだ。所得が減った後の各層の平均所得は、

  • 「高所得者」層の平均所得:1120万円
  • 低所得者」層の平均所得:(480+240+160)÷3 = 293.3万円

となる。すなわち、各人の平均所得は2割下がったのに、各層の平均所得は上がっているのだ!


このような「集団全体の性質と、集団を分けた時の性質が異なる」現象は、1951年、イギリスの統計学者、E.H.シンプソンが「分割表における相互作用の解釈」という論文の中で指摘した。このためシンプソンのパラドックスと呼ばれている。


シンプソンのパラドックスは、たとえばテストの平均点、人の体重や健康データなど、属性ごとにわかれた平均値が評価されているあらゆるケースでおきうるものだ。平均値というわかりやすい評価基準であるがゆえに、疑いを持たないことも多いかもしれない。


もしデータの分析が、部分別の平均値しか見ていなければ、すこし注意したほうが良さそうだ。データは景気回復を示しているのに「どうも景気が向上してる実感がない」という時も、もしかしたら…。

デザイナーとは「情報の翻訳家」である

f:id:yasuda0404:20150530190145p:plain

デザインは新聞を救えるか?」というTEDトークがある。スピーカーのジャチェック・ウツコは、衰退する東ヨーロッパの新聞をデザインの力で変えたデザイナー。「新聞」というメディアは、情報伝達をほとんどテキストにたよってきた。新聞の作り手も読み手もそれが当たり前だと思っているし、そうじゃなければ新聞じゃない。そんな固定観念を打ち破ったのがウツコだ。彼のトークは、その素晴らしい成果だけではなく、デザインという作業の本質が語られている。

ウツコのデザインは「インフォグラフィック」のお手本だ。彼は、新聞の情報をある意味で「解体」しながらその本質をとらえて、それを誰もが直感的に感じるように表現している。しかも、ただ「情報を可視化する」という作業ではなく、そこには「テキスト+イラスト」を超えた何か、すなわち、アートのような趣きがある。実際、彼は、新聞全体はひとつの「楽曲」だという。「新聞にはリズムや起伏があり、デザイナーにはそれを読者に感じさせる役目がある」。そう、デザイナーは単に美しいものを作る人でない。デザイナーは情報を理解し、本質をとらえ、それを伝えるべき人に伝わるように「翻訳」する人なのだ。

ウツコがデザインした新聞は東ヨーロッパ中に広がり、各国・各地域で新聞の売り上げは再び上昇した。小さな国、小さな会社でも仕事を最高のレベルに持っていける、と彼は言う。「必要なのはひらめきとビジョンと決断力です。」 知的で勇敢なクリエイターだ。

www.ted.com

copyright(c) 2008-, Atsuhiko Yasuda All Rights Reserved.