2015-06-02

小惑星のビッグデータ 'Asterank'

f:id:yasuda0404:20150602072855p:plain

私達の太陽系に無数に存在するといわれる小惑星。そんな小惑星の膨大なデータベースが、Asterankだ。

Asterankには60万個を超える小惑星のデータが蓄えられている。それらはNASAなどの既存のデータベースからあつめられただけでなく、科学論文などから質量や軌道を計算したものもある。

しかも、それら小惑星の膨大なデータを美しい３Dビジュアリゼーションとして見ることができる。角度を変えたり、拡大・縮小したり、表の中の小惑星のデータのテキストをクリックすると３D可視化の中の対応する点に視点が移動する、といったインタラクティブな機能も備わっている（これだけのデータを３Dで可視化しているにもかかわらず、操作は軽く、ストレスがない）。

しかも、アステロイドデータベースのユーザーは、小惑星の発見者になれるかもしれない。'Discover'のページに表示される星空の写真を見比べて「動く点」を探すことで、まだ誰も知らない小惑星を探すことができるのだ。現時点で30万近くの写真がユーザーによって分析され、1,700名を超える人々によって11,600以上の「小惑星候補」が発見されている、と書かれている。シチズンサイエンス（市民参加型科学）のメッカである'Galaxy Zoo'とよく似た方法だ。

f:id:yasuda0404:20150602070921p:plain

Asterankにはまた、太陽系外惑星（その多くはケプラー衛星によって発見された）や銀河内のダークマターを可視化したページもある。

f:id:yasuda0404:20150602071645p:plain

f:id:yasuda0404:20150602071715p:plain

太陽の周りをまわる無数の光点は眺めているだけでも美しいが、その背後にしっかりとした科学的な土台があるからこそ感じられる神秘なのだ。'Asterank'は、データも可視化も、第一級のサイエンティフィック・ビジュアリゼーションだと思う。

2015-06-01

食品と健康についての研究成果に一喜一憂するのはやめるべし

f:id:yasuda0404:20150601103052p:plain

よく◯◯は体にいい、とか、☓☓を食べると癌になる、といった「研究成果」が発表されて一般メディアでも話題になる。でも、中にはお互いに矛盾するものもある。とにかく健康に関する「知見」や情報はあふれていて、消化しきれない感じがする。

冒頭の図は、各食品の癌リスクについて調べたさまざまな論文の結論をプロットしたものだ(*)。この図では、癌の誘引となるものが右側、癌を抑制するものが左側にプロットされている。

ワイン、トマト、紅茶、ミルク、コーヒー…など、さまざまな食品がプロットされているが、一目見て明らかなように、その評価はかなりばらついている。たとえば最近、健康によいと言われることが多いワインも、癌の原因となるという論文もある。一方、健康については旗色の悪いバターにも、癌を抑制する効果があるとする研究結果もある。僕はコーヒーをよく飲むので、「コーヒーは健康に良い」という記事をみつけるとつい喜んでしまうのだが、この図によれば癌を誘引するか抑制するかは拮抗している。残念ながら、コーヒーは「中立」と考えたほうがよさそうだ。

この図から言えるのは、発表される研究成果に一喜一憂するのはあまり意味が無い、ということだ。それぞれの評価が定まるには、まだかなり長い議論と淘汰の時間が必要だろう。そして、その結論が出る頃には、僕自身はもはや健康についての情報を必要としなくなっているかもしれない。

灰色のものに無理に白黒をつけるのは、非科学的な行為なのだ------。

そう納得して余分なストレスがなくなったおかげで、少し長生きできそうな気がする。

(*)同図はVOXの"Science is often falwed. It's time we embraced that."に掲載されていたものを転載した。データの出典は"American Journal of Clinical Nutrision"にのったShoenfeldとLoannidisの論文と記されている.

2015-05-31

平均値の罠：「シンプソンのパラドックス」

データサイエンス

f:id:yasuda0404:20150531081356p:plain

たとえば、ある国の政府がこんな分析結果を公表したとする。

> 年収1000万円以上、年収500万円〜1000万円未満、年収500万円以下、どの階層でも平均所得が上がっている

この分析は正しいと仮定して、これだけでこの国全体の平均所得は上がっている、と結論づけていいのだろうか？

部分の平均がすべて上がっているのだから、それを合わせた全体の平均も当然上がっているはず。そんなの当たり前だ、と直感的には思う。実は、これは神永正博著「直感を裏切る数学」で紹介されている事例。ほんのタイトルから察せられる通り、各層の平均値は上がっていても全体の平均値は下がっていることがありうる、というものだ。本の中にある具体的な例で説明する。

今、国民を、年収500万円を境にして「高所得者」と「低所得者」を分けるとする。そして国民は4人からなり、「高所得者」には年間所得1400万円と600万円の二人が、「低所得者」には300万円と200万円の二人がいるとする。（わかりやすく単純化した説明なので、国民が4人しかいない国なんてありえない、というツッコミはおいておく。）

この時、

「高所得者」層の平均所得：(1400+600)÷2 = 1000万円
「低所得者」層の平均所得：(300+200)÷2 = 250万円

である。

ここで、不景気になって全員の所得が2割減ったとする。4人の年間所得は1120万円、480万円、240万円、160万円となる。ポイントは、第2位の人が「高所得者」層から「低所得者」層へ移ることだ。所得が減った後の各層の平均所得は、

「高所得者」層の平均所得：1120万円
「低所得者」層の平均所得：(480+240+160)÷3 = 293.3万円

となる。すなわち、各人の平均所得は２割下がったのに、各層の平均所得は上がっているのだ！

このような「集団全体の性質と、集団を分けた時の性質が異なる」現象は、1951年、イギリスの統計学者、E.H.シンプソンが「分割表における相互作用の解釈」という論文の中で指摘した。このためシンプソンのパラドックスと呼ばれている。

シンプソンのパラドックスは、たとえばテストの平均点、人の体重や健康データなど、属性ごとにわかれた平均値が評価されているあらゆるケースでおきうるものだ。平均値というわかりやすい評価基準であるがゆえに、疑いを持たないことも多いかもしれない。

もしデータの分析が、部分別の平均値しか見ていなければ、すこし注意したほうが良さそうだ。データは景気回復を示しているのに「どうも景気が向上してる実感がない」という時も、もしかしたら…。

2015-05-30

デザイナーとは「情報の翻訳家」である

f:id:yasuda0404:20150530190145p:plain

「デザインは新聞を救えるか？」というTEDトークがある。スピーカーのジャチェック・ウツコは、衰退する東ヨーロッパの新聞をデザインの力で変えたデザイナー。「新聞」というメディアは、情報伝達をほとんどテキストにたよってきた。新聞の作り手も読み手もそれが当たり前だと思っているし、そうじゃなければ新聞じゃない。そんな固定観念を打ち破ったのがウツコだ。彼のトークは、その素晴らしい成果だけではなく、デザインという作業の本質が語られている。

ウツコのデザインは「インフォグラフィック」のお手本だ。彼は、新聞の情報をある意味で「解体」しながらその本質をとらえて、それを誰もが直感的に感じるように表現している。しかも、ただ「情報を可視化する」という作業ではなく、そこには「テキスト＋イラスト」を超えた何か、すなわち、アートのような趣きがある。実際、彼は、新聞全体はひとつの「楽曲」だという。「新聞にはリズムや起伏があり、デザイナーにはそれを読者に感じさせる役目がある」。そう、デザイナーは単に美しいものを作る人でない。デザイナーは情報を理解し、本質をとらえ、それを伝えるべき人に伝わるように「翻訳」する人なのだ。

ウツコがデザインした新聞は東ヨーロッパ中に広がり、各国・各地域で新聞の売り上げは再び上昇した。小さな国、小さな会社でも仕事を最高のレベルに持っていける、と彼は言う。「必要なのはひらめきとビジョンと決断力です。」　知的で勇敢なクリエイターだ。

<a href="http://www.ted.com/talks/jacek_utko_asks_can_design_save_the_newspaper?language=ja">ジャチェック・ウツコは問う「デザインは新聞を救えるか？」</a>www.ted.com

2015-01-07

量子コンピュータ'D-Wave'開発の経緯：「D-Wave」は、本当に量子コンピューターなのか？ WIRED Vol.14

WIRED日本語版 Vol.14で、「NASA、Googleが注目する「D-Wave」は、本当に量子コンピューターなのか？」の翻訳を担当した。

今までいろいろと話題になってきた’D-Wave’だが、その詳細はよくわかっていない（伝わっていない）と思う。実際のところ、'D-Wave'がホンモノの量子コンピュータなのかどうかは、まだよくわからない。従来のコンピュータ（「古典機械」）とは異なるメカニズムが働いていることはほぼ間違いなさそうだが、そのメカニズムを「量子計算」と呼んで良いのかどうかは、専門家でさえまだ判断が分かれている。その事実をわかりやすく伝える、良い記事だと思う。

少なくともわかっていることは、’D-Wave’は最適化計算に特化した特殊な機械である、ということだ。「量子アニーリング」と呼ばれる比較的実現しやすい技術を導入した代わりに、汎用性は犠牲になった。D-Waveは、量子ビットをニオブ製の超電導ループで実現し、それらがスピン相互作用（「量子もつれ」）をもつ「３次元イジングモデル」を通じて「計算」を実行する。つまり、D-Waveの「プログラミング」とは、各ループの相互作用を設定することになる。通常のプログラミングとは大きく異り、微分や積分といった機能をハードウェアとして埋め込む「アナログ回路」に近いという印象だ。

解きたい問題にあわせて各スピンの初期設定を行えば、お互いに「量子もつれ」をもった各量子ビットは、量子アニーリングを通じてある状態に落ち着く。この状態が、求める最適解になる。…と書いたものの、具体的にどうやって「量子プログラミング」、つまりスピンの初期状態を決定しているのか、僕には皆目検討がつかない。

今回の記事には、D-Waveが今までたどってきた経緯が、周囲の賛否をふくめて公平に書かれていると思う。筆者の個人的見解は最小限にしながら、記事に書かれたいくつかのエピソードを通じて、D−Waveが、現時点では人々が期待していた「夢の機械」でもないし、単なる「エセ科学」と片付けられるものでもない、ということが伝わっている。（今までの常識を打ち破る革新的な科学技術とは、そういうものなのだろう。「最先端の科学技術は、魔法と見分けがつかない」といったのは、たしか、アーサー・C・クラークだ。）

今回のWIREDの記事で僕が感心したのは、そういう白黒つかない最先端の科学技術を、「白」にも「黒」にも偏らず、事実をわかりやすく客観的に伝えていることだ。しかも、記事全体にはストーリー性があり、D-Waveの創業者、ジョーディー・ローズをはじめとする登場人物の個性も（おそらく）的確に表現されている。これらの要素が組み合わさって、本来ならとっつきにくいテーマを、最後まで飽きさせずによませてくれる。さすが米国のサイエンス・ライターだ、と感心した記事だ。

サイエンスメディアな日々　　　インフォグラフィクスな日々

サイエンスのこと・テクノロジーのこと・ビジュアリゼーションのこと

小惑星のビッグデータ 'Asterank'

食品と健康についての研究成果に一喜一憂するのはやめるべし

平均値の罠：「シンプソンのパラドックス」

デザイナーとは「情報の翻訳家」である

量子コンピュータ'D-Wave'開発の経緯：「D-Wave」は、本当に量子コンピューターなのか？ WIRED Vol.14