読者です 読者をやめる 読者になる 読者になる

サイエンスメディアな日々   インフォグラフィクスな日々

サイエンスのこと・テクノロジーのこと・ビジュアリゼーションのこと

データはすべてを教えてくれない

f:id:yasuda0404:20131020205345p:plain:w540

クーリエ・ジャポン2013年11月号の特集、「そして『理系』が世界を支配する。」は、興味深い内容だった。センセーショナルなタイトルはともかく、いくつかの記事には間違いなく将来への示唆やヒントがある。この特集で取材された出来事や発言には、賛成・反対といった意見や、好き・嫌いといった感情を越えた、複雑で深遠な、しかし、これからの社会に必要なエッセンスがちりばめられている。


その中でも、ネイト・シルバーへのインタビュー記事は、特にインスピレーションを与えてくれた。ネイト・シルバーは、2012年の大統領選挙で50州全洲の選挙結果を的中させたことでその名を知られるデータサイエンティスト。「データサイエンス」の先陣を切る彼なら、きっとデータサイエンスの描くバラ色の未来を語っているのだろうと予想しながら読み進めたが、良い意味で期待を裏切られた。

同時に、すっと腑に落ちる内容でもあった。僕自身、データサイエンスには早くから注目し、その可能性や期待についてセミナーで述べたり、ブログに書いたりしてきた(*)。しかし最近のデータ・サイエンス万能主義とも言える論調には、少し違和感を持っていたからだ。今回のネイト・シルバーのインタビューに、その違和感への答えがあるように感じたのだ。


インタビューでのシルバーの答えはそっけない。昨今のデータサイエンスへの大きな期待に対して、「一部で言われているほどのパラダイムシフトが起きるとは思いません。」と言う。そして、「データと予測にはそれらを生み出す人間と同程度の精度しか期待できない」、と警告する。

これを僕はこう解釈する。データの分析には、少なからず人間の視点が入っている。そして人間は、偏見に満ち、限定された能力しか持っていない。つまり人間がデータを扱う限り、「神の目」から見た純粋な真実が浮かび上がることはない。人間には想像もつかなかった真実がデータサイエンスによって次々と明らかになるという安直な期待は、残念ながら妄想なのだ。

それは、シルバーの次の発言に端的に現れている。「予測が当たらないとデータのせいにされがちですが、その前に適切な質問をしているかどうかを考えるべきです」


ただし、データサイエンスに意味がないわけではない。データサイエンスの価値は、目の前にすでに「見えて」いるのに、誰も「観て」いなかった事実を発見することにある。シルバー自身、「存在を無視されがちな”部屋の中のゾウ”、つまり、誰の目にも見えているのに無視されてしまう重要な問題を探すのが好き」だと述べている。

つまり、現在のデータサイエンスは、以前からデータ・マイニングと呼ばれていたものが、より巨大で広範なデータ、いわゆるビッグ・データを扱うことで、少し高度になったものにすぎないと考えるべきだろう。あくまでも「インクリメンタル・イノベーション」の範疇だ。


では、データサイエンスが、既存の技術の単なる延長ではなく、新しい分野として展開し、今まで扱えなかった領域をさらに深く扱えるようになるためには、どうすればよいのか。その答えは、さきほどの言明の裏返しで、データを扱う人間自身の能力を高めることに他ならない。統計学コンピュータサイエンスの延長線上にある狭い意味のデータサイエンスではなく、あらゆる分野の知識を統合した新しい分野としてのデータサイエンス(あるいは新しい「何か」)を創るためには、新しい時代の創造性が必要になる。

シルバーは、創造性には2つある、と言う。ひとつは芸術などの「純粋な表現」の創造性。もうひとつは、問題に取り組み、さまざまな解決策を見つけ出す創造性。データサイエンスの時代の創造性は、後者の創造性だ。(そして、シルバー自身は後者の創造性を持っていると述べている。)

データと創造性というと、相反することのように感じるが、けっして矛盾することではない。何か新しいものごと、例えば科学や芸術が創造される時に行われていることは、世の中に既に存在するものや過去に作られたもの(=つまり、データ)に、新しいスパイス(=創造性)を少し加える、ということにすぎない。創造とは、一人の人間が無から有を生み出すことではない。逆に言えば、99%のデータに、1%の創造を加えるだけでも、偉大な創造なのだ。そして、この1%があるかないかで、得られる成果は大きく異なる。


巷で言われるデータサイエンス万能主義は、あくまでも現在の統計学や計算科学、マーケティング、社会構造を、ある意味力づくで延長した先にある。想像はしやすいが、現実的ではない。データサイエンスの本当の意義は、一見些細に見えることでも、誰も気が付かなかった「コロンブスの卵」的な「フレームワーク」を創ることにあると思う。つまり、データサイエンス自体が内包する、今までにない新しい枠組みを発見できるかどうか、だ。

そして、その枠組みは、アルゴリズムが確立した既存のデータサイエンスだけから生まれるものではない。創造的な人間の介在によって、初めて可能になることなのだ。ある意味、当たり前のことを言っているように聞こえるが、その「当たり前」が、今までにない新しい分野を開拓する鍵になると思う。

シルバーは言う。「後に”革命”と認識されるような出来事は、最初は誰も”革命”とは思わないものです」


【追記】
クーリエ・ジャポンのブログに、ネイト・シルバーのインタビュー(雑誌のものとは異なる)が掲載されていた。ご参考まで。
ネイト・シルバーが語る「データ・サイエンティストになるために必要なこと」 « クーリエ・ジャポンの現場から(編集部ブログ)


(*)参考:データサイエンス(サイエンティスト)に関する小生ブログ
データ・サイエンティストは、これからもっともホットな仕事になる - サイエンスメディアな日々、インフォグラフィクスな日々
10年後、もっとも魅力的な仕事 - サイエンスメディアな日々、インフォグラフィクスな日々

copyright(c) 2008-, Atsuhiko Yasuda All Rights Reserved.