「科学的な説明」を与える方法としての統計解析と、予測の精度を上げる方法としての機械学習の関係性について解説します。目次1 説明と予測の関係2 科学的な説明3 統計解析:科学的な説明を与える営み4 機械学習:予測だけではダメなのか1 説明と予測の関係統計解析と機械学習の関係について理解する出発点として、非常に一般的なレベルでの「説明」と「予測」の関係について述べておきましょう。古代の哲学者アリストテレスは、「すべての人間は、生まれつき、知ることを欲する」と述べています(『形而上学(上)』出隆訳、岩波文庫)。「知る」と一口に言っても、この見たことのない実はどんな味がするのか知りたいというレベルから、「なぜこの実は甘いのか」といった理論的なことが知りたいレベルまで様々でしょう。「なぜ」を問う(問うてしまう)のが人間の本性であり、この本性のゆえに様々な科学技術が発展してきたといえるでしょう。私たちは「なぜ○○なのか」といった「説明」を求める動物なのです。もちろん、人間が考え出す説明はいつも適切とは限りません。現代人から見れば荒唐無稽に見える神話も、「なぜ」に対する説明だったりします。ヒマワリは(若いうちは)太陽の方向を追うように向きを変えていくものですが、これは「なぜ」かと古代人も考えたのでしょう。ギリシア神話による「説明」は、ヒマワリが太陽神に片想いをした妖精の成れの果てだからということになります。これはこれで魅力的な物語ですが、「科学的な説明」に慣れ親しんだ多くの現代人にとっては「それでは説明になっていない」と感じられるでしょう。2 科学的な説明とは?では、「科学的な説明」とは一体何でしょうか。それは、現象をもとにした(多少なりとも数学的な)モデルであって、そこから(多くの場合数値的な)予測を導き、それが現象と一致することを確認するという手続きを経て生き残ったものです。ここで、モデルから検証可能な「予測」が引き出されていることが重要です。その予測が現象と合わないなら、そのモデルがどれほど魅力的ではあっても、その現象の「説明」としては捨てられるわけです。この意味で、適切な「予測」ができることは「説明」の良し悪しの試金石であるといえるでしょう。このように、「予測」と「説明」は深く関連しています。しかし、ここからが重要なのですが、「予測」と「説明」の関係は一筋縄ではいかないのです。この点を理解することが、統計解析と機械学習の関係を理解する基盤となるので、少し丁寧に考えていきましょう。まず、「予測」ができない「説明」は(科学的な説明としては)認められないことはすでに述べましたが、「予測」さえできれば良い説明と言えるのでしょうか。実は、科学の歴史を振り返ると、必ずしもそうではないことに気が付きます。例えば、ヨーロッパ中世において「常識」であった「天動説」に基づくプトレマイオスのモデルは、実際の星の観測データを極めて精度よく「予測」することができるモデルでした。それに対し、「地動説」に基づくモデルは(少なくとも初期段階では)、必ずしも予測の精度の点でプトレマイオスのモデルより優れていたわけではなかったのです。にもかかわらず、地動説に基づくモデルが発展し、その立場から近代の物理学が生まれたのは、それが「よりシンプルなモデル」だったからです。プトレマイオスのモデルは、データを精度よく予測できるよう非常に複雑なものとなっていました。天体が円運動を何段階も重ね合わせた運動していると仮定することで、その精度は充分に上げることができたのです(現代の目からみると一種の「フーリエ解析」をしていることになります)。しかし、このモデルは、新しい観測事実が増えるごとにどんどん複雑化していかざるを得ないモデルであり、シンプルさを欠いています。この点で、地動説は相当にシンプルなモデルであり、観測事実が増えてもそのシンプルさを一貫することができました。「真理はシンプルであるはずだ」(何といっても偉大な神が作ったのだから)という一種の信念が、科学者を地動説に移行させ、結果的に天体のみならず世界全体の数学的なモデルとしての古典力学を生み出したのでした。この古典力学はシンプルであると同時に、世界の様々な現象を説明する「普遍性」を持っています。このように、科学的な説明においては、単に現象の予測ができるだけではなく、シンプルさや普遍性も有することが求められます。「なぜシンプルでなければならないのか?」「なぜ普遍性を有したもののほうが優れているといえるのか?」というのは深い問題ですが、少なくとも人間(とくに科学者)は「予測」以外の評価基準も持ちながら科学的な説明を発展させてきましたし、結果的にそれは大成功をおさめてきたわけです。その結果、「科学的である」ことと「正しい」ということは必ずしも同じではないにも関わらず、現代ではほぼ同じ意味と捉えられるほどまでになっています。3 統計解析:科学的な説明を与える営み統計解析は、偶然やゆらぎのからむ諸現象に対して、まさしくこのような意味で「科学的な説明」を与える営みです。統計解析には様々な方法論がありますが、そのどれもが「考えたい現象に対し、確率論に基づいた数学的なモデルを系統的に複数考え、それらのモデルのうちで良いものを選ぶ」ということにおいて共通しています。ここで「確率論に基づいた数学的なモデル」としては論理的にはいくらでも考えることができるはずですが、通常、様々な現象の説明に普遍的に現われるタイプのシンプルなモデルを選ぶことが多いです。より具体的には、モデルに使われる確率分布(確率変数がある範囲の値を取る確率がどれくらいかという情報を与える関数)としては「正規分布」などの「普遍的」に現われるものがよく使われます(「正規分布」やその「普遍性」を保証する「中心極限定理」については別の記事で扱います)。また、「モデルを系統的に複数考え」る際には、通常モデルの基本構造は同じにしておいて、その構造を微調整する数値(「パラメータ」と呼ばれます)をいろいろ変えてみる、という手法がしばしば用いられます。そして、「もっとも良いもの」としては例えば「尤度」(実際に起こった結果に関する、そのモデルにおいて予測される確率)を最大にするものが選ばれます。もちろんモデルの「良さ」とは何かについては様々な立場があり得ますし、「パラメータ」調整以外の形で沢山のモデルを考えることも可能ですが、上記のような仕方で行われる統計解析(「パラメトリック」な手法と呼ばれます)は確かに統計解析の中核をなしており、科学研究の現場でもよく用いられています。もちろん「パラメトリック統計」の枠組みをはみ出す統計解析の手法(「ノンパラメトリック」な手法)も重要ですが、「考えたい現象に対し、確率論に基づいた数学的なモデルを系統的に複数考え、それらのモデルのうちで良いものを選ぶ」という基本的な戦略は共通しています。このように統計解析は、「科学的な説明」という概念と深く関わっています。統計学は「科学研究の方法論」として出発しており、統計学の重要な創始者の一人であるカール・ピアソンはその名も「科学の文法」という本を著していますし、もう一人の重要人物であるロナルド・フィッシャーの主著も「研究者のための統計的方法」という題名でした。要するに統計解析とは、偶然のゆらぎにみちた現象を予測できる「科学的な説明」を与える方法だといえるでしょう。4 機械学習:予測だけではダメなのか?しかし、そうした「科学的な説明」ができなければ精度の良い「予測」は不可能なのか?というと、必ずしもそうではありません。たとえ古典力学について何も知らず、放物線の計算も一切できないとしても、自分が投げたボールがゴールに入るかどうかは投げたとたんにわかる、といったようなことは普通にありうるでしょう。どうしてそれが「良い手」なのか「説明」はできなくても、なんとなくこれが「良い手」であると予測して、結果的に勝ってしまうことだってあります。いわゆる「カン」と呼ばれるものは、通常、「科学的な説明」ができないが、なぜか「予測」ができるという能力であるといえます。機械学習とは、この「カン」の権化を人工的に作り出そうとする営みであるといえます。機械学習にも様々な分野や手法が存在していますが、共通しているのは「科学的な説明」に固執することなく「予測」の精度を上げることに重点があるということです。機械の内部に(最初はまったく大したことのない)モデルを作り、それを「経験」(「予測」のヒントとなる大量のデータの入力)を経て改善していき(この「改善」の手法が本当は重要なのですが本記事は機械学習の解説ではないので述べません)、機械内部に「高精度の予測ができるモデル」を育んでいく、というのが機械学習の基本的な戦略です。ここで重要なのは、機械の内部に「高精度の予測ができるモデル」が出来たとした場合、これが人間にとって「シンプル」であるとは限らないということです。それどころか、近年ますますホットな「深層学習」においては、多くの場合人間からみると「全く何をやっているのかわからない」モデルが作られているらしいことが分かってきています。言ってみれば、高度な知能ではあるが人間とは全く異なる「世界観」をもつ知能が生まれてきているわけです。実をいうと深層学習は、人間の脳の構造にヒントを得た「ニューラルネットワーク」をベースにしているのですが、それにも関わらずこれほどまでに「異なる知能」が生まれてきていることは大変興味深いことです。おそらく人間の脳は深層学習の基盤としての「ニューラルネットワーク」の構造に取り込まれていない仕組みも有しているのでしょうし、もしかしたらそのような仕組みが「意識」といった現象にも深いかかわりを持っているのかもしれません。いずれにせよ、機械学習を通して驚異的に有能な「異なる知能」が生まれてきたことは確かであり、その力の限界はまだ見えていません。近年では、機械学習を通じて可能となった自動翻訳や画像認識は今や「日常」の一環となっていますし、存在しない人物の画像を自動的に生成できたり、動画の登場人物の顔を自分の顔に置き換えた動画を作るアプリまでが登場しています。こうした近年の技術の多くが、ちょうど人間が「穴埋め問題」を「なんとなく埋める」ことができる仕組み(それは「誤植」を見逃してしまう仕組みでもあるのですが)を機械内部に育てることによって可能になりました。要するに、「カン」にあたる「説明はできないが予測は(驚異的に)できる」仕組みを機械内部のモデルとして実現したのです。こうした機械学習の発展を踏まえると、「予測だけではダメなのか?説明など不要なのではないか?」と考える人もいるかも知れません。「科学的な説明」がシンプルさや普遍性を重視したのは、「人間にとって」それが「良い」だけのことで、別にそれが「世界の真実」だというわけでもないだろう、という考えを持つ人もいるでしょう。確かにそれは一理あるかもしれません。しかし、「予測」さえできれば「説明」は不要であるというのはやはり極論であると思われます。「神様のお告げ」が「人工知能のお告げ」に置き換わり、人間が自分の頭で考えることを捨てるのは非常に危険でしょうし、ビジネスのレベルでも「説明できないがこうすると良いのです」だけで顧客が納得するとは思えません。そもそも機械学習が作り出すのは人間とは「異なる世界観」をもつ知能であり、人間の世界観のほうが優れている面も多々あります。また、機械学習を支える数学的手法の多くが統計解析の分野で育まれてきたものであることも指摘しておくべきでしょう。要するに、「説明」と「予測」は現在でも互いに不可欠なものであり、機械学習が発展することで統計解析が不要になるとはいえないということです。むしろ、機械学習の出してきた「答え」を鵜呑みにせず、その妥当性を自分の頭できちんと検討するためにも、ますます統計解析の考え方を身に着ける必要性が高まっているといえます。