因果を考えることは人間にとって根本的なことですが、それを科学の俎上に載せるには意外な難しさがあります。この記事では、「因果とは何か」という問いに始まり、最新の「統計的因果推論」に至るストーリーを概説します。目次1 蒔かぬ種は生えぬ2 因果を科学的に扱うことは可能か3 ランダム化比較試験4 統計的因果推論おまけ:グレンジャー因果性1 蒔かぬ種は生えぬ人間の歴史は、問題解決に向けた奮闘の歴史です。たとえば、古来より人類は、病気という苦しみに対して、「どのようにすればその苦しみを無くせるのか?」ということを考えてきたはずです。このようなことを考えるとき、必ず「因果」、すなわち「原因と結果の関係」が問題となってきます。つまり、治療のためにはその病気の「原因」を考え、その原因を取り除くことによって「結果」としての病気を取り除こうという思考です。「因果」という言葉は単純なようですが、世間一般においても哲学的な論争においても、同じ言葉を違う意味で用いることから多くの混乱が起きています。ここでは、「これこそが因果の『正しい』定義だ」ということを論ずるつもりはありませんが、基本的に私たちが「因果」という言葉を使う際に(そして実際に統計学を「推測の技法」として活用する際に)押さえるべき要所に限って説明しましょう。古くからのことわざに、「蒔かぬ種は生えぬ」というものがあります。まさしく種を蒔かない限り、そこから芽が出るということはあり得ないというわけで、人間の努力の重要性を主張することわざですね。ところでこのことわざは、「因果」を捉える重要なポイントをついてもいます。というのも、「畑に種を蒔くこと」を「原因」とし「その種がその畑で発芽すること」を「結果」とすることが多くの人にとって自然であろう(難しい哲学論争に明け暮れている人のことは知りませんが、ほとんどの人は「それはそうだ」と言うと思います)ということに加え、この例が「因果」の概念の急所をついているからです。「因果」の概念について大変困ったことの一つは、「Aが原因でBが結果である」ということを「Aが起こると絶対にBが起こる」ということだと直ちに解釈してしまう人が多いということです(とくにある種の哲学論争に明け暮れている人々)。もちろん、後者のような関係のことを「因果」と呼ぶと定義してしまえばそれでもよいのでしょうが、これだと「蒔かぬ種は生えぬ」すら「因果」として解釈できません。実際、種を蒔いたとしても「絶対に」芽が出るとは限らないからです。「絶対に」のケースは、「決定論的」という別な言葉があります。因果というのは「決定論的な関係」よりも広いものと考えるべきなのです。もうひとつ重要なこととして、「蒔かぬ種は生えぬ」には「否定」が重要な役割を果たしているということです。なぜこれが重要かというと、「AがBの原因(BがAの結果)である」と言うためには、「AがないときBがない」と言えるか?ということを常に考えなければならないからです。具体的に考えてみましょう。いま、風邪で苦しんでいた友人が、「錠剤Aを飲んだら、翌朝熱が下がってよかった」とあなたに話したとしましょう。もちろんあなたは「それは良かった!」などと共に喜ぶでしょうが、果たして「錠剤Aを飲む」が「翌朝熱が下がる」の原因であると即断してよいでしょうか。明らかにそれは「早とちり」です。「錠剤Aを飲まないとき、翌朝も熱が下がらない」という風には言えないからです。錠剤Aとは全く無関係に熱が下がったのかも知れません。2 因果を科学的に扱うことは可能か?とはいえ、時間を遡って「錠剤Aを飲まない場合」を検証するというわけにも行きません。つまり、「一回きりの出来事」に関しては、「因果」というものを断定的に述べることは不可能なのです。では、「因果」という概念を完全に捨て去るべきなのでしょうか。それも一つの考えではあるでしょう。実際、近代の統計学の始祖の一人であるカール・ピアソンはそのように述べていました。因果を考えるなどという「非科学的」なことはやめて、データの相互関係のみの記述に徹するべきだというわけです。さらには、その後も「因果」をあまり積極的には議論したくないと考える統計学者も多かったといえます。ただ、ピアソンが「因果」を排除したのは、「因果」と「決定論的関係」がうまく切り分けられず、統計学的が問題にする状況ではほとんど期待できない「決定論的関係」の地位を引きずり降ろそうとするあまり「因果」までも捨て去ろうとしてしまった勇み足のようにも見えます。また、それに続く統計学者たちの多くが因果の問題を避けようとしてきた理由のひとつに、近代の確率論の標準的な枠組みがそれだけでは「因果」をあまり上手にモデル化できない仕組みになってしまっていたいうことが大きそうです。しかし、近年では確率論にさらに(「因果グラフ」や「介入操作の代数」のような)「外付け」の枠組みをセットすることで、「因果」を科学の俎上に乗せようという試みが表舞台に登場するようになってきたのです。いったい、因果関係を科学の俎上に乗せるためには、どのようにすればよいのでしょうか。科学においては、何かを検証するためには「再現可能性」ということが重要です。ある実験である結果が出たとき、「同様な」実験をすると「同様な」結果が出るとき、「再現可能性がある」と言います。この「同様な」が鍵で、「Aと『同様な』ことが起きないとき、Bと『同様な』ことが起きない(起きない確率が高まる)」かどうかを考えることによって、AとBの因果を科学の俎上に乗せることができそうです。少し考えると思いつくのは、友人と「同様な」人たち(同じような風邪をひいた、同じような環境の、同じような年齢の…)を集めてきて、それを「錠剤Aを飲む」グループと「飲まない」グループに分けたうえで、翌朝体温を測るというアイデアです(実際には、「飲んだ」という気分だけで効果が実際に生ずるなどということがあるので、「飲まない」グループにも薬効成分のないニセモノの錠剤を飲ませたりしたほうがよいでしょうが、ここでは気にしないことにしましょう)。確かに自然なアイデアですが、問題があります。まず第一に、「同様な」の基準をどうするかということ。そして第二に、二つのグループに分ける際に、偏りが出てしまわないか(例えば一方のグループにはある遺伝子を持つ人が偏ってしまい、その人たちは熱が下がりやすいなど)という問題があります。「同様な」の基準については、もちろんどこまでも付きまとう問題ではあり、いったん「私たちにとって自然な基準」を仮に定めて考え、不都合があれば考え直すということでよいでしょう。(ただ、この基準を主体的に設定することを通じてのみ因果関係が議論できるということはきわめて重要です。因果関係というものは、そうした主体的な設定を抜きにして自動的に導かれるようなものではないことに注意してください。)3 ランダム化比較試験第二の問題については、「われわれが思いもしなかった偏り」を取り去る上で強力な方法が存在します。それが「ランダム化(無作為化)」というものです。一つのグループを二つに分ける際に、ランダムに分けてやれば、困った偏りは(それが何であれ)実質上無視できる程度に消すことができるからです。というのは、参加者を二つのグループに割り振る際、偏りのないコインを振って「表」が出れば「飲む」、「裏」が出れば飲まないグループに割り振るとでもすれば(コインは参加者がどんな遺伝子をもっていようがお構いなしに「独立に」表や裏になるでしょうから)、偏りの効果は消えるはずだからです。(ちなみに、そんな面倒くさいことをしなくても、実験者の気分で決めればいいのではないかと思うかもしれませんが、人間の「気分」というのはそんなにランダムではなく、意識に上らないような偏りがしばしばあるものなので、「コイン」や「乱数表」、物理的に生み出されたゆらぎを用いるなどの工夫が必要なのです。)したがって、ランダム化の機構を用いて分けたグループ同士を比較する実験(「ランダム化比較試験(Randomized Controlled Trial、略してRCT)」)をすれば、因果関係を科学の俎上に乗せることが可能です(このランダム化比較試験の概念を導入したのは、カール・ピアソンの年少の好敵手ともいうべきロナルド・フィッシャーでした。) 4 統計的因果推論このランダム化比較試験を行うことにより、因果という重要な問題を推測の技法としての統計学の枠組と接続することが可能になったわけですが、それでも問題が全て解決したということにはなりません。実際、ランダム化比較試験というのは「実験」、すなわち「やってみる」ということであり、すでにあるデータを解析する操作ではありません。因果というのは「これがあるとき、これがある」というデータだけでは確定できず、「これがないとき、これがない」という方も見なくてはなりません。そのためには、実際に「やってみる」必要があったわけです。因果というのはそういう意味では「主体的につかまえにいく」必要があるものであり、データをただひっくり返しても決して見えてこないものです(たとえ人工知能を用いても)。しかし、あらゆることに関してランダム化比較試験を行うことができるわけではありません。実際、因果を知りたい大きな動機は病気の治療などですが、ある治療が有効かどうかを調べるためにランダムに患者をグループ分けして比較するというのはどう考えても倫理的とは言えないでしょう。この例をはじめとして、ランダム化比較試験が困難だったり不可能だったりする物事に関しての因果関係を統計学的手法を活用しながら検証したり推測したりできないか?という問題を扱うのが「統計的因果推論」と呼ばれる分野です。この分野の発展は比較的新しく、現在も活発に研究されています。そこでは、古典的な統計学の枠組みに因果関係の織りなす構造を「矢印のネットワーク」として表現する手法や、それを扱う代数操作を「外付け」することによってある意味で拡張しているのです。その発展に伴い、応用分野も広がっています。ビジネスの文脈において大いに活用される時代もすぐそこに来ているかも知れません。おまけ:グレンジャー因果性因果関係を科学的に扱うという文脈で、「グレンジャー因果性(グレンジャーの意味での因果性」というキーワードがよく取り上げられます。これは、二つの時系列(量の時間的変化のデータ)の間に、「一方の時系列のある時点までの情報を解析することで、その時点以降の他方の時系列の予測がより良くなる」という関係があることを意味します。グレンジャーの意味での因果性は、データからすぐに検証できるという意味で有用ですが、本記事で述べてきた意味での因果性を必ずしも意味しません。雷が起きる時、光の方が音より先に聞こえるので、光の明るさの時系列と音の大きさの時系列にはグレンジャー因果性がありますが、雷の「光」が「音」の原因というわけではないのです。ただし、グレンジャー因果性がある時には、それ自身が因果関係とは必ずしも言えないが、その付近に何らかの因果関係がありそうだ(例えば光と音の共通原因としての雷)という「手がかり」を与えるものとは言えます。