統計学を教える立場になった場合、おそらく最も聞かれる質問の一つが「自由度って何?」ではないでしょうか。しかし、この質問に答えるのはとても苦労します。というのも、その質問に単純に答えるだけでは「で?」と反応されるのがオチで、ちゃんと「なるほど」と納得してもらうためには、かなり長い話をしなければならないからです。この記事では、その「長い話」をできるだけコンパクトにまとめてみました。目次1 不偏推定量2 母分散の不偏推定量は?3 なぜnでなくn-1なのか?4 自由度とは何か1 不偏推定量「標本サイズnの標本」について改めて考えてみよう、というのが長い話の始まりです。いま、母集団から標本サイズnの標本をランダム・サンプリングする、いいかえれば(X1 X2, …, Xn) というデータを取るとしましょう(ランダム・サンプリングについては「母集団と標本という考え方」をご覧ください)。Xi たちは、実際には偶然にさまざまな値を取り得る量であり、確率変数です(確率変数については、「統計学と数学の諸分野」という記事で解説しています)。さらに、Xi たちは同じ母集団からランダム・サンプリングしたものなので、独立同分布な確率変数となっています。その期待値はμ、分散はσ²であるとしましょう。いいかえると、μは母平均(母集団の平均)であり、σ²は母分散(母集団の分散)であるということです。さて、ここで標本平均1/n * Σ[i=1,n](Xi)について考えます。(つまりXi たちをすべて足し合わせて(1/n)をかけたもののことです。記号に慣れていない方は「ビジネスで押さえておくべき基本統計量」をご覧ください。)この標本平均もまた確率変数となります。というのも、確率変数を加え合わせたものはまた確率変数になりますし、確率変数に数値をかけたものも確率変数になるからです。(ちなみに、確率変数を掛け合わせたものも確率変数となります。これらをまとめて「確率変数の全体は代数をなす」と言います。)さて、確率変数である標本平均1/n * Σ(i=1,n)(Xi)の期待値E(1/n * Σ[i=1,n](Xi))について考えてみましょう。期待値には線型性がありますので(「ビジネスで押さえておくべき基本統計量」に詳しく解説しています)、E(1/n * Σ[i=1,n](Xi)) = 1/n * E(Σ[i=1,n](Xi)) = 1/n * E(X1+X2+...+Xn) = 1/n(E(X1)+E(X2)+...+E(Xn)) = 1/n * (μ+μ+...+μ)と変形できます(Xiたちの期待値はμであることを用いました)。最右辺のカッコ内はμをn個足しているのでnμであり、それをnで割るのですから、結果としてμとなりました。つまり確率変数としての標本平均の期待値は、母平均に一致するということがわかりました。つまり、「一回一回のランダム・サンプリングごとに標本平均の値は偶然によってゆらぐが、その値を平均すると(つまり「期待値」の意味では)母平均にピタリ一致する」ということです。このことを、標本平均は母平均の不偏推定量であると言います。「不偏推定量」という言葉は、一回一回では食い違いがあるかもしれないが、平均すれば(つまり期待値の意味では)過大評価にも過小評価にもならず(「不偏」)、それによって知りたい量(いまの場合母平均)を推定できる量(「推定量」)、という意味です。簡単にいえば、「その期待値が知りたい量(母集団の情報)とピタリ一致する量」ということです。2 母分散の不偏推定量は?「標本平均は母平均の不偏推定量である」ことがわかったので、今度は母分散の不偏推定量について考えてみましょう。「え?普通にデータの分散を考えればいいんじゃないの?」と思われるかもしれませんが、実はそうではないのです。これを説明していきましょう。式を簡潔にするため、確率変数としての標本平均をXと書くことにしましょう。このとき「普通にデータの分散を考える」というのは、1/n * Σ[i=1,n](Xi-X)²xを考えるということです。この期待値E(1/n * Σ[i=1,n](Xi-X)²)がちょうど母分散σ²に一致するのではないか?と思うかも知れませんが、それは正しくないのです。実は、この値は実際の母分散σ²より小さく(n-1)/n * σ²となることが(大学入試問題に出そうな程度の計算ののちに)示せます。段階を追って説明すれば決して難しい計算ではないのですが、「長い話」をできるだけコンパクトにするため、ここでは割愛しましょう。要するに、「普通にデータの分散を考える」やり方だと、簿分散を過小評価することになってしまうのです!とはいえ、(n-1)/n倍のズレがあるだけのことですから、1/n * Σ[i=1,n](Xi-X)²のかわりにこれを予め(n-1)/nの逆数であるn/(n-1)倍をかけて調整したもの、つまり1/(n-1) * Σ[i=1,n](Xi-X)²を考えればよいのです。これこそが母分散の不偏推定量であり、「不偏標本分散」あるいは「不偏分散」と呼ばれています。3 なぜnではなくn-1なのか?このあたりから話は佳境に入ってきます。不偏標本分散が母分散の不偏推定量であり、1/n * Σ[i=1,n](Xi-X)²では過小評価になってしまうのだということが一応理解できても、「なぜそうなるのか?」というのがすっきり理解できないと考える人が多いようです。もちろん論理的には(先ほど省略した)「計算を一行一行追っていけば分かる」はずなのですが、たとえそのように頑張ってもなお「腑に落ちない」と感じるようなのです。しかもこのn-1という謎の量が「自由度」と呼ばれていてその説明もよくわからない…という成り行きの結果として、「自由度って何?」という質問が多発する事態につながっているわけです。そこで、もう少し「腑に落ちる」(かもしれない)説明を頑張ってみようと思います。まず、一瞬「え?」と思うかも知れませんが、1/n * Σ[i=1,n](Xi-μ)²という量の期待値を考えると(μは母平均です)、こちらは母分散σ²と一致します(このことは、期待値の線型性と分散の定義、母分散がσ²であることを用いれば示せます)。さっきと何が違うかわかりますか?そうです。標本平均Xと母平均μとの違いです。母平均は(私たちには分からないとしても)確定しているはずの「数値」ですが、標本平均のほうは確率変数です。母平均μはどっしりしていて、Xiがちょこちょこ動いていても変わりません。しかし、標本平均XのほうはXiがちょこちょこ動けばそれと「連れ合って」動いてしまうものです。いま「連れあって」と言いましたが、これはXiたちと標本平均Xとが定義によりX=1/n * Σ[i=1,n]Xi という「関係」を満たしていることを指しています。このため、Xiたちは、どっしりして動かない母平均μを中心にみると自由に動いており、平均すると母分散σ²でゆらいでいるわけですが、標本平均とXとXiとは互いに緊密な連携をとりながら動いているために、Xからみるとわずかに散らばりの程度が小さく見えるわけです。比喩的にいえば、子どもたちが好き勝手に動き回っている運動場があるとして、その運動場のある点に固定したカメラから見る子どもたちの動きのばらつき方と、子どもたちのちょうど重心の位置にいて集団から余り離れないように動くカメラからみた子どもたちの動きのばらつき方とを比べると、後者のほうがより少ないだろうと考えられるということです。実際、運動会などで固定した点に突っ立って撮影しているとすぐにフレームアウトするので、子どもたちの動きに併せて動く保護者も多いに違いありません。このように考えてくると、なぜ「普通に考えた」1/n * Σ[i=1,n](Xi-X)²が母分散の過小評価をもたらすのか、感覚的に理解できるのではないでしょうか。なお、どのくらい過小評価になっているか、言い換えると母分散からどれくらいバラつきが減ってしまうかというと、実はちょうど確率変数としての標本平均Xの「分散」の分だけ減るのです。これは先ほど割愛した計算を追えば分かるのですが、ここではほんの少しだけ説明しておきましょう。実は「分散」というものが独立な確率変数に関しては(X+Yの分散)=(Xの分散)+(Yの分散)Xをk倍した確率変数の分散はXのk2倍となるという基本的な性質を持っていることを用いると(期待値の場合と異なるのは「独立」という条件が必要なこととな点と「k倍」が「k2倍」に変わることです)、標本分散Xの分散は1/n * σ²と計算できます。これが母分散からの「目減り分」で、結局σ² - 1/n * σ² = (n-1)/n * σ²となるわけです。これが「過小評価」の核心であり、「なぜnではなくn-1なのか?」ということの本質であるといえます。4 自由度とは何かさあ、ついに「自由度とは何か」という話です。母分散の過小評価のメカニズムがある程度腑に落ちたとして、それでもやはりこのn-1という数値がどうにも思わせぶりです。この数値の「本質」は何なのでしょうか。先ほど、過小評価の原因が標本平均Xを通じたXiたちの「関係」にあるということを説明しました。これが多少の「不自由」をもたらし、母分散の過小評価につながったわけです。要するに、Xiたちの「自由さ」の度合いのようなものが重要だったのです。この「自由さの度合い」を「自由度」と呼んでいます。と言っても、これだけの説明ではわけがわからないかもしれませんね。ゆっくり説明していきましょう。Xiたちは、母集団からランダム・サンプリングしたわけですから、これは互いに独立であり、かつ、Xiのうちいくつかのものの値が確定したとしても、残りのものの値は確定しません。したがって、n個の確率変数Xiの値はn個の情報によって決まり、n-1個以下の情報では決まりません。このような状況においては、Xiたちの「自由度」はnである、と言われます。ところが、「標本平均」が与えられているとすると、Xiたちの自由度はn-1となります。なぜかというと、標本平均の値が確定している前提のもとでは、Xiたちのうちでn-1個の値が確定してしまうと、残りは自動的に決まってしまうからです。というのも、標本平均の定義からくる関係式があるからです。分かりにくければ、次のような具体例を考えてみるとよいかもしれません。たとえば、標本が(a,b,c)で標本平均が6だとしますと、13(a+b+c)=6なので、aとbの値が決まるとcの値が自動的に決まってしまいます。よって、「自由に値を決められる」のは2個だけなので、自由度は3ではなく2(=3-1)となるというわけです。このようにして「自由度」の概念を理解すると、それがバラつきの度合いの評価などに重要な役割を果たすであろうことがなんとなく予想できるのではないでしょうか。その予想は正しく、「推測の技法」としての統計学においては、確率変数のバラつきの評価を考える際などに「自由度」を考えることが必要になります。「謎のn-1の正体」は、実はこの「自由度」が統計学に登場する「典型的な例」に他ならないのです。