統計学入門−第1章

以前は統計学の代わりに推計学(stochastics)あるいは推測統計学(inductive statistics)という言葉がよく使われていました。統計学と推計学の違いは何でしょうか？

それを説明するために、少々蘊蓄を傾けることをお許し願って統計学の歴史を紐解いてみましょう。統計学の歴史は大変古く、紀元前3000年頃の古代エジプトにおけるピラミッド建設のための基礎調査や、紀元前2300年頃の中国における人口調査などにその萌芽を見い出すことができます。まさに「4000年の歴史を秘めた幻の学問！」といったところです。しかしこの時代は、さすがにその芽が花開くまでには至りませんでした。

統計学(statistics)という言葉と概念が確立したのは17世紀頃です。この時代の統計学は国勢調査を研究する学問として発展し、ラテン語のstatus(国家)にちなんでstatisticsと名付けられました。そしてその後、確率論を取り入れ、19世紀末から20世紀初頭にかけてゴールトン(Francis Galton)やピアソン(Karl Pearson)等によって体系的に整理されました。この時代の統計学はデータを要約して調査対象の情報を数学的に記述することが中心だったので、記述統計学(descriptive statistics)あるいは古典統計学と呼ばれています。 _(注1)

どんな学問でも、ある出来事がターニングポイントになって、それ以前と以後とでその学問の内容が大きく変貌してしまった場合、普通、以前のものを「古典」と呼び、以後のものを「近代」と呼んで区別します。例えば物理学において、1900年のプランク(Max Karl Ernst Ludwig Plank)による量子論と1905年および1915年のアインシュタイン(Albert Einstein)による相対論によって、それまでのニュートン力学が古典物理学になり、近代物理学が確立したことはあまりにも有名です。

統計学では、そのターニングポイントは1925年にやってきました。この年にイギリスのロンドン郊外にあるロザムステッド農事試験場の統計技師をしていたフィッシャー(Rinald Aylmer Fisher)が「研究者のための統計的方法」という本を発刊し、新しい統計学を提唱しました。そして、これによって統計学は画期的な変革を遂げることになります。 _(注2)

フィッシャーは、我々が行う実験や試験の対象になる集団は、非常に多くの例からなる、ある理想的な集団の標本にすぎないことに気付いたのです。そして実験や試験の対象になる現実の集団について測定したデータと、理想的な集団について測定したデータでは数学的な取り扱いを変える必要があるということを発見しました。前節の例でいえば100人の人達は日本人という集団の標本——といって失礼なら代表——であって、決して日本人全体というわけではありません。したがって平均値60kgや標準偏差10kgという値もその100人の集団の要約値であって、日本人全体の要約値ではありません。

ところが我々が本当に知りたいのは日本人全体の要約値の方です。そうでなければ日本人全体に当てはまるような普遍的な法則は発見できません。つまり青春物語風にいえば、

「ああ、本当のことって何だろう……？青い空なんか大嫌いだーっ!!」

というわけです。この場合、日本人全体の集団のことを母集団(population)――ハハシュウダンではなく、ボシュウダンと読んでください――と呼び、100人の代表を標本集団(sample)と呼びます。本当は母集団を調べたいのは山々ですが、なにぶん相手がでかすぎて容易に調べられず、仕方なく手近な標本で我慢しているのです。

「標本集団の要約値から母集団の要約値を確率的に推測し、それによって母集団の様子を記述する」

というものです。この新しい統計学は推測統計学(inductive statistics)または真中を省略して推計学(stochastics)あるいは近代統計学と呼ばれています。そして現在では、単に統計学といえば近代統計学つまり推測統計学を指すことになっています。

その後、近代統計学はネイマン(Jerzy Neyman)やピアソン(Egon Sharpe Pearson)等の人々によりさらに発展し、ますます複雑怪奇になって我々庶民の頭を悩ませるに至っている次第です。

(2) 無作為抽出と準母集団

推測統計学では標本集団のデータに基づいて母集団の様子を確率的に推測します。そのため標本集団は母集団の正しい代表になるように注意深く選ばれなければなりません。幸いなことに、国会議員さん達と違って賄賂もコネも権力も入り込めない、文字通り公明正大な無作為抽出(random sampling)という標本抽出法が考案されています。

無作為というと、まるで「デタラメに」あるいは「いきあたりばったりに」標本を抽出するように思われるかもしれません。しかし標本抽出法でいう無作為とは、

「母集団を構成する個々の人または個体を等しい確率で抽出する」

という意味です。そのため無作為抽出では母集団の中の特定の人または特定の個体に偏ることがないように、無作為どころか乱数表などを使って大いに作為的に人または個体を選び出します。

アンケートを利用した世論調査などでは、対象とする母集団から標本集団を無作為抽出することが原理的には可能です。しかし医学や薬学の研究現場で行う実験や試験では、対象とする母集団から標本集団を無作為抽出することはほとんど不可能です。

例えば糖尿病患者を対象とした試験を行う場合、母集団は日本全体の糖尿病患者になります。その日本全体の糖尿病患者から標本集団を無作為抽出しようとすると、患者全員に番号を付けておき、乱数表などを利用して標本になる患者を抽出することになります。しかし日本全体の糖尿病患者を全員特定することは事実上不可能です。また時間の経過とともに患者数は流動的に変化するので、母集団を正確に特定することも原理的に不可能です。

このような時は、たまたま集められた標本集団(handy sample)の背景因子から母集団を逆に規定します。そのような母集団のことを準母集団(quasi-population)といいます。 背景因子(background factors)とは集団の特徴を表す項目のことであり、性別や年齢などの人口統計学的特性(demographic characteristics)が代表的です。例えば、たまたま集めた糖尿病患者100名は男女比が2対1で、年齢が40〜60歳だったとします。そうするとこの標本集団の準母集団は男女比が2対1で、年齢が40〜60歳という制限付きの集団になります。この制限付きの準母集団は日本全体の糖尿病患者という真の母集団とは少し異なります。

同じような内容の試験を行っても、試験によって全く違った結果になり、その解釈に苦しんだり、議論の的になったりすることがよくあります。実はそれは科学理論の問題ではなく、試験の準母集団の違いによることも多いようです。 試験のデータから得られた結論を適用できるのは、その試験の標本集団と同じ背景因子を持つ準母集団だけです。そのため同じような内容の試験でも、たまたま集められた標本集団の背景因子が異なり、その準母集団が異なっていれば違った結果になっても不思議ではありません。

試験を行う研究者がこのあたりの事情をよく認識していないことが、統計学不信の一因になっているようにも思われます。

(注1)　ゴールトンはダーウィンの従兄弟であり、悪名高い優生学の生みの親として知られる人類学者兼統計学者です。彼は親の身長から子供の身長を予測する方法の研究から相関係数を定義し、平均への回帰という現象を発見しました。

平均への回帰とは、親の身長が非常に高いと、その子供の身長は親よりも低くなり、親の身長が非常に低いと、その子供の身長は親よりも高くなって、平均値の方向に回帰する傾向があるという現象のことです。この平均への回帰現象が存在しないと、ある集団における身長のばらつきが次第に大きくなり、一定の範囲に収まらなくなってしまいます。この現象は身長だけでなく色々な値で観測されていて、これによってある集団の特徴が安定に保たれることになります。

また彼は指紋が人によって異なっていることを発見し、指紋の分類法を考案したことでも有名です。ただし指紋の個人性を最初に発見し、それが犯罪捜査に有用だと提案した最初の人物は彼ではなく、明治初期に宣教師兼医師として来日したフォールズ(Henry Faulds)です。フォールズは当時の日本で行われていた拇印の習慣を見て、指紋が人によって異なっていて、しかも生涯変わらないということを知り、それが犯罪捜査に有用だと気付いたのです。

一方、ピアソンは元々は政治学を専攻していて、科学哲学と数学的モデルの本質を研究することに関心を持っていました。しかしゴールトンの影響を受けて人類学と統計学の研究を始め、データの分布の歪み具合を表す歪度(わいど)と、分布の尖り具合を表す尖度(せんど)を定義しました。 (→2.2 パラメトリック手法とノンパラメトリック手法 (注4))

ちなみに統計学と同様に確率論も頭が痛くなる数学ですが、実は博打好きな貴族メレ(Chevalier De Mere)が友人の数学者パスカル(Blaise Pascal)に相談し、何とか賭けに勝とうとして開拓したものです。ですから難しげな数式や用語に惑わされず、気楽な気持ちで取り組みましょう。

(注2)　フィッシャーはゴールトンやピアソンと同じように人類学に興味を持っていて、遺伝学の進歩にも貢献しています。彼は確率論と統計学を遺伝学に応用し、有名なメンデル(Gregor Mendel)の遺伝に関する研究を数学的により厳密に拡張していきました。そしてその過程でメンデルの実験結果を詳しく検討し、データがあまりにも揃いすぎていて、本来ならあるはずの偶然誤差が異常に少ない(適合度検定の結果が適合しすぎる！)ことを発見しました。

フィッシャーの検討結果から、メンデルの実験データは揃いすぎていて、メイキングされた可能性が考えられるのです。ただしフィッシャーは、このメイキングはメンデル自身が行ったのではなく、彼の実験を手伝っていた助手が行った可能性があると考えました。主人思いの助手は、主人を喜ばせようとして、主人が望んでいるようなデータだけを提出したというのです。

前口上	目次	第1章	第2章	第3章	第4章	第5章	第6章	第7章	第8章	第9章	第10章
第11章	第12章	第13章	第14章	第15章	第16章	第17章	第18章	第19章	第20章	付録

1.2 推計学とは何ぞや？

(1) 記述統計学と推測統計学

(2) 無作為抽出と準母集団