統計学入門−付録

この「統計学入門」で解説した統計学は、現在、最も広く用いられているネイマン・ピアソン流統計学を中心にしています。統計学にはこれ以外にも色々な流派があります。その流派のひとつであるベイズ統計学(ベイジアン統計学、Bayesian Statistics)について簡単に紹介しましょう。ベイズ統計学はベイズの定理(Bayes's theorem)に基づいた統計学ですから、まずはベイズの定理について説明しましょう。

ベイズの定理は18世紀の牧師兼数学者であるベイズ(Thomas Bayes)によって発見された、逆確率つまり原因の確率に関する定理です。そして逆確率は近代確率論の創始者であるラプラス(Simon de Laplace)によって確立された確率概念です。確率の乗法定理から、ある事象E₁(例えば病気)が起こる確率と、別の事象E₂(例えば発熱)が起こる確率、そしてそれらが同時に起こる確率について次の関係が成り立ちます。

P(E₁)：E₁が起こる確率　　P(E₂)：E₂が起こる確率　　P(E₁ ∩ E₂)：E₁とE₂が同時に起こる確率
P(¬E₁)：E₁が起きない確率　　P(¬E₂)：E₂が起きない確率　　P(¬E₁ ∩ ¬E₂)：E₁とE₂がどちらも起きない確率
P(E₁|E₂)：E₂が起きたという条件下でE₁が起こる条件付き確率　　P(E₂|E₁)：E₁が起きたという条件下でE₂が起こる条件付き確率
P(E₁ ∩ E₂) = P(E₁)P(E₂|E₁) = P(E₂)P(E₁|E₂)

この関係式を変形するとP(E₁|E₂)について次のような式が成り立ちます。これがベイズの定理です。ベイズの定理の特徴はこの関係がE₁とE₂の因果関係や時間的な前後関係とは無関係に成り立つことです。

例えばE₁が病気でP(E₁) = 0.2とし、E₂が発熱でP(E₂) = 0.4とし、病気が原因で発熱する確率がP(E₂|E₁) = 0.8とすると、この状態を図6.1のように表すことができます。そしてベイズの定理から、発熱E₂が起きた時にその原因が病気E₁である逆確率はP(E₁|E₂) = P(E₁∩E₂)/P(E₂) = 0.16/0.4 = 0.4であることがわかります。

このようにベイズの定理を利用すると、発熱した後でその原因が病気である逆確率を計算できます。つまり過去に起こった事柄に基いてこれから起こる事柄の確率を計算するという「結果の確率を計算する」のではなく、現在起きている事柄に基づいて過去に起きたであろう事柄の確率を計算するという「原因の確率(逆確率)を計算できる」のです。

また病気E₁が起こる一般的な確率P(E₁)を事前確率(prior probability)とし、発熱が起きた時にその原因が病気である条件付き逆確率P(E₁|E₂)を事後確率(posterio probability)とすると、病気が原因で発熱する条件付き確率P(E₂|E₁)は発熱の原因が病気である尤度(もっともらしさ、likelihood)に相当します。したがってベイズの定理の分子P(E₁)P(E₂|E₁)は「事前確率×尤度」を表します。

一方、分母P(E₂)はE₂(発熱)が起きる確率を表し、これはは分子の値を0〜1の間にするための規格化因子です。これらのことからベイズの定理の本質的な部分は分子であり、「事後確率＝事前確率×尤度(情報)」という関係を表していることがわかります。 (→9.3 １変量の場合 (1) 尤度と最尤法)

例えば病気と発熱の例では、発熱という情報がなければ「病気である逆確率は0.2」という一般論的なことしかいえません。ところが発熱したという情報と発熱に関する病気の尤度を知ることによって、「病気である逆確率は0.4」と少し確実なことがいえるわけです。次節で説明するように、この理論は実際に病気の診断に応用されています。

2.ベイズ流仮説検定

第9章の図9.2.1において、疾患群がE₁で、診断項目の値が境界値以上になるつまり陽性になることをE₂とすると、この図と図付録6.1は次のような対応関係があります。そしてベイズの定理から陽性予測値――検査結果が陽性の時に本当に疾患である確率――を求めることができます。さらに陰性予測値も同様にベイズの定理から求めることができます。 (→9.2 群の判別と診断率)

P(E₁) = π_D…疾患の事前確率　　P(¬E₁) = 1 - π_D…正常の事前確率　　n_D…疾患の例数　　n_N…正常の例数

…感度(真陽性率) 　　

…特異度(真陰性率)

…偽陽性率
P(E₁ ∩ E₂) = P(E₁)P(E₂|E₁) = π_DSN 　　P(¬E₁ ∩ E₂)=P(¬E₁)P(E₂|¬E₁) = (1 - π_D)(1 - SP)
P(E₂) = P(E₁ ∩ E₂) + P(¬E₁ ∩ E₂) = π_DSN + (1 - π_D)(1 - SP)…陽性率

…陽性予測値(陽性的中率)

…陽性尤度比＝ベイズ因子

また図9.2.1の正常群の分布を帰無仮説が正しい時の標本平均値の分布とみなし、疾患群の分布を対立仮説が正しい時の標本平均値の分布とみなすと、これは第1章の図1.6.3の統計的仮説検定の模式図(片側検定)に相当します。そして境界値を棄却域の上限m_Uとみなすと、偽陽性率(1 - SP)がαエラーに相当し、偽陰性率(1 - SN)がβエラーに相当します。

ベイズ統計学における仮説検定は、通常の統計的仮説検定と違って棄却域を設定しません。その代わり帰無仮説が正しい事前確率と標本平均値の確率分布、そして対立仮説が正しい事前確率――図9.2.1における疾患の事前確率π_D――と標本平均値の確率分布を何らかの方法で設定します。そしてデータから得られた標本平均値を図1.6.3のm_Uとみなし、ベイズの定理を利用して事前確率とαとβから対立仮説が正しい事後確率――図9.2.1における陽性予測値――を求めます。

しかし対立仮説が正しい事前確率が明確にわかっていれば、わざわざ検定をする必要はありません。そのため対立仮説が正しい事前確率は漠然としているのが普通であり、その結果として対立仮説が正しい事後確率も漠然としたものになってしまいます。そこで事前確率とは無関係に求められる(1 - β)/αをベイズ因子(Bayes factor)と呼び、対立仮説の信頼性の指標にします。ベイズ因子は通常の統計的仮説検定における実際の検出力と有意確率の比に相当する値です。そのためこの値を指標にして検定結果を吟味することは、有意確率と検出力分析の結果を指標にして検定結果を吟味することに対応します。

実際のベイズ流仮説検定では対立仮説の信頼性の指標であるベイズ因子をBF₁₀と表記し、帰無仮説の信頼性の指標であるベイズ因子をBF₀₁と表記します。そしてBF₁₀は陽性尤度比SN/(1 - SP) = (1 - β)/αに相当し、BF₀₁は陰性尤度比(1 - SN)/SP = β/(1 - α)に相当します。これらのベイズ因子については次のような基準値が提唱されています。

3.ベイズ流推定

表付録6.1 ベイズ因子の基準値
ベイズ因子	証拠の強さ
	帰無仮説を支持することに反対する証拠がほとんどない
	帰無仮説を支持することに反対する証拠があまりない
	帰無仮説を支持することに反対する証拠が十分にある
	帰無仮説を支持することに反対する強い証拠がある
	帰無仮説を支持することに反対する決定的証拠がある

1＜BF₁₀≦3.2	対立仮説を支持する証拠がほとんどない
3.2＜BF₁₀≦10	対立仮説を支持する証拠があまりない
10＜BF₁₀≦32	対立仮説を支持する証拠が十分にある
32＜BF₁₀≦100	対立仮説を支持する強い証拠がある
100＜BF₁₀	対立仮説を支持する決定的証拠がある

ベイズ統計学はベイズの定理に基づく「事前確率×尤度(情報)＝事後確率」という考え方と、確率を主観的なものと解釈する考え方を中心にして統計学を再構築したものです。従来の統計学では確率を頻度的なものと解釈します。それに対してベイズ統計学では確率を主観的なものと解釈します。例えばコインを投げて表が出る確率は従来の頻度的確率でもベイズ確率でも0.5にします。しかし「100万年前に火星に生命が存在した確率」は頻度的確率では定義できないのに対して、ベイズ確率では例えば0.001と定義できます。

つまり頻度的確率はランダム性に基づいて「不確かさ」を定量化するのに対して、ベイズ確率は情報不足に基づいて「不確かさ」を定量化するのです。そうしないと「原因の確率」つまり「すでに起きてしまったことの確率(すでに起きてしまったことだから確率は0か1、または確率そのものを定義することができないんじゃないの…!?)」を合理的に解釈することはできません。

ベイズ統計学では、ベイズの定理に基づいた次のような式を用いて理論を組み立てます。

p(θ)：母数θに関する確率関数＝事前分布(prior distribution) … ベイズの定理におけるP(E₁)に相当
p(x|θ)：母数がθである時にデータxが観測される条件付き確率関数 … ベイズの定理におけるP(E₂|E₁)に相当
p(θ|x)：データxが観測された時に母数がθである条件付き確率関数＝事後分布(posterio distribution) … ベイズの定理におけるP(E₁|E₂)に相当
∫p(θ)p(x|θ)dθ：母数θが全領域について変化した時にデータxが観測される累積確率 … ベイズの定理におけるP(E₂)に相当

事前分布はどんなものでもかまいませんが、例えば正規分布N(μ₀,σ₀²)とすると、上記の式から次のような関係を導くことができます。これは平方完成(completion of the square)と呼ばれる展開であり、ベイズ推定(Bayesian inference)における点推定になります。

μ₀：事前分布における母平均値(事前情報) 　　σ₀²：事前分布における母分散(事前情報)
μ₁：事後分布における母平均値　　σ₁²：事後分布における母分散
n：観測データの例数　　m_x：観測データから求めた標本平均(母平均推測値) 　　V：観測データから求めた不偏分散(母分散推測値)

この式からμ₁はμ₀とm_xの信頼性(誤差の逆数)で重み付けした加重平均値になることと、μ₁の誤差は情報が増えた分だけ少なくなることがわかります。事前情報μ₀がない時はσ₀² = ∞として、次のようにネイマン・ピアソン流統計学の結果と一致します。

また事前情報μ₀が絶対的な時はσ₀² = 0として、次のようにどんなm_xが得られてもμ₁ = μ₀になります。

ベイズ推定による母数の点推定量は事後分布の母数そのものですから、事後分布を利用して区間推定を行うことができます。例えば上記のμ₁が95％含まれる範囲は事後分布N(μ₁,σ₁²)を利用して比較的簡単に求めることができます。これをベイズ信用区間(Bayes credible interval)またはベイズ確信区間といいます。ネイマン・ピアソン流の95％信頼区間は「母数が入っている信頼区間を得る確率が95％である」と、少々ややこしい解釈をしなければないないシロモノです。それに対して95％ベイズ信用区間は「母数が95％の確率で含まれている区間」と素直に解釈できます。

ただしベイズ信用区間は母数の事前情報に依存しています。そのため事前情報が正確ならベイズ信用区間も正確ですが、事前情報が曖昧ならベイズ信用区間も曖昧になってしまいます。そして事前情報がない時、ベイズ信用区間はネイマン・ピアソン流の信頼区間と一致します。医学研究では事前情報が曖昧だからこそ試験を行ったり、事前情報を用いて組み立てた作業仮説を検証するために試験を行ったりするのが普通です。そのため現実的にはネイマン・ピアソン流統計学の結果とベイズ統計学の結果はたいてい一致します。

4.3囚人問題とモンティ・ホール問題

一般的な確率つまり結果の確率と逆確率つまり原因の確率の違いを端的に表す問題として、3囚人問題(Three Prisoners problem)またはモンティ・ホール問題(Monty Hall problem)が有名です。

(1) 3囚人問題

(2) モンティ・ホール問題

少し考えれば、これら2種類の問題はどちらもAとCの逆確率つまり原因の確率を求める問題に帰着し、本質的に同じものであることがわかると思います。一般的な確率つまり結果の確率は過去に起きた出来事に基いて、これから起きる出来事の確率を表す値です。この確率はランダム性に基いて未来に起きる出来事の確からしさを表す値であり、実際に出来事が起きた後は「0」か「1」に確定します。

それに対して逆確率つまり原因の確率は現在起きている出来事に基いて、過去に起きたであろう出来事の確率を推測して表す値です。この確率は情報不足に基いて過去に起きた出来事の確からしさを表す値であり、情報が増えて過去に起きた出来事が特定できれば「0」か「1」に収束します。

3人の囚人のうち恩赦を受ける囚人が選ばれる前、または3つの扉の後ろに景品を隠す前の段階では、「恩赦を受ける」または「景品が隠される」確率つまり結果の確率はどれも1/3です。そして恩赦を受ける囚人が決まった後、または扉の後ろに景品を隠した後の段階では、結果の確率は選ばれたものは1になり、選ばれなかったものは0になります。したがって2種類の問題の通常の確率つまり結果の確率に関する解答は、どちらもAとCの確率は0または1という身も蓋もないものになります。

しかし2種類の問題の本質はAとCの逆確率つまり原因の確率を求めることです。そこで3囚人問題について、囚人Aと囚人Cが恩赦になる原因の確率をベイズの定理を利用して求めてみましょう。この場合、起こり得る事象と、それが起こる確率は次のようになります。

P(A) = 1/3：囚人Aが恩赦になる確率　　P(B) = 1/3：囚人Bが恩赦になる確率　　P(C) = 1/3：囚人Cが恩赦になる確率
P(b|A) = 0 〜 1：囚人Aが恩赦になるという条件下で、看守が「囚人Bは死刑になる」と答える条件付き確率
P(c|A) = 1 〜 0：囚人Aが恩赦になるという条件下で、看守が「囚人Cは死刑になる」と答える条件付き確率
P(b ∪ c|A) = 1：囚人Aが恩赦になるという条件下で、看守が「囚人Bは死刑になる」または「囚人Cは死刑になる」と答える条件付き確率
P(A ∩ b) = P(A)P(b|A) = 0 〜 1/3：囚人Aが恩赦になり、かつ看守が「囚人Bは死刑になる」と答える確率
P(A ∩ c) = P(A)P(c|A) = 1/3 〜 0：囚人Aが恩赦になり、かつ看守が「囚人Cは死刑になる」と答える確率
P(A ∩ (b ∪ c)) = 1/3：囚人Aが恩赦になり、かつ看守が「囚人Bは死刑になる」または「囚人Cは死刑になる」と答える確率
P(c|B) = 1：囚人Bが恩赦になるという条件下で、看守が「囚人Cは死刑になる」と答える条件付き確率
P(b|C) = 1：囚人Cが恩赦になるという条件下で、看守が「囚人Bは死刑になる」と答える条件付き確率
P(B ∩ c) = P(B)P(c|B) = 1/3：囚人Bが恩赦になり、かつ看守が「囚人Cは死刑になる」と答える確率
P(C ∩ b) = P(C)P(b|C) = 1/3：囚人Cが恩赦になり、かつ看守が「囚人Bは死刑になる」と答える確率
P(b) = P(A)P(b|A) + P(C)P(b|C) = 0 〜 1/3 + 1/3：看守が「囚人Bは死刑になる」と答える確率

：看守が「囚人Bは死刑になる」と答えた時、囚人Aが恩赦になる逆確率

またP(b|A) = 1、つまり囚人Aが恩赦になるという条件下では、看守は必ず「囚人Bは死刑になる」と答える仮定も可能です。例えば囚人AとBは仲間であり、囚人BとCがどちらも死刑になるのなら、看守は囚人Aに囚人Bのことを教えてあげようとしたとか、単に独房の番号が小さい方の囚人のことを教えた……などという場合です。この仮定をするとP(A)P(b|A) = 1/3、P(b) = 2/3になり、P(A|b) = 1/2、P(C|b) = 1/2つまり囚人Aが助かる確率も囚人Cが助かる確率も1/2に上るという、囚人Aが思った通りの解答になります。

さらにP(b|A) = 0、つまり囚人Aが恩赦になるという条件下では、看守は必ず「囚人Cは死刑になる」と答える仮定も可能です。この仮定をするとP(A)P(b|A) = 0、P(b) = 1/3になり、P(A|b) = 0、P(C|b) = 1つまり囚人Aが助かる確率は0で、囚人Cが助かる確率は1になります。以上のことから、この問題の回答は囚人Aが助かる確率は厳密には0 〜 1/2だが、とりあえず最も妥当な値は1/3と考え、囚人Cが助かる確率は(1 - 囚人Aが助かる確率)として求めるという、少々ややこしいものになります。

原因の確率がこのように変動する理由は、図付録6.2の模式図を見れば何となくわかると思います。原因の確率は、事象が起こった後で色々な情報に基づいて起こった可能性のある事象を限定して求めます。この問題の場合、起こり得る事象は模式図の(1)から(4)までの4種類あります。そして看守の「囚人Bは死刑になる」という情報から、起こった可能性のある事象は(1)と(4)だけに限定できます。

この状態で(1)が起きる結果の確率と(4)が起きる結果の確率がわかれば、原因の全確率1をそれらの確率で比例配分して、それぞれの事象の原因の確率を計算することができます。これがベイズの定理を利用した原因の確率の計算原理です。

しかしこの場合、(4)が起きる結果の確率は1/3と確定していますが、(1)が起きる結果の確率は不明であり、理論的には0〜1/3の間になります。もし(1)が起きる結果の確率が最小値の0なら、(1)の原因の確率は0、(4)の原因の確率は1になります。もし(1)が起きる結果の確率が中間の1/6なら、(4)が起きる結果の確率の半分になり、(1)の原因の確率は1/3、(4)の原因の確率は2/3になります。もし(1)が起きる結果の確率が最大値の1/3なら、(4)が起きる結果の確率と同じ値になり、(1)と(4)の原因の確率はどちらも1/2になります。これらのことから囚人Aが助かる確率は最大でも囚人Cが助かる確率と同じであり、普通はそれよりも小さくなることがわかります。

モンティ・ホール問題ではそれをキーポイントにし、選ぶ扉を変えると景品を獲得する確率が上がるかどうかを問題にしています。この問題の確率も、扉Aが当たりの時にホストが扉BまたはCのどちらを開けることにしていたのか不明なので厳密には計算できません。もしホストが2つの扉のひとつを無作為に開けることにしていたとしたら扉Aが当たりの確率は1/3であり、アルファベットの前の方を開けることにしていたとしたら扉Aが当たりの確率は1/2であり、アルファベットの後の方を開けることにしていたとしたら扉Aが当たりの確率は0になります。

いずれにせよ扉Aが当たりの確率は最大でも扉Cが当たりの確率と同じであり、普通はそれよりも小さくなります。したがってこの問題の解答は扉を変えた方が良いになります。そして扉を変えない時に景品を獲得する確率として最も可能性が高いのは1/3だが、0も1/2も間違いではないということになります。

囚人Aが「これで俺が助かる確率が1/3から1/2に上がった！」と思ってしまった原因は、看守から「囚人Bは死刑になる」と聞いた時点で、「3人に１人が恩赦になる」という状況が「２人に１人が恩赦になる」という状況に変わったと単純に思ってしまったところにあります。あるいはもう少し考えて、看守が「囚人Bは死刑になる」と答えた時に有り得る事象は図付録6.2の(1)と(4)だけであり、それらの事象が起きる確率は等しいと単純に思ってしまったからかもしれません。

この1/2という確率は決して間違いではないものの、この値を導き出した考え方は間違っています。このあたりが結果の確率と原因の確率の大きな違いであり、3囚人問題またはモンティ・ホール問題の面白いところです。

5.ベイズ統計学とネイマン・ピアソン流統計学

このようにベイズ統計学は事前情報とデータから得られた情報を組み合わせて、事前情報をより確実性の高いものに更新していきます。これは我々が日常的に行っている経験的思考法と同じですから、ネイマン・ピアソン流統計学よりもむしろ馴染みやすいと思います。しかし事前情報とその確実性を恣意的に決めることができるので、どうしても主観的になりがちです。そのため客観的な情報が少なく(つまり頻度的な確率を求めにくい)、個人の経験やカンに基づいた情報に頼りがちな分野、例えば人文科学分野に適していると思います。

それに対して医学や薬学などの自然科学分野では、事前情報をそのまま信用せず、それに基づいて仮説を組み立て、客観的なデータによってその仮説の真偽を検証して理論を構築するのが主流です。そして必要に応じて実験や試験を何度も繰り返すことができるので(つまり頻度的な確率を求めやすい)、ネイマン・ピアソン流統計学の方が適していると思います。

また自然科学分野では、画期的な観測方法が発明されて新しい観測データが得られると、それまでの自然観が覆されて全く新しい自然観が誕生するパラダイムシフトが起きることがたまにあります。例えば天動説から地動説へのパラダイムシフトがその代表例です。

この種のパラダイムシフトは経験的思考法ではなかなか起こりません。つまり素朴な観測結果に基いた天動説という事前情報を正しいと考えると、望遠鏡の発明によって新しい観測データが得られても、プトレマイオスの周転円を用いた精緻な天動説モデルは導けますが、天動説という事前情報を真っ向から否定する地動説は導けないのです。地動説を導くためには天動説という事前情報をそのまま信用せず、それを単なる仮説と考え、新しい観測データに基いて批判的に検討する必要があります。

そこで近代科学は経験的思考法の代わりに批判的思考法(critical thinking)を重視し、仮説演繹法という厳密な検討手順を確立しました。そして客観的なデータに基づいて仮説を検証するための数学的ツールのひとつとして統計学を用います。このことからネイマン・ピアソン流統計学が客観的な情報が得られやすくて批判的思考法を重視する自然科学分野向きであるのに対して、ベイズ統計学は客観的な情報が少なくて個人の経験や勘に基いた経験的思考法に頼りがちな人文科学分野向きであることがわかると思います。 (→1.8 科学的研究の種類　(1)仮説演繹法)

近代確率論の創始者であり、逆確率の概念の確立者でもあるラプラスはベイズ統計学を積極的に使用しました。しかし近代統計学の創始者であり、尤度の概念の確立者でもあるフィッシャー(Rinald Aylmer Fisher)は主観に左右されやすい事前確率を統計学から排除しようとして、ベイズ統計学を激しく批判しました。ところが彼が愛用する尤度は逆確率と親和性が高いので、彼の統計学はベイズ統計学と親和性が高く、ベイズ統計学に対する批判は彼の統計学に対する批判にもなってしまいました。

そのため事前情報に基づいて帰無仮説と対立仮説を設定することにより、事前確率を統計学から完全に排除することに成功したのはネイマンとピアソンでした。そして彼等の理論はフィッシャーの統計学をも改革することになり、現在のネイマン・ピアソン流統計学が確立したのです。

いずれにせよネイマン・ピアソン流統計学もベイズ統計学も一長一短があり、万能ではありません。そのためそれらの特徴をよく理解して、目的に応じて適切に使い分けることが大切です。

前口上	目次	第1章	第2章	第3章	第4章	第5章	第6章	第7章	第8章	第9章	第10章
第11章	第12章	第13章	第14章	第15章	第16章	第17章	第18章	第19章	第20章	付録

付録6　ベイズ統計学

1.ベイズの定理

2.ベイズ流仮説検定

3.ベイズ流推定

4.3囚人問題とモンティ・ホール問題

(1) 3囚人問題

(2) モンティ・ホール問題

5.ベイズ統計学とネイマン・ピアソン流統計学

付録6 ベイズ統計学

1.ベイズの定理

2.ベイズ流仮説検定

3.ベイズ流推定

4.3囚人問題とモンティ・ホール問題

(1) 3囚人問題

(2) モンティ・ホール問題

5.ベイズ統計学とネイマン・ピアソン流統計学

付録6　ベイズ統計学