二項分布の極限として導かれたもので、実験の測定誤差など大部分のデータはそのまま、あるいは適当な変数変換により正規分布をします。 統計学上最も広く応用されている基本的な分布で、平均μ、分散σ2の正規分布をN{μ,σ2}と書きます。

μ=0、σ2=12となるように、xを次のように標準化したzを正規偏位(NED、normal deviate)と呼びます。 そして、この時の正規分布を標準正規分布と呼び、N{0,12}と書きます。


erf(x)は誤差関数(Error function)と呼ばれる関数であり、標準正規分布において、データが-z(=-x√2)〜z(=x√2)の間に含まれる確率を表します。 ただしerf(x)は奇関数のため、xが負の場合は関数値が負になります。 また相補誤差関数(Complementary Error function)erfc(x)という関数も定義されていて、この関数はデータが-z〜zの間に含まれない確率を表します。



片側確率はp/2とします。

対数変換した変数y=ln(x)が正規分布に従う時、変数xの従う分布を対数正規分布またはジブラ分布(Gibrat's distribution)といいます。 yの平均をμy、分散をσy2とすると、その確率密度関数と確率分布関数は次のようになります。


xの平均をμx、中央値をμx'、幾何平均をμx*、分散をσx2、変動係数をCVxとすると、これらのパラメーターとyのパラメーターの間には次のような関係があります。





ここで、exの級数展開による近似式、




原理的には、変動係数が一定のデータすなわち比例尺度のデータは対数正規分布に従い、標準偏差が一定のデータすなわち間隔尺度のデータは通常の正規分布に従います。
正規分布N{μ,σ2}に従う母集団からn個の標本変量xiを取り出した時、そのxiを標準化した正規偏位ziの2乗和はχ2分布に従います。

この時、お互いに独立なziの個数を自由度(degree of freedom)といい、自由度nのχ2分布をχ2[n]と書きます。 μが未知の時は、標本平均で代用して次のようになります。


χ2の式を次のように変形すると、不偏分散Vに(n-1)/σ2を掛けた式になります。 このことから、不偏分散に(n-1)/σ2を掛けたものは自由度[n-1]のχ2分布をすることがわかります。


ガンマ関数Γ(x)は階乗関数n!を実数にまで拡張した関数であり、次のようなものです。

・φ=1の時

・φ=2の時


Γx(y)は不完全ガンマ関数であり、次のようなものです。
ガンマ関数の計算
・φ:偶数の時
・φ:奇数の時

両側確率は2pとします。
正規分布N{μ,σ2}に従う母集団からn個の標本変量xiを取り出し、標本平均mを求めて、これを標準化すると次のようになります。

χ2分布のところで説明したように、不偏分散Vに(n-1)/σ2を掛けた値はχ2になります。 そこで上式のχ2を不偏分散の式にすると、次のように標本平均mを不偏分散Vを用いて標準化した値になります。 σ2が未知の場合は、このように不偏分散を用いてmを標準化し、その値tは自由度[n-1]のt分布に従います。
t分布はn→∞の時、標準正規分布と一致します。




・φ=∞の時

ベータ関数Β(x,y)はガンマ関数を組み合わせた関数であり、次のようなものです。



・φ:奇数



・φ:偶数


・φ:奇数


・φ:偶数

片側確率はp/2とします。
互いに独立にχ2分布に従うχ12[φ1]、χ22[φ2]について、それぞれを自由度で割って比を取った値は、第1自由度φ1、第2自由度φ2のF分布に従います。
正規分布N{μ,σ2}に従う母集団から、互いに独立に2組の標本変量xi、xi'を取り出し、正規偏位の2乗和を作ると、


F分布には次のような性質があります。






・φ1=1の時

・φ2=∞の時


Βγ(x,y)は不完全ベータ関数であり、次のようなものです。
ここで、次のように置きます。
・φ1:奇数、φ2:奇数





・φ1:奇数・偶数、φ2:偶数
・φ1:偶数、φ2:偶数・奇数
両側確率は2pとします。
![図 付録.10 F[2,φ2]分布の片側p値](fig9910.png)
事象Aの起こる理論確率をπとし、n回中r回Aが起こる確率の分布を二項分布と呼びます。 これは二項検定や符号検定(π=0.5とした二項検定)に用いられます。





nが大きい時、二項分布は正規分布N{nπ,nπ(1-π)}によって近似できます。


両側確率は2pとし、2p>1ならば1にします。
つぼの中に白球S個、赤球F個が入っていて、m個取り出した時、白球a個、赤球(m-a)個となる確率の分布を超幾何分布と呼びます。 これは2×2分割表において、分類Aと分類Bが独立の時に、3.4 2標本の計数値の表3.18のような結果を得る確率に相当し、フィッシャーの直接確率計算法による検定に用いられます。
| 分類 | B1 | B2 | 計 |
|---|---|---|---|
| A1 | a | b | m |
| A2 | c | d | n |
| 計 | S | F | N |




S≦F、n、mかつad≧bcとなるように原表を置きなおし、


両側確率は2pとし、2p>1ならば1にします。
各種分布のパーセント点を計算するには、ニュートン(Newton)法を利用してp値から逆算します。 分布の値をz、それをp値に変換する関数をp(z)とすると、その手順は次のとおりです。
ただし、














収束しない場合は次の手順を実行します。
実際には、p(z)が指数関数的なため、対数変換したln{p(z)}を直線で近似します。 それには、次のようにテイラー(Taylor)展開を利用します。





この結果、z1はz*に近づくはずなので、z0をz1で更新して収束するまで(ii)以後をくり返します。