玄関雑学の部屋雑学コーナー統計学入門

(2) データに対応がある場合

医学や薬学では対応のない多標本のデータと同様、対応のある多標本のデータもしばしば登場します。 例えばある血圧降下剤の効果を調べるために5例の高血圧患者にその薬剤を継続投与し、投与前、投与1週後、投与2週後の最高血圧を測定した結果が表4.6のようになったとします。

表4.6 5例の血圧変化(mmHg)
投与前投与1週後投与2週後平均
1116106108330110
2128102100330110
3129108108345115
4137118114369123
5140116110366122
6505505401740-
平均130110108-116
標準誤差4.23.02.3-3.2

この場合、データを変動させる要因は各人の血圧の個人差と時期の2つと考えられ、このようにデータを変動させる意味のある要因が2つある場合を二元配置分散分析といいます。 各人の血圧の個人差を誤差と考えてしまえば、これは水準数が3である一元配置分散分析になります。 しかしこれは同じ人で時期を変えて3回測定した対応のあるデータですから、各人の血圧の個人差を誤差から分離して効率の良い分析をすることができます。

通常の二元配置分散分析では一方の要因は効果を分析するのが目的ではなく誤差を減らすのが目的であり、「ブロック因子」と呼ばれています。 では誤差に相当する要因は何でしょうか? それは、時期(または薬剤)による血圧の変動パターンが5例の人によって異なるという要因です。 平ったくいえば、血圧の下がりぐあいが人によって違っていることが誤差になるのです。 これを人(要因A)と時期(要因B)との交互作用(要因A×B)といい、二元配置分散分析における残差になります。

二元配置分散分析ではデータyijを次のように分解して考えます。

yij=μ+αijij
(yij-μ)=αijij
(yij-mT)=(mAi.-mT)+(m.Bj-mT)+(yij-y~ij)
  =(mAi.-mT)+(m.Bj-mT)+{yij-(mAi.+m.Bj-mT)}
μ≒mT:総平均
αi:要因A第i水準による変動  βj:要因B第j水準による変動
mAi.:要因A第i水準の平均  m.Bj:要因B第j水準の平均
y~ij=mAi.+m.Bj-mT:要因A第i水準における要因B第j水準の理論的推定値
εij:残差(AiとBjの交互作用)
図4.2 二元配置分散分析のグラフ的解釈

この基本式に対応する平方和、自由度、分散と、それらをまとめた分散分析表は次のとおりです。 (注1)

全体:平方和ST=Σ(yij-mT)2  自由度φT=データ数-1
分散VT= ST
――
φT
要因A:平方和SA=Σ(mAi.-mT)2  自由度φA=要因Aの水準数-1
分散VA= SA
――
φA
寄与率RA2= SA
―――
SA+SR
要因B:平方和SB=Σ(m.Bj-mT)2  自由度φB=要因Bの水準数-1
分散VB= SB
――
φB
寄与率RB2= SB
―――
SB+SR
残差:平方和SR=ST-SA-SB  自由度φRTAB
分散VR= SR
――
φR
標準偏差SD=√VR
表4.7 分散分析表(ANOVA table)
要因平方和SS自由度φ平均平方和Ms(分散V)分散比F
ASAφAVAFA=VA/VR
BSBφBVBFB=VB/VR
残差SRφRVR 
全体STφT 
・要因Aの検定
  帰無仮説H0:要因Aによってデータは変動しない。
  FA≧F(φAR,α)の時有意水準100・α%で有意
・要因Bの検定
  帰無仮説H0:要因Bによってデータは変動しない。
  FB≧F(φBR,α)の時有意水準100・α%で有意

有意水準5%として表4.6の例題について実際に計算すると、次のようになります。

表4.8 例題の分散分析表
要因平方和SS自由度φ平均平方和Ms(分散V)分散比F
4744118.55.780
時期1480274036.098
残差164820.5 
全体211814 
・要因A(人)
  FA=5.780 (p=0.0173)>F(4,8,0.05)=3.838…有意水準5%で有意
  RA2=0.743(74.3%)
・要因B(時期)
  FB=36.098 (p=0.0001)>F(2,8,0.05)=4.459…有意水準5%で有意
  RB2=0.900(90.0%)
 多重比較(ボンフェローニ型)
  投与前対投与1週後:to=6.984 p=0.0003
  投与前対投与2週後:to=7.683 p=0.0002
  投与1週後対投与2週後:to=0.698 p=1

以上の結果より、

統計的結論:時期によって平均最高血圧は変動し、薬剤投与前と比較して投与1週後、投与2週後では低下している。

血圧の自然変動が無視できるとして、医学の言葉に翻訳しますと、

医学的結論:薬剤投与により最高血圧は低下し、投与前130mmHgが1週後110mmHg、2週後108mmHgになった。

となります。 もし個人差の要因を無視して残差に含め、一元配置にしてしまいますと、

SR'=ST-SB=SA+SR=638  φR'=φAR=4+8=12
VR'= 638
――
12
≒53.167

となり、二元配置分散分析に比べて誤差が約3倍にもなってしまいます。 したがって、当然、検定や推定の精度は悪くなりますし、個人差に関する情報も得られません。 実は表4.6のデータは表4.1の対応のないデータを対応のあるデータにしたものですので、一元配置分散分析にした時の結果は表4.1の結果と同じになります。

FAが1より小さく、個人差の変動が誤差より小さい時には、それを残差に含めて一元配置分散分析にした方が検定や推定の精度は良くなります。 つまり要因Aの情報密度が誤差より薄いのですから、それを誤差にまぜてしまって誤差の情報密度を薄めるわけです。 このように対応のあるデータを対応のないデータとして扱って対応のない統計手法を適用した方が効率が良いのは、個人差や個体差による変動が誤差よりも小さい時だけです。 医学・薬学分野で扱うデータは個人差が大きいものが多いので、そのような場合はまずめったにありません。

また二元配置分散分析で要因Bの水準数が2つの時は対応のあるt検定に相当し、一元配置分散分析と同様にF値の平方根がt値に一致します。 この場合、要因Bの変動とは2時期の平均値の差に相当し、誤差(残差)である交互作用とは要因Bの変動パターンが個人によって異なっていること、すなわち2時期の差のバラツキに他ならず、したがって分散比Fはt値に相当することになります。 (注2) (→3.3 2標本の計量値)

要因Aの水準と要因Bの水準が同じという条件下で繰り返しデータが得られれば、交互作用も誤差から分離でき、同一条件群内におけるデータのバラツキが誤差になります。 例えば多数のマウスを雄・雌に分け、さらにそれらを各々3群に分けて(つまり全部で6群に分けて)同じ3種類の薬を投与し、薬の種類による効果の差(要因A)と、性による効果の差(要因B)を同時に調べようとする時などがこれに相当します。 このような場合の解析手法を「繰り返しのある二元配置分散分析」といいます。 そしてこの方法と区別するために、今まで説明した二元配置法を「繰り返しのない二元配置分散分析」と呼ぶことがあります。 (注3)

人間を対象とした臨床試験では、多数の患者を2群に分けて一方の群には薬剤A1を、もう一方の群には薬剤A2を投与し、特定の臨床評価項目を多時期にわたって観察することによって薬効を比較することがしばしばあります。 この場合、薬剤を要因A、時期を要因Bと考えますと繰り返しのある二元配置型になります。 しかし薬剤を無視しますと、このデザインは個人を要因A、時期を要因Bとした繰り返しのない二元配置型と考えることもできます。

繰り返しのある二元配置型と考えた時、同一薬剤投与群における同一時期の個人差が誤差になりますが、人間は個人差が大きいので個人差を誤差から分離した方が効率が良くなります。 そこで繰り返しのある二元配置型と繰り返しのない二元配置型を混合し、個人差を誤差から分離しつつ、要因Aを薬剤にするような特殊な手法が開発されました。 その手法を「繰り返し測定型二元配置分散分析」といい、臨床試験などでよく利用されています。 (注4)

繰り返しのある二元配置分散分析または繰り返し測定型二元配置分散分析では、要因Aの検定と要因Bの検定、そして要因AとBの交互作用の検定を行うことができます。 今、要因Aが群に相当するものでその水準が2個あり、要因Bが時期に相当するものでその水準が2個あるとします。 この時、A1のB1−B2、A2のB1−B2の平均値と、3種類の検定結果との関係を模式的に表すと次のようになります。

図4.3 繰り返しのある二元配置分散分析のグラフと検定結果

この模式図から、要因Aの検定はA1とA2のグラフの高さを比較検定したものに相当し、要因Bの検定はA1とA2を合わせた時のB1→B2のグラフの変動を検定したものに相当し、交互作用の検定はA1におけるB1→B2という変動パターンと、A2におけるB1→B2という変動パターンを比較検定したものに相当することがわかると思います。 このため要因Aの検定のことを「レベルの検定」、交互作用の検定のことを「パターンの検定」と呼ぶことがあります。 そして要因Bの水準が2つだけの時、パターンの検定はB1→B2の変化量をA1とA2で比較検定したものになります。

したがってA1が薬剤A1投与群、A2が薬剤薬剤A2投与群、そしてB1が薬剤投与前、B2が薬剤投与後とすると、交互作用の検定結果が有意になれば薬剤の効果が異なることになります。 ただし初期値が変化量に影響する時は、A1群とA2の初期値が異なっていると公平な比較ができません。 そこでB1におけるA1群の平均値とA2群の平均値を比較し、それがほぼ同じであることを確認しておく必要があります。 これはB1において、要因Aに関する一元配置分散分析を行うことによって確認することができます。 これを「初期値の比較」といい、薬剤の効果を比較したい時には必須になります。

分散分析は要因内の各水準はそれぞれ独立であり、お互いに無相関ということを前提にしています。 ところが同じ人が連続的に測定したデータは独立ではなく、お互いに相関があると考えられます。 したがって厳密にいいますと、このようなデータに対して時期を要因Bにした二元配置分散分析を適用するのは不適切で、本来は時系列解析を適用すべきです。 時系列解析は、連続測定された多時期のデータを、お互いの相関関係を考慮して総合的に解析するために開発された手法です。 しかし残念なことに時系列解析は現在はあまり一般的ではなく、生命表解析など特殊な手法しか用いられていません。 (→2.1 データの種類と統計手法)


(注1) 2つの要因A、Bの水準数をそれぞれa、bとして、表4.6を一般化しますと次のようになります。

表4.9 二元配置分散分析の一般的データ
要因B1BjBb平均
A1y11y1jy1bT1.m1.
::::::
Aiyi1yijyibTi.mi.
::::::
Aaya1yajyabTa.ma.
T.1T.jT.bTT
平均m.1m.jm.bmT

二元配置分散分析ではデータyijを次のように分解して考えます。

(yij-μ)=αijij
(yij-mT)=(mi.-mT)+(m.j-mT)+(yij-y~ij)
  =(mi.-mT)+(m.j-mT)+{yij-(mi.+m.j-mT)}
μ:総平均
αi:要因Aiによる変動分  βj:要因Bjによる変動分
y~ij=mi.+m.j-mT:要因Aiにおける要因Bjの理論的推定値
εij:残差(AiとBjの交互作用)

この基本式に対応する平方和、自由度、分散は次のとおりです。

総例数:n=a・b
全体:ST= a
Σ
i=1
b
Σ
j=1
(yij-mT)2=ΣΣyij2-n・mT2=ΣΣyij2- TT2
――
n
φT=n-1
VT= ST
――
φT
要因A:SA= a
Σ
i=1
b
Σ
j=1
(mi.-mT)2= a
Σ
i=1
Ti.2
―――
b
- TT2
――
n
φA=a-1
VA= SA
――
φA
E(VA)=bσA2R2
σA2= VA-VR
―――
b
寄与率RA2= SA
―――
SA+SR
要因B:SB= a
Σ
i=1
b
Σ
j=1
(m.j-mT)2= b
Σ
j=1
T.j2
―――
a
- TT2
――
n
φB=b-1
VB= SB
――
φB
E(VB)=aσB2R2
σB2= VB-VR
―――
b
寄与率RB2= SB
―――
SB+SR
残差:SR= a
Σ
i=1
b
Σ
j=1
{yij-(mi.+m.j-mT)}2 =ST-SA-SB
φR=n-(a+b-1)=φTAB
VR= SR
――
φR
SD=√VR
E(VR)=σR2

例題について実際に計算してみましょう。

ST=203958-201840=2118
φT=15-1=14
VT= 2118
―――
14
=1480
SA=202314-201840=474
φA=5-1=4
VA= 474
――
4
=118.5
RA2= 474
――
638
≒0.743(74.3%)
SB=203320-201840=1480
φB=3-1=2
VB= 1480
―――
2
=740
RB2= 1480
―――
1644
≒0.900(90.0%)
SR=2118-1480-474=164
φR=14-2-4=8
VR= 164
――
8
=20.5
FA= 118.5
―――
20.5
≒5.780 (p=0.0173)>F(4,8,0.05)=3.838
FB= 740
―――
20.5
≒36.098 (p=0.0001)>F(2,8,0.05)=4.459

前節(注3)のボンフェローニ型を用い、要因Bについて多重比較を行いますと次のようになります。

・投与前対投与1週後:
to= |130-110|
―――――――
√(2×20.5/5)
  ≒6.984 自由度8のt分布より p=0.0001×3=0.0003
・投与前対投与2週後:
to= |130-108|
―――――――
√(2×20.5/5)
  ≒7.683 自由度8のt分布より p=0.000006×3=0.0002
・投与1週後対投与2週後:
to= |110-108|
―――――――
√(2×20.5/5)
  ≒0.698 自由度8のt分布より p=0.5047×3=1.5141→p=1

シェッフェ型多重比較を用いると次のようになります。

・投与前対投与1週後:
to= (130-110)2
――――――――――
(1/5+1/5)×20.5×2
  ≒23.390 (p=0.0004)>F(2,8,0.05)=4.459
・投与前対投与2週後:
Fo= (130-108)2
――――――――――
(1/5+1/5)×20.5×2
  ≒29.512 (p=0.0002)>F(2,8,0.05)=4.459
・投与1週後対投与2週後:
Fo= (110-108)2
――――――――――
(1/5+1/5)×20.5×2
  ≒0.244 (p=0.7892)>F(2,8,0.05)=4.459

(注2) 二元配置分散分析において、要因Bの水準数bを2にすると次のようになります。

ST= a
Σ
i=1
2
Σ
j=1
yij2- TT2
――
n
= a
Σ
i=1
yi12+ a
Σ
i=1
yi22- TT2
――
n
φT=n-1
SB= 2
Σ
j=1
T.j2
―――
a
- TT2
――
n
= T.12
―――
a
+ T.22
―――
a
- (T.1+T.2)2
――――――
2a
  = 2T.12+2T.22-T.12-2T.1T.2-T.22
―――――――――――――――
2a
  = T.12-2T.1T.2+T.22
―――――――――
2a
  = (a・m.1-a・m.2)2
―――――――――
2a
  =m.d2 a

2
φB=2-1=1
VB= SB
――
φB
= SB
SR=ST-SA-SB
 =Σyi12+Σyi22- TT2
――
n
T.j2
――
a
- TT2
――
n
Ti.2
―――
2
- TT2
――
n
 =Σyi12+Σyi22- Σ(yi1+yi2)2
――――――
2
- T.12+T.22
―――――
a
+ (T.1+T.2)2
―――――
2a
 = Σyi12-2Σyi1yi2+Σyi22
――――――――――――
2
T.12-2T.1T.2+T.22
―――――――――
2a
 = Σ(yi1-yi2)2
―――――――
2
- (Σyi1-Σyi2)2
――――――――
2a
 = Σdi2-(Σdi)2/a
――――――――
2
= Sdd
――
2
φR=n-1-a
VR= SR
――
φR
= Sdd/2
―――
a-1
= Vd
――
2
FB= VB
――
VR
= md2・a/2
―――――
Vd/2
 ={ md
―――――
√(Vd/a)
}2 =to2

以上のように、二元配置分散分析で時期数が2つの時は対応のあるt検定と一致します。 対応のあるt検定よりも分散分析の方がきめの細かい分析が可能ですので、対応のある2標本の場合にも本当は分散分析を適用するべきです。 3.3節表3.6のデータに二元配置分散分析を適用すると、次のように確かに対応のあるt検定の結果と一致します。 (→3.3 2標本の計量値)

表4.10 3.3節例題の分散分析表
要因平方和SS自由度φ平均平方和Ms(分散V)分散比F
10059111.6673.073
時期500150013.761
残差327936.333 
全体183219 
・要因A(人)
 FA≒3.073 (p=0.0549)<F(1,9,0.05)=5.117…有意水準5%で有意ではない
 RA2≒0.755(75.5%)
・要因B(時期)
 FB≒13.761 (p=0.0048)>F(1,9,0.05)=5.117…有意水準5%で有意
 √(FB)=√13.761≒3.710=to
 √{F(1,9,0.05)}=√5.117≒2.262=t(9,0.05)
 RB2≒0.605(60.5%)

(注3) 繰り返しのある二元配置分散分析では、データを次のように分解して考えます。

表4.11 繰り返しのある二元配置分散分析の一般的データ
要因AB1BjBb平均
A1y111y1j1y1b1T1.1m1.1
:::::
y11ky1jky1bkT1.km1.k
:::::
y11r1y1jr1y1br1T1.r1m1.r1
A1内計T11.T1j.T1b.T1..
A1内平均m11.m1j.m1b.m1..
::::::
Aiyi11yij1yib1Ti.1mi.1
:::::
yi1kyijkyibkTi.kmi.k
:::::
yi1riyijriyibriTi.rimi.ri
Ai内計Ti1.Tij.Tib.Ti..
Ai内平均mi1.mij.mib.mi..
::::::
Aaya11yaj1yab1Ta.1ma.1
:::::
ya1kyajkyabkTa.kma.k
:::::
ya1rayajrayabraTa.rama.ra
Aa内計Ta1.Taj.Tab.Ta..
Aa内平均ma1.maj.mab.ma..
T.1.T.j.T.b.TT
平均m.1.m.j.m.b.mT
(yijk-μ)=αijijijk
(yijk-mT)=(mi..-mT)+(m.j.-mT)+(mij.-m~ij.)+(yijk-mij.)
  =(mi..-mT)+(m.j.-mT)
   +{mij.-(mi..+m.j.-mT)}+(yijk-mij.)
μ:総平均  αi:要因Aiによる変動分  βj:要因Bjによる変動分
γij:要因Aiと要因Bjの交互作用による変動分
εijk:Ai・Bjカラムにおけるk番目のデータの誤差
m~ij.=mi..+m.j.-mT:Ai・Bjカラムの理論的推定平均値
図4.4 繰り返しのある二元配置分散分析のグラフ的解釈
Aiの繰り返し数:ri(要因Bに関して一定)
総例数:n=b( a
Σ
i=1
ri)=bΣri
全体:ST= a
Σ
i=1
b
Σ
j=1
ri
Σ
k=1
(yijk-mT)2=ΣΣΣyijk2- TT2
――
n
φT=n-1
VT= ST
――
φT
要因A:SA= a
Σ
i=1
b
Σ
j=1
ri
Σ
k=1
(mi..-mT)2= a
Σ
i=1
Ti..2
―――
b・ri
- TT2
――
n
φA=a-1
VA= SA
――
φA
寄与率RA2= SA
―――
SA+SR
E(VA)=briσA2R2
σA2= VA-VR
―――
bri
要因B:SB= a
Σ
i=1
b
Σ
j=1
ri
Σ
k=1
(m.j.-mT)2= b
Σ
j=1
T.j.2
―――
Σri
- TT2
――
n
φB=b-1
VB= SB
――
φB
E(VB)=排iσB2R2
σB2= VB-VR
―――
i
寄与率RB2= SB
―――
SB+SR
交互作用A×B:SAB= a
Σ
i=1
b
Σ
j=1
ri
Σ
k=1
(mij.-mT)2
    = a
Σ
i=1
b
Σ
j=1
Tij.2
―――
ri
TT2
――
n
φAB=a・b-1
SAxB= a
Σ
i=1
b
Σ
j=1
ri
Σ
k=1
{mij.-(mi..+m.j.-mT)}2 =SAB-SA-SB
φAxBABAB=a・b-a-b+1=(a-1)(b-1)
VAxB= SAxB
―――
φAxB
E(VAxB)=riσAxB2R2
σAxB2= VAxB-VR
――――
ri
寄与率RAxB2= SAxB
――――
SAxB+SR
残差:SR= a
Σ
i=1
b
Σ
j=1
ri
Σ
k=1
(yijk-mij.)2=ST-SAB
φRTAB=n-a・b
VR= SR
――
φR
SD=√VR
E(VR)=σR2
ST=SAB+SR=SA+SB+SAxB+SR
表4.12 分散分析表(ANOVA table)
要因平方和SS自由度φ平均平方和Ms(分散V)分散比F
ASAφAVAFA=VA/VR
BSBφBVBFB=VB/VR
A×BSAxBφAxBVAxBFAxB=VAxB/VR
残差SRφRVR 
全体STφT 

SABは要因Aの第i水準と要因Bの第j水準におけるr個のデータを、それらの平均値mij.ただ1つで代表させた時の全変動で、「級間平方和」と呼ばれています。 繰り返し数が1である繰り返しのない二元配置分散分析では、級間平方和は全変動の平方和になります。

交互作用の多重比較は、Scheffe型一般対比の考え方を応用して次のようになります。

Fo= Σ(mpj.-mqj.)2-b(mp..-mq..)2
―――――――――――――――
(1/rp+1/rq)VR・φAxB
Fo≧F(φAxBR,α)の時有意水準100・α%で有意

交互作用が小さくてFAxBが1より小さい時は、交互作用を残差にプールして繰り返しのない二元配置分散分析にした方が誤差が小さくなり効率が良くなります。

表4.13 交互作用を残差にプールした分散分析表(ANOVA table)
要因平方和SS自由度φ平均平方和
Ms(分散V)
分散比F
ASAφAVAFA=VA/VR'
BSBφBVBFB=VB/VR'
残差SR'=SAxB+SRφR'AxBRVR' 
全体STφT 

(注4) 繰り返し測定型二元配置分散分析では、データを次のように分解して考えます。

表4.14 繰り返し測定型二元配置分散分析の一般的データ
要因A(群)個体時期B1時期Bj時期Bb平均
A11y111y1j1y1b1T1.1m1.1
::::::
ky11ky1jky1bkT1.km1.k
::::::
r1y11r1y1jr1y1br1T1.r1m1.r1
A1内計 T11.T1j.T1b.T1..
A1内平均 m11.m1j.m1b.m1..
:::::::
Ai1yi11yij1yib1Ti.1mi.1
::::::
kyi1kyijkyibkTi.kmi.k
::::::
riyi1riyijriyibriTi.rimi.ri
Ai内計 Ti1.Tij.Tib.Ti..
Ai内平均 mi1.mij.mib.mi..
:::::::
Aa1ya11yaj1yab1Ta.1ma.1
::::::
kya1kyajkyabkTa.kma.k
::::::
raya1rayajrayabraTa.rama.ra
Aa内計 Ta1.Taj.Tab.Ta..
Aa内平均 ma1.maj.mab.ma..
T.1.T.j.T.b.TT
平均m.1.m.j.m.b.mT
(yijk-μ)=αisikjijijk
(yijk-mT)=(mi..-mT)+(mi.k-mi..)
       +(y~ijk-mi.k)+(y~~ijk-y~ijk)+(yijk-y~~ijk)
  =(mi..-mT)+(mi.k-mi..)+{(mi.k+m.j.-mT)-mi.k}
   +{(mi.k+mij.-mi..)-(mi.k+m.j.-mT)}
   +{yijk-(mi.k+mij.-mi..)}
  =(mi..-mT)+(mi.k-mi..)+(m.j.-mT)
   +{mij.-(mi..+m.j.-mT)}+{yijk-(mi.k+mij.-mi..)}
μ:総平均  αi:群Aiによる変動分
εsik:群Aiにおける個体kの群内誤差
βj:時期Bjによる変動分  γij:群Aiと時期Bjの交互作用による変動分
εijk:群Aiの時期Bjにおける個体kの群内交互作用
y~ijk=mi.k+m.j.-mT:群Aiにおける個体kの時期Bjの理論的推定値
y~~ijk=mi.k+mij.-mi..:群Aiにおける個体kの時期Bjの群別理論的推定値
図4.5 繰り返し測定型二元配置分散分析のグラフ的解釈
群Aiの個体数:ri
全個体数= a
Σ
i=1
ri=Σri
総データ数:n=bΣri
全体:ST= a
Σ
i=1
b
Σ
j=1
ri
Σ
k=1
(yijk-mT)2=ΣΣΣyijk2- TT2
――
n
φT=n-1
VT= ST
――
φT
群A:SA= a
Σ
i=1
b
Σ
j=1
ri
Σ
k=1
(mi..-mT)2= a
Σ
i=1
Ti..2
―――
b・ri
- TT2
――
n
φA=a-1
VA= SA
――
φA
寄与率RA2= SA
――――
SA+SSR
個体:Ssub= a
Σ
i=1
b
Σ
j=1
ri
Σ
k=1
(mi.k−mT)2= a
Σ
i=1
ri
Σ
k=1
Ti.k2
―――
b
- TT2
――
n
φsub=Σri-1
Vsub= Ssub
―――
φsub
寄与率Rsub2= Ssub
――――――
Ssub+SSRxB
個体残差:SSR= a
Σ
i=1
b
Σ
j=1
ri
Σ
k=1
(mi.k-mi..)2=Ssub-SA
  = a
Σ
i=1
ri
Σ
k=1
Ti.k2
―――
b
- a
Σ
i=1
Ti..2
―――
b・ri
φSRsubA=Σri-a
VSR= SSR
――
φSR
時期B:SB= a
Σ
i=1
b
Σ
j=1
ri
Σ
k=1
(m.j.-mT)2= b
Σ
j=1
T.j.2
―――
Σri
- TT2
――
n
φB=b−1
VB= SB
――
φB
寄与率RB2= SB
―――――
SB+SSRxB
交互作用A×B:SAB= a
Σ
i=1
b
Σ
j=1
ri
Σ
k=1
(mij.-mT)2
    = a
Σ
i=1
b
Σ
j=1
Tij.2
―――
ri
- TT2
――
n
φAB=a・b-1
SAxB= a
Σ
i=1
b
Σ
j=1
ri
Σ
k=1
{mij.-(mi..+m.j.-mT)}2=SAB-SA-SB
φAxBABAB=a・b-a-b+1=(a-1)(b-1)
VAxB= SAxB
―――
φAxB
寄与率RAxB2= SAxB
――――――
SAxB+SSRxB
個体残差SR×時期B:
 SSRxB= a
Σ
i=1
b
Σ
j=1
ri
Σ
k=1
{yijk-(mi.k+mij.-mi..)}2
    =ST-SA-SSR-SB-SAxB=ST-Ssub-SB-SAxB
φSRxBTASRBAxB=(n-a)(b-1)
VSRxB= SSRxB
――――
φSRxB
SD=√VSRxB
ST=SA+SSR+SB+SAxB+SSRxB=Ssub+SB+SAxB+SSRxB
表4.15 分散分析表(ANOVA table)
要因平方和SS自由度φ平均平方和
Ms(分散V)
分散比F
A(群)SAφAVAFA=VA/VSR
個体残差SSRφSRVSR 
個体SsubφsubVsubFsub=Vsub/VSRxB
B(時期)SBφBVBFB=VB/VSRxB
A×BSAxBφAxBVAxBFAxB=VAxB/VSRxB
個体残差×BSSRxBφSRxBVSRxB 
全体STφT 

Ssubは群を無視して個体を要因Aと考えた時の全変動で、個体差を表します。 SAxBは群と時期との交互作用で、群ごとの時期変動パターンの違いつまり群平均の時期変動パターンの違いを表します。 SSRxBは個体残差と時期との交互作用で、各群における個体の時期変動パターンの違い、つまり群平均の時期変動パターンと個体の時期変動パターンの違いを表します。

この分散分析表において、個体より上は個体を全変動とし、群を要因A、個体残差を誤差とした一元配置分散分析になっていて、個体より下は個体を要因A、時期を要因B、個体残差×時期Bを誤差とした二元配置分散分析になっていることがわかると思います。 つまり群の検定は対応のない検定になり、それ以外の検定は対応のある検定になるわけです。

群ごとの時期変動パターンの違いが小さくてFAxBが1より小さい時は、群と時期との交互作用A×Bを個体残差×時期Bにプールした方が誤差が小さくなり効率が良くなります。 この場合、個体より下は個体と時期の繰り返しのない二元配置分散分析に相当します。

表4.16 交互作用を個体残差×Bにプールした分散分析表(ANOVA table)
要因平方和SS自由度φ平均平方和
Ms(分散V)
分散比F
A(群)SAφAVAFA=VA/VSR
個体残差SSRφSRVSR 
個体SsubφsubVsubFsub=Vsub/VSxB
B(時期)SBφBVBFB=VB/VSxB
個体×BSSxB=SAxB+SSRxBφSxBAxBSRxBVSRxB 
全体STφT 

また個体差が少なくてFsubが1より小さい時は、個体残差を個体残差×時期Bにプールして、一般的な繰り返しのある二元配置分散分析にした方が誤差が小さくなり効率が良くなります。

表4.17 個体残差を個体残差×Bにプールした分散分析表(ANOVA table)
要因平方和SS自由度φ平均平方和
Ms(分散V)
分散比F
A(群)SAφAVAFA=VA/VR
B(時期)SBφBVBFB=VB/VR
A×BSAxBφAxBVAxBFAxB=VAxB/VR
残差SR=SSR+SSRxBφSRxBSRSRxBVR 
全体STφT