玄関雑学の部屋雑学コーナー統計学入門

(2) データに対応がある場合

1) 二元配置分散分析

医学や薬学では対応のない多標本のデータと同様、対応のある多標本のデータもしばしば登場します。 例えばある血圧降下剤の効果を調べるために5例の高血圧患者にその薬剤を継続投与し、投与前、投与1週後、投与2週後の最高血圧を測定した結果が表4.6のようになったとします。

表4.6 5例の血圧変化(mmHg)
投与前投与1週後投与2週後平均
1116106108330110
2128102100330110
3129108108345115
4137118114369123
5140116110366122
6505505401740-
平均130110108-116
標準誤差4.23.02.3-3.2

この場合、データを変動させる要因は各人の血圧の個人差と時期の2つと考えられ、このようにデータを変動させる意味のある要因が2つある場合を二元配置分散分析といいます。 各人の血圧の個人差を誤差と考えてしまえば、これは水準数が3である一元配置分散分析になります。 しかしこれは同じ人で時期を変えて3回測定した対応のあるデータですから、各人の血圧の個人差を誤差から分離して効率の良い分析をすることができます。

通常の二元配置分散分析では一方の要因は効果を分析するのが目的ではなく誤差を減らすのが目的であり、「ブロック因子」と呼ばれています。 では誤差に相当する要因は何でしょうか? それは、時期(または薬剤)による血圧の変動パターンが5例の人によって異なるという要因です。 平ったくいえば、血圧の下がりぐあいが人によって違っていることが誤差になるのです。 これを人(要因A)と時期(要因B)との交互作用(要因A×B)といい、二元配置分散分析における残差になります。

二元配置分散分析ではデータyijを次のように分解して考えます。

yij=μ+αijij
(yij-μ)=αijij
(yij-mT)=(mAi.-mT)+(m.Bj-mT)+(yij-y~ij)
  =(mAi.-mT)+(m.Bj-mT)+{yij-(mAi.+m.Bj-mT)}
μ≒mT:総平均
αi:要因A第i水準による変動  βj:要因B第j水準による変動
mAi.:要因A第i水準の平均  m.Bj:要因B第j水準の平均
y~ij=mAi.+m.Bj-mT:要因A第i水準における要因B第j水準の理論的推定値
εij:残差(AiとBjの交互作用)
図4.2 二元配置分散分析のグラフ的解釈

この基本式に対応する平方和、自由度、分散と、それらをまとめた分散分析表は次のとおりです。 (注1)

全体:平方和ST=Σ(yij-mT)2  自由度φT=データ数-1
分散VT= ST
――
φT
要因A:平方和SA=Σ(mAi.-mT)2  自由度φA=要因Aの水準数-1
分散VA= SA
――
φA
寄与率RA2= SA
―――
SA+SR
要因B:平方和SB=Σ(m.Bj-mT)2  自由度φB=要因Bの水準数-1
分散VB= SB
――
φB
寄与率RB2= SB
―――
SB+SR
残差:平方和SR=ST-SA-SB  自由度φRTAB
分散VR= SR
――
φR
標準偏差SD=√VR
表4.7 分散分析表(ANOVA table)
要因平方和SS自由度φ平均平方和Ms(分散V)分散比F
ASAφAVAFA=VA/VR
BSBφBVBFB=VB/VR
残差SRφRVR 
全体STφT 
・要因Aの検定
  帰無仮説H0:要因Aによってデータは変動しない。
  FA≧F(φAR,α)の時有意水準100・α%で有意
・要因Bの検定
  帰無仮説H0:要因Bによってデータは変動しない。
  FB≧F(φBR,α)の時有意水準100・α%で有意

有意水準5%として表4.6の例題について実際に計算すると、次のようになります。

表4.8 例題の分散分析表
要因平方和SS自由度φ平均平方和Ms(分散V)分散比F
4744118.55.780
時期1480274036.098
残差164820.5 
全体211814 
・要因A(人)
  FA=5.780 (p=0.0173)>F(4,8,0.05)=3.838…有意水準5%で有意
  RA2=0.743(74.3%)
・要因B(時期)
  FB=36.098 (p=0.0001)>F(2,8,0.05)=4.459…有意水準5%で有意
  RB2=0.900(90.0%)
 多重比較(ボンフェローニ型)
  投与前対投与1週後:to=6.984 p=0.0002
  投与前対投与2週後:to=7.683 p=0.0001

以上の結果より、統計的結論は次のようになります。

統計的結論:時期によって平均最高血圧は変動し、薬剤投与前と比較して投与1週後、投与2週後では低下している。

血圧の自然変動が無視できるとして、医学の言葉に翻訳すると次のようになります。

医学的結論:薬剤投与により最高血圧は低下し、投与前130mmHgが1週後110mmHg、2週後108mmHgになった。

もし個人差の要因を無視して残差に含めて一元配置にしてしまうと、次のように二元配置分散分析に比べて誤差が約3倍にもなってしまいます。 その結果、当然、検定や推定の精度は悪くなりますし、個人差に関する情報も得られません。

SR'=ST-SB=SA+SR=638  φR'=φAR=4+8=12
VR'= 638
――
12
≒53.167

実は表4.6のデータは表4.1の対応のないデータを対応のあるデータにしたものですので、一元配置分散分析にした時の結果は表4.1の結果と同じになります。

FAが1より小さく、個人差の変動が誤差より小さい時には、それを残差に含めて一元配置分散分析にした方が検定や推定の精度は良くなります。 つまり要因Aの情報密度が誤差より薄いのですから、それを誤差にまぜてしまって誤差の情報密度を薄めるわけです。 このように対応のあるデータを対応のないデータとして扱って対応のない統計手法を適用した方が効率が良いのは、個人差や個体差による変動が誤差よりも小さい時だけです。 医学・薬学分野で扱うデータは個人差が大きいものが多いので、そのような場合はまずめったにありません。

また二元配置分散分析で要因Bの水準数が2つの時は対応のあるt検定に相当し、一元配置分散分析と同様にF値の平方根がt値に一致します。 この場合、要因Bの変動とは2時期の平均値の差に相当し、誤差(残差)である交互作用とは要因Bの変動パターンが個人によって異なっていること、すなわち2時期の差のバラツキに他ならず、したがって分散比Fはt値に相当することになります。 (注2) (→3.3 2標本の計量値)

なお二元配置分散分析では要因Aと要因Bの検定を行うため、最低でも検定を2回行います。 そのため「検定を複数回行う時は必ず多重比較が必要である!」と誤解している人は、要因Aの検定も多重比較にする必要があると考えるかもしれません。 しかし要因Aと要因Bはそれぞれ目的が異なる独立した検定であり、これらを総合して最終的な1つの結論を採用することはありません。 したがって要因Aの検定を多重比較にする必要はありません。

2) 繰り返しのある二元配置分散分析

要因Aの水準と要因Bの水準が同じという条件下で繰り返しデータが得られれば、交互作用も誤差から分離でき、同一条件群内におけるデータのバラツキが誤差になります。 例えば多数のマウスを雄・雌に分け、さらにそれらを各々3群に分けて(つまり全部で6群に分けて)同じ3種類の薬を投与し、薬の種類による効果の差(要因A)と、性による効果の差(要因B)を同時に調べようとする時などがこれに相当します。

このような場合の解析手法を「繰り返しのある二元配置分散分析」といいます。 そしてこの方法と区別するために、前節で説明した二元配置法を「繰り返しのない二元配置分散分析」と呼ぶことがあります。 (注3)

人間を対象とした臨床試験では、多数の患者を2群に分けて一方の群には薬剤A1を、もう一方の群には薬剤A2を投与し、特定の臨床評価項目を多時期にわたって観察することによって薬効を比較することがしばしばあります。 この場合、薬剤を要因A、時期を要因Bと考えると繰り返しのある二元配置型になります。 しかし薬剤を無視すると、このデザインは個人を要因A、時期を要因Bとした繰り返しのない二元配置型と考えることもできます。

繰り返しのある二元配置型と考えた時、同一薬剤投与群における同一時期の個人差が誤差になりますが、人間は個人差が大きいので個人差を誤差から分離した方が効率が良くなります。 そこで繰り返しのある二元配置型と繰り返しのない二元配置型を混合し、個人差を誤差から分離しつつ、要因Aを薬剤にするような特殊な手法が開発されました。 その手法を「繰り返し測定型二元配置分散分析(two-way repeated measures analysis of variace、two-way RMANOVA)」といい、臨床試験などでよく利用されています。 (注4)

繰り返しのある二元配置分散分析または繰り返し測定型二元配置分散分析では、要因Aの検定と要因Bの検定、そして要因AとBの交互作用の検定を行うことができます。 今、要因Aが群に相当するものでその水準が2個あり、要因Bが時期に相当するものでその水準が2個あるとします。 この時、A1のB1−B2、A2のB1−B2の平均値と、3種類の検定結果との関係を模式的に表すと次のようになります。

図4.3 繰り返しのある二元配置分散分析のグラフと検定結果

この模式図から、要因Aの検定はA1とA2のグラフの高さを比較検定したものに相当し、要因Bの検定はA1とA2を合わせた時のB1→B2のグラフの変動を検定したものに相当し、交互作用の検定はA1におけるB1→B2という変動パターンと、A2におけるB1→B2という変動パターンを比較検定したものに相当することがわかると思います。 このため要因Aの検定のことを「レベルの検定」、交互作用の検定のことを「パターンの検定」と呼ぶことがあります。 そして要因Bの水準が2つだけの時、パターンの検定はB1→B2の変化量をA1とA2で比較検定したもの、つまり要因Aに関する変化量の一元配置分散分析に相当します。

したがってA1が薬剤A1投与群、A2が薬剤A2投与群、そしてB1が薬剤投与前、B2が薬剤投与後とすると、交互作用の検定結果が有意になれば薬剤の効果が異なることになります。 ただし初期値が変化量に影響する時は、A1群とA2の初期値が異なっていると公平な比較ができません。 そこでB1におけるA1群の平均値とA2群の平均値を比較し、それがほぼ同じであることを確認しておく必要があります。 これはB1において、要因Aに関する一元配置分散分析を行うことによって確認することができます。 これを「初期値の比較」といい、薬剤の効果を比較したい時には必須になります。

時期数が3つ以上の時、つまり薬剤投与後の時期が2つ以上ある時に薬剤の効果を比較するのは少々複雑です。 例えばA1群とA2群において、薬剤投与前、薬剤投与1週後、薬剤投与2週後の3時期で値を測定したとします。 この場合は、まず最初にA1群とA2群の薬剤投与前の平均値を比較し、それがほぼ同じであることを確認します。

次に薬剤投与1週後の値と薬剤投与2週後の値から薬剤投与前の値を引いて、それぞれの時期の変化量を求めます。 そしてその変化量をデータとし、薬剤投与1週後をB1、薬剤投与2週後をB2として、繰り返しのある二元配置分散分析または繰り返し測定型二元配置分散分析を適用します。

そうすると、要因Aの検定はA1群とA2群の2つの時期の変化量の平均値が異なっているかどうかの検定、つまり投与後の変化量全体が群によって異なっているかどうかの検定になります。 したがってこの検定結果が有意の時は、薬剤A1と薬剤A2の効果が異なっていることになります。

要因Bの検定は、2つの群を合わせた時の変化量が時期によって異なっているかどうかの検定になります。 したがってこの検定結果が有意の時は、薬剤の効果が時期によって異なっていることになります。

交互作用の検定は、2つの時期の変化量の変動パターンが群によって異なっているかどうかの検定になります。 したがってこの検定結果が有意の時は、薬剤A1と薬剤A2では効果の発現時期が異なっていることになります。

以上の3種類の検定結果を検討することによって、薬剤A1と薬剤A2の効果を詳細に比較することができます。 例えば図4.3の右下のグラフで縦軸を変化量=薬剤の効果とすると、投与1週後では2つの薬剤の効果はほとんど変わらず、投与2週後になると薬剤A1は効果が落ちるものの、薬剤A2は効果が持続する、そして全体としては薬剤A2の方が効果が高い、といった詳細な比較をすることができます。

また要因Aを薬剤の有無にし、要因Bを食事療法の有無にした場合、要因Aは薬剤の効果を表し、要因Bは食事療法の効果を表し、交互作用は薬剤と食事療法の間に相乗効果または相殺効果があるかどうかを表します。 例えば図4.6で縦軸を薬効とし、横軸を食事療法の有無とすると、薬剤無−食事療法有無のグラフと薬剤有−食事療法有無のグラフが非平行かどうか、つまり交互作用があるかどうかで薬剤と食事療法の関係が相乗効果、相加効果、相殺効果のどれであるかを検討することができます。

二元配置デザイン
要因B:食事療法の有無
要因A:薬剤の有無群1群2
群3群4
図4.6 相乗効果と相加効果と相殺効果
○プラセボ効果=2、薬剤効果=10、食事療法効果=5とする
・交互作用=2の時:相乗効果…薬剤有のグラフと薬剤無のグラフが非平行
 薬剤有かつ食事療法有の薬効=プラセボ効果(2)+薬剤効果(10)+食事療法効果(5)+交互作用(2)=19
・交互作用=0の時:相加効果…薬剤有のグラフと薬剤無のグラフが平行
 薬剤有かつ食事療法有の薬効=プラセボ効果(2)+薬剤効果(10)+食事療法効果(5)+交互作用(0)=17
・交互作用=-2の時:相殺効果…薬剤有のグラフと薬剤無のグラフが非平行
 薬剤有かつ食事療法有の薬効=プラセボ効果(2)+薬剤効果(10)+食事療法効果(5)-交互作用(2)=15

このように二元配置分散分析は応用範囲の広い手法であり、動物実験から臨床試験まで色々な場合に利用されています。 ただし二元配置分散分析を臨床試験に利用する時は、注意しなければならない点があります。 それは分散分析は要因内の各水準はそれぞれ独立であり、お互いに無相関であることを前提にしている点です。

動物実験の場合は、要因内の各水準を独立にすることは比較的容易です。 しかし臨床試験では繰り返し測定型のデータ、つまり同じ人が時期を変えて連続的に測定して得られたデータが多く、このようなデータは独立ではなくお互いに相関があると考えられます。 このため厳密に言えば、繰り返し測定型のデータに対して時期を要因Bにした二元配置分散分析を適用するのは不適切であり、本来は時系列解析を適用すべきです。

時系列解析は、連続測定された多時期のデータを、お互いの相関関係を考慮して総合的に解析するために開発された手法です。 しかし残念なことに時系列解析は現在はあまり一般的ではなく、ホルター心電図データの解析など、特殊な場合しか用いられていません。 (→2.1 データの種類と統計手法)


(注1) 2つの要因A、Bの水準数をそれぞれa、bとして、表4.6を一般化すると次のようになります。

表4.9 二元配置分散分析の一般的データ
要因B1BjBb平均
A1y11y1jy1bT1.m1.
::::::
Aiyi1yijyibTi.mi.
::::::
Aaya1yajyabTa.ma.
T.1T.jT.bTT
平均m.1m.jm.bmT

二元配置分散分析ではデータyijを次のように分解して考えます。

(yij-μ)=αijij

μ:総平均
αi:要因Aiによる変動分  βj:要因Bjによる変動分
:要因Aiにおける要因Bjの理論的推定値
εij:残差(AiとBjの交互作用)

この基本式に対応する平方和、自由度、分散は次のとおりです。

総例数:n=a・b
全体:
φT=n-1

要因A:
φA=a-1

E(VA)=bσA2R2

寄与率
要因B:
φB=b-1

E(VB)=aσB2R2

寄与率
残差:
φR=n-(a+b-1)=φTAB


E(VR)=σR2

表4.6のデータについて実際に計算すると次のようになります。

ST=203958-201840=2118
φT=15-1=14

SA=202314-201840=474
φA=5-1=4


SB=203320-201840=1480
φB=3-1=2


SR=2118-1480-474=164
φR=14-2-4=8


前節(注3)のボンフェローニ型を用い、要因Bについて多重比較を行うと次のようになります。

・投与前対投与1週後:
 
 自由度8のt分布より p(8,6.984)=0.0001
 ∴p=0.0001×2=0.0002
・投与前対投与2週後:
 
 自由度8のt分布より p(8,7.683)=0.00006
 ∴p=0.00006×2=0.0001

シェッフェ型多重比較を用いると次のようになります。

・投与前対投与1週後:
 
・投与前対投与2週後:
 

(注2) 二元配置分散分析において、要因Bの水準数bを2にすると次のようになります。

n=2a

φT=n-1=2a-1

φB=2-1=1
VB=SB

φR=n-a-1=a-1

以上のように、二元配置分散分析で時期数が2つの時は対応のあるt検定と一致します。 対応のあるt検定よりも分散分析の方がきめの細かい分析が可能なので、対応のある2標本の場合にも本当は分散分析を適用するべきです。 第3章第3節 表3.6のデータに二元配置分散分析を適用すると、次のように確かに対応のあるt検定の結果と一致します。 (→3.3 2標本の計量値)

表4.10 3.3節例題の分散分析表
要因平方和SS自由度φ平均平方和Ms(分散V)分散比F
10059111.6673.073
時期500150013.761
残差327936.333 
全体183219 
・要因A(人)
 FA≒3.073(p=0.0549)<F(1,9,0.05)=5.117…有意水準5%で有意ではない
 RA2≒0.755(75.5%)
・要因B(時期)
 FB≒13.761(p=0.0048)>F(1,9,0.05)=5.117…有意水準5%で有意
 
 
 RB2≒0.605(60.5%)

(注3) 繰り返しのある二元配置分散分析では、データを次のように分解して考えます。

表4.11 繰り返しのある二元配置分散分析の一般的データ
要因AB1BjBb平均
A1y111y1j1y1b1T1.1m1.1
:::::
y11ky1jky1bkT1.km1.k
:::::
y11r1y1jr1y1br1T1.r1m1.r1
A1内計T11.T1j.T1b.T1..
A1内平均m11.m1j.m1b.m1..
::::::
Aiyi11yij1yib1Ti.1mi.1
:::::
yi1kyijkyibkTi.kmi.k
:::::
yi1riyijriyibriTi.rimi.ri
Ai内計Ti1.Tij.Tib.Ti..
Ai内平均mi1.mij.mib.mi..
::::::
Aaya11yaj1yab1Ta.1ma.1
:::::
ya1kyajkyabkTa.kma.k
:::::
ya1rayajrayabraTa.rama.ra
Aa内計Ta1.Taj.Tab.Ta..
Aa内平均ma1.maj.mab.ma..
T.1.T.j.T.b.TT
平均m.1.m.j.m.b.mT
(yijk-μ)=αijijijk

μ:総平均  αi:要因Aiによる変動分  βj:要因Bjによる変動分
γij:要因Aiと要因Bjの交互作用による変動分
εijk:Ai・Bjカラムにおけるk番目のデータの誤差
:Ai・Bjカラムの理論的推定平均値
図4.4 繰り返しのある二元配置分散分析のグラフ的解釈
Aiの繰り返し数:ri(要因Bに関して一定)
総例数:
全体:
φT=n-1

要因A:
φA=a-1

寄与率
E(VA)=b riσA2R2

要因B:
φB=b-1

E(VB)=排iσB2R2

寄与率
交互作用A×B:
φAB=a・b-1

φAxBABAB=a・b-a-b+1=(a-1)(b-1)

E(VAxB)=riσAxB2R2

寄与率
残差:
φRTAB=n-a・b


E(VR)=σR2
ST=SAB+SR=SA+SB+SAxB+SR
表4.12 分散分析表(ANOVA table)
要因平方和SS自由度φ平均平方和Ms(分散V)分散比F
ASAφAVAFA=VA/VR
BSBφBVBFB=VB/VR
A×BSAxBφAxBVAxBFAxB=VAxB/VR
残差SRφRVR 
全体STφT 

SABは、要因Aの第i水準と要因Bの第j水準におけるr個のデータを、それらの平均値mij.ただ1つで代表させた時の全変動であり、「級間平方和」と呼ばれています。 繰り返し数が1である繰り返しのない二元配置分散分析では、級間平方和は全変動の平方和になります。

交互作用の多重比較は、Scheffe型一般対比の考え方を応用して次のようになります。


Fo≧F(φAxBR,α)の時有意水準100α%で有意

交互作用が小さくてFAxBが1より小さい時は、交互作用を残差にプールして、繰り返しのない二元配置分散分析にした方が誤差が小さくなり効率が良くなります。

表4.13 交互作用を残差にプールした分散分析表(ANOVA table)
要因平方和SS自由度φ平均平方和
Ms(分散V)
分散比F
ASAφAVAFA=VA/VR'
BSBφBVBFB=VB/VR'
残差SR'=SAxB+SRφR'AxBRVR' 
全体STφT 

(注4) 繰り返し測定型二元配置分散分析では、データを次のように分解して考えます。

表4.14 繰り返し測定型二元配置分散分析の一般的データ
要因A(群)個体時期B1時期Bj時期Bb平均
A11y111y1j1y1b1T1.1m1.1
::::::
ky11ky1jky1bkT1.km1.k
::::::
r1y11r1y1jr1y1br1T1.r1m1.r1
A1内計 T11.T1j.T1b.T1..
A1内平均 m11.m1j.m1b.m1..
:::::::
Ai1yi11yij1yib1Ti.1mi.1
::::::
kyi1kyijkyibkTi.kmi.k
::::::
riyi1riyijriyibriTi.rimi.ri
Ai内計 Ti1.Tij.Tib.Ti..
Ai内平均 mi1.mij.mib.mi..
:::::::
Aa1ya11yaj1yab1Ta.1ma.1
::::::
kya1kyajkyabkTa.kma.k
::::::
raya1rayajrayabraTa.rama.ra
Aa内計 Ta1.Taj.Tab.Ta..
Aa内平均 ma1.maj.mab.ma..
T.1.T.j.T.b.TT
平均m.1.m.j.m.b.mT
(yijk-μ)=αisikjijijk

μ:総平均  αi:群Aiによる変動分
εsik:群Aiにおける個体kの群内誤差
βj:時期Bjによる変動分  γij:群Aiと時期Bjの交互作用による変動分
εijk:群Aiの時期Bjにおける個体kの群内交互作用
:群Aiにおける個体kの時期Bjの理論的推定値
:群Aiにおける個体kの時期Bjの群別理論的推定値
図4.5 繰り返し測定型二元配置分散分析のグラフ的解釈
群Aiの個体数:ri

総データ数:
全体:
φT=n-1

群A:
φA=a-1

寄与率
個体:


寄与率
個体残差:


時期B:
φB=b−1

寄与率
交互作用A×B:
φAB=a・b-1

φAxBABAB=a・b-a-b+1=(a-1)(b-1)

寄与率
個体残差SR×時期B:

φSRxBTASRBAxB=(n-a)(b-1)


ST=SA+SSR+SB+SAxB+SSRxB=Ssub+SB+SAxB+SSRxB
表4.15 分散分析表(ANOVA table)
要因平方和SS自由度φ平均平方和
Ms(分散V)
分散比F
A(群)SAφAVAFA=VA/VSR
個体残差SSRφSRVSR 
個体SsubφsubVsubFsub=Vsub/VSRxB
B(時期)SBφBVBFB=VB/VSRxB
A×BSAxBφAxBVAxBFAxB=VAxB/VSRxB
個体残差×BSSRxBφSRxBVSRxB 
全体STφT 

Ssubは群を無視して個体を要因Aと考えた時の全変動であり、個体差を表します。 SAxBは群と時期との交互作用であり、群ごとの時期変動パターンの違いつまり群平均の時期変動パターンの違いを表します。 SSRxBは個体残差と時期との交互作用であり、各群における個体の時期変動パターンの違い、つまり群平均の時期変動パターンと個体の時期変動パターンの違いを表します。

この分散分析表において、個体より上は個体を全変動とし、群を要因A、個体残差を誤差とした一元配置分散分析になっていて、個体より下は個体を要因A、時期を要因B、個体残差×時期Bを誤差とした二元配置分散分析になっていることがわかると思います。 つまり群の検定は対応のない検定になり、それ以外の検定は対応のある検定になるわけです。

群ごとの時期変動パターンの違いが小さくてFAxBが1より小さい時は、群と時期との交互作用A×Bを個体残差×時期Bにプールした方が誤差が小さくなり、効率が良くなります。 この場合、個体より下は個体と時期の繰り返しのない二元配置分散分析に相当します。

表4.16 交互作用を個体残差×Bにプールした分散分析表(ANOVA table)
要因平方和SS自由度φ平均平方和
Ms(分散V)
分散比F
A(群)SAφAVAFA=VA/VSR
個体残差SSRφSRVSR 
個体SsubφsubVsubFsub=Vsub/VSxB
B(時期)SBφBVBFB=VB/VSxB
個体×BSSxB=SAxB+SSRxBφSxBAxBSRxBVSRxB 
全体STφT 

また個体差が少なくてFsubが1より小さい時は、個体残差を個体残差×時期Bにプールして、一般的な繰り返しのある二元配置分散分析にした方が誤差が小さくなり効率が良くなります。

表4.17 個体残差を個体残差×Bにプールした分散分析表(ANOVA table)
要因平方和SS自由度φ平均平方和
Ms(分散V)
分散比F
A(群)SAφAVAFA=VA/VR
B(時期)SBφBVBFB=VB/VR
A×BSAxBφAxBVAxBFAxB=VAxB/VR
残差SR=SSR+SSRxBφSRxBSRSRxBVR 
全体STφT 

表4.14のデータで、要因Aにも対応のある時がたまにあります。 例えば同じ被験者に対して、最初は薬剤1を投与して糖負荷試験を行ない、0分、30分、60分、120分の4時点で血糖値を観測し、次に薬剤2を投与して糖負荷試験を行ない、やはり0分、30分、60分、120分の4時点で血糖値を観測したとします。 そしてこのデータを用いて、2種類の薬剤の糖代謝に与える影響を比較したいとします。

この時、要因Aを薬剤すると、要因Aの2つの水準にも対応があることになります。 このようなデータには、本来は被験者を要因A、薬剤を要因B、時期を要因Cとした三元配置分散分析を適用します。 しかし三元配置分散分析は複雑な手法で、結果の解釈も難しいため、実際の研究現場で用いられることはほとんどありません。 そのためこのような場合も、薬剤1を投与した時の被験者と薬剤2を投与した時の被験者は別々の被験者と考えて、繰り返し測定型二元配置分散分析を適用することが多いと思います。

厳密に言えば、このような試験デザインは、時期によって薬剤の影響は変わらないことと、最初に投与した薬剤1の影響が後で投与する薬剤2の結果に影響を与えない──つまり薬剤1の持ち越し効果がないことが前提になっています。 しかし実際には時期によって薬剤の影響が変わること大いに有り得ますし、薬剤の持ち越し効果も有り得ます。 したがってこのような試験デザインは不適切であり、本来は薬剤1を投与する被験者と薬剤2を投与する被験者は別々にし、糖負荷試験を同時に行うデザインにするべきです。