統計学入門−第4章

医学分野では、対応のない多標本のデータと同様に対応のある多標本のデータもしばしば登場します。例えば第3章で「慢性肝炎患者に薬剤を投与することによってASTが低下するか？」という問題について考えたのと同じように、次のような問題について考えてみましょう。 (→3.3 2標本の計量値　(1) データに対応がある場合)

データに対応がない場合と同様に、この場合も降圧効果を評価するには収縮期血圧を評価項目にして平均値を評価指標にすることが医学的に妥当だとします。しかしこの場合は観測時点が投与前後の2時点だけでなく3時点以上あり、その全てが評価対象時点だとします。例えば測定時点が薬剤投与前、投与1週後、投与2週後の3時点あり、投与前と比較して投与1週後と2週後の収縮期血圧が低下するかどうかを調べたいとします。この場合、母集団における投与前、1週後、2週後の収縮期血圧平均値をそれぞれμ₀、μ₁、μ₂とし、基準値をμ₀にします。すると検定の帰無仮説を次のように表すことができます。

対立仮説については、医学的な同等範囲を決めて投与前と1週後、投与前と2週後それぞれで対立仮説を設定し、統計的仮説検定を行うことが可能です。しかし対応のない場合と同様に、まずは帰無仮説を否定した単純な対立仮説を設定して有意性検定を行うことにしましょう。 (→(1) データに対応がない場合)

これらの仮説を検定するために5例の高血圧患者に血圧降下剤を投与し、投与前、投与1週後、投与2週後の収縮期血圧を測定した結果が表4.1.6のようになったとします。

表4.1.6 薬剤投与前後の収縮期血圧(mmHg)
被験者No.	投与前	投与1週後	投与2週後	計	平均値
1	116	106	108	330	110
2	128	102	100	330	110
3	129	108	108	345	115
4	137	118	114	369	123
5	140	116	110	366	122
計	650	550	540	1740	-
平均値	130	110	108	-	116
平均値の標準誤差	4.2	3.0	2.3	-	3.2
平均値の95％信頼区間	118〜142	102〜118	102〜114	-	109〜123

この場合、データを変動させる要因は個人差と時期の2つと考えられます。例えばNo.1とNo.2とNo.3の被検者の平均値(投与前・投与1週後・投与2週後の平均値)が110、110、115とばらついているのは個人差のためだと考えられます。それに対して投与前、投与1週後、投与2週後の平均値(5例の被検者の平均値)が130、110、108とばらついているのは血圧降下剤の効果が時期によって変化しているためだと考えられます。

個人差を誤差と考えてしまえば、これは水準数が3である一元配置分散分析になります。しかしこれは同じ人で時期を変えて3回測定した対応のあるデータなので個人差を誤差から分離して効率の良い分析をすることができます。このようにデータを変動させる意味のある要因が2つある時の分散分析を二元配置分散分析(two-way layout analysis of variance)といいます。

通常の二元配置分散分析では一方の要因——この場合は個人差——は効果を分析するのが目的ではなく誤差を減らすのが目的であり、ブロック因子と呼ばれます。では誤差に相当する要因は何でしょうか？それは時期による血圧の変動パターンが被験者によって異なるという要因です。平ったくいえば血圧の下がり具合が個人によって異なっていること、つまり血圧の下がり具合の個人差が誤差になるのです。これを個人(要因A)と時期(要因B)の交互作用(effect modification)といい、要因A×Bと表記します。これが二元配置分散分析における誤差つまり残差になります。この交互作用に対して要因Aと要因Bによる変動のことを主効果といいます。

二元配置分散分析ではデータy_ijを次のように分解して考えます。

一元配置分散分析と同様に、この基本式に従って平方和と自由度と分散を求めることができます。表4.1.6のデータについてそれらを計算し、分散分析表にまとめると次のようになります。 _(注1)

二元配置分散分析では個人差を誤差から分離し、独立して検定することができます。それが要因Aの検定であり、この検定の帰無仮説と対立仮説は次のように表せます。

有意水準5％として、表4.1.7の分散比について検定すると次のようになります。

表4.1.7 分散分析表
要因	平方和SS	自由度φ	平均平方和Ms(分散V)	分散比F
要因A：個人差	474	4	118.5	5.780
要因B：時期	1480	2	740	36.098
残差：交互作用	164	8	20.5
全体	2118	14

この検定結果から被験者ごとの平均値はばらついていることがわかります。ただしここでは要因Aはブロック因子であり、個人差を誤差から分離して効率の良い分析をすることが目的です。そのため検定結果よりも分散比の方が重要です。この場合の分散比は5.780つまり個人差の情報密度が誤差の情報密度の6倍ほどあるので個人差を誤差から分離すると誤差の情報密度が薄くなり、効率が良くなることがわかります。

要因Bの検定は時期の検定であり、これがこの分析の主目的です。

要因Bの寄与率は要因Bの平方和を全体の平方和で割るのではなく、全体の平方和から要因Aの平方和を引いたもの、つまり(要因Bの平方和＋残差の平方和)で割ります。これはブロック因子の情報を全体の情報から分離して要因Bの情報を検討するためです。この検定結果から次のような統計学的結論を採用することができます。

この統計学的結論から医学的結論を導くためには、次のような点について検討する必要があります。

これらの疑問点について全て肯定的に答えられるとしたら、次のような医学的結論を採用することができます。

実は、表4.1.6は表4.1.1の対応のないデータを対応のあるデータにしたものです。そのため個人差を残差に含めて一元配置分散分析にすると、その分散分析表は表4.1.2の分散分析表の要因Aを時期にしたものと一致します。

表4.1.7と表4.1.8を比べると、表4.1.8では残差分散が大きくなって誤差の情報密度が濃くなっています。その結果、個人差に関する情報が得られないだけでなく推定や検定の精度も悪くなります。しかし個人差の情報密度が誤差よりも薄ければ、個人差を残差に含めて一元配置分散分析にした方が効率が良くなります。このように対応のあるデータを対応のないデータとして扱った方が効率が良いのは、個人差が誤差よりも小さい時だけです。医学分野で扱うデータは個人差が大きいものが多いので、そのような場合はめったにありません。

表4.1.8 個人差を残差に含めた分散分析表
要因	平方和SS	自由度φ	平均平方和Ms(分散V)	分散比F
要因B：時期	1480	2	740	13.918
残差：個人差＋交互作用	638	12	53.167
全体	2118	14

また二元配置分散分析で要因Bの時期数(水準数)が2つの時は対応のあるt検定に相当し、一元配置分散分析と同様にF値の平方根がt値に一致します。その場合、要因Bの変動とは2時期の平均値の差に相当し、誤差である交互作用とは要因Bの変動パターンが個人によって異なっていること、つまり2時期の変化量のバラツキに相当します。 _(注2) (→3.3 2標本の計量値　(1) データに対応がある場合)

2) 多重比較

二元配置分散分析で時期の検定結果が有意になっても「3時点の平均値がばらついている」という定性的かつ漠然とした結論しか出せません。投与前の平均値と比較してどの時点の平均値が異なっているかを検討するためには、投与前と投与1週後、投与前と投与2週後について多重比較を行う必要があります。表4.1.6のデータについて医学的な同等範囲を±10mmHgとすると、多重比較の対立仮説は次のようになります。

第1節の多重比較で説明したように、この場合は投与前の平均値を対照にして他の2時点の平均値をこれと比較し、2つの検定結果を”いいとこ取り”するのでダネット型多重比較を適用します。有意水準5％、信頼係数95％として、ダネット型多重比較とそれに対応する区間推定を行うと次のようになります。 _(注3)

以上の結果より、ファミリーとしての統計学的結論は次のようになります。

これについても分散分析と同様の疑問点について検討し、全て肯定的に答えられるとしたら次のような医学的結論を採用することができます。

二元配置分散分析では要因Aと要因Bの検定を行うので最低でも検定を2回行います。そのため「検定を複数回行う時は必ず多重比較が必要である！」と誤解していると、要因Aの検定と要因Bの検定も多重比較にする必要があると考えてしまうかもしれません。

しかしこれらはそれぞれ目的が異なる独立した検定であり、これらの検定結果をいいとこ取りしてファミリーとしての結論を採用することはありません。したがって要因Aの検定と要因Bの検定を多重比較にする必要はありません。多重比較が必要なのは複数の検定結果を”いいとこ取り”する時だけです。

(注1)　2つの要因A、Bの水準数をそれぞれa、bとして、表4.1.6を一般化すると次のようになります。

表4.1.9 二元配置分散分析の一般的データ
要因	B₁	…	B_j	…	B_b	計	平均値
A₁	y₁₁	…	y_1j	…	y_1b	T₁.	m₁.
:	:	:	:	:	:	:	:
A_i	y_i1	…	y_ij	…	y_ib	T_i.	m_i.
:	:	:	:	:	:	:	:
A_a	y_a1	…	y_aj	…	y_ab	T_a.	m_a.
計	T.₁	…	T._j	…	T._b	T_T	−
平均	m.₁	…	m._j	…	m._b	−	m_T

データy_ijを二元配置分散分析の基本式に従って分解し、平方和と自由度と分散を求めると次のようになります。

二元配置分散分析の基本式(二元配置分散分析モデル)：
　(y_ij - μ) = α_i + β_j + ε_ij ≒ (y_ij - m_T) = (m_i. - m_T) + (m._j - m_T) + (y_ij - m_ij) = (m_i. - m_T) + (m._j - m_T) + {y_ij - (m_i. + m._j - m_T)}
○全体
例数：n = a b　　平方和：

自由度：φ_T = n - 1 　　分散：

○要因A
平方和：

自由度：φ_A = a - 1 　　分散：

　　寄与率：

○要因B
平方和：

自由度：φ_B = b - 1 　　分散：

　　寄与率：

○残差：A×B
平方和：

自由度：φ_R = φ_T - φ_A - φ_B = n - a - b + 1 = (a - 1)(b - 1) = φ_A×φ_B 　　分散：

E(V_R)=σ_R² 　　E(V_A) = bσ_A² + σ_R² 　　E(V_B)= a σ_B² + σ _R²

これらの値を分散分析表にまとめると次のようになります。

表4.1.10 分散分析表
要因	平方和SS	自由度φ	平均平方和Ms	分散比F
A	S_A	φ_A	V_A	F_A = V_A/V_R
B	S_B	φ_B	V_B	F_B = V_B/V_R
残差	S_R	φ_R	V_R
全体	S_T	φ_T

表4.1.6のデータについて実際に計算してみましょう。

S_T = 116² + 128² + … + 110² - 15×116² = 203958 - 201840 = 2118
φ_T = 15 - 1 = 14　　

S_A = 3×(110² + 110² + … + 122²) - 201840 = 202314 - 201840 = 474
φ_A = 5 - 1 = 4　　

S_B = 5×(130² + 110² + 108²) - 201840 = 203320 - 201840 = 1480
φ_B = 3 - 1 = 2　　

S_R = 2118 - 1480 - 474 = 164　　φ_R = 14 - 2 - 4 = 8 　　

(注2)　二元配置分散分析において、要因Bの水準数bを2にすると次のようになります。

n = 2a　　

　　φ_T = n - 1 = 2a - 1

S₁₁：B₁の平方和　　S₁₂：B₂の平方和　　S₁₂：B₁とB₂の積和

φ_A = a - 1　　

φ_B = 2 - 1 = 1　　V_B = S_B

φ_R = n - a - 1 = a - 1 　　

以上のように、二元配置分散分析で時期が2つの時は対応のあるt検定(ただし両側検定)と一致します。対応のあるt検定よりも分散分析の方がきめの細かい分析が可能なので、対応のある2標本の平均値を両側検定で比較したい時は分散分析を用いた方が便利です。第3章第3節の表3.3.1のデータに二元配置分散分析を適用すると、次のように確かに対応のあるt検定の結果と一致します。 (→3.3 2標本の計量値)

表4.1.11 表3.3.1の分散分析表
要因	平方和SS	自由度φ	平均平方和Ms	分散比F
個人差	1005	9	111.667	3.073
時期	500	1	500	13.761
残差	327	9	36.333
全体	1832	19

○要因A：個人差
F_A ≒ 3.073(p = 0.0549) ＜ F(1,9,0.05) = 5.117 … 有意水準5％で有意ではない
R_A² ≒ 0.755(75.5％)
○要因B：時期
F_B ≒ 13.761(p = 0.0048) ＞ F(1,9,0.05) = 5.117 … 有意水準5％で有意

R_B² ≒ 0.605(60.5％)

(注3)　要因Bに関するダネット型多重比較は次のようになります。

○投与1週後対投与前
m_d = 110 - 130 = -20 　　

|d_o| = 6.984(p = 0.0002) ＞ d(2,8,0.05) = 2.673
δ₀₁の95％同時信頼区間 = -20 ± 7.74 → 下限：δ_01L = -27.7　上限：δ_01U = -12.3
○与2週後対投与前
m_d = 108 - 130 = -22 　　

|d_o| = 7.683(p = 0.0001) ＞ d(2,8,0.05) = 2.673
δ₀₁の95％同時信頼区間 = -22 ± 7.74 → 下限：δ_01L = -29.7　上限：δ_01U = -14.3

前口上	目次	第1章	第2章	第3章	第4章	第5章	第6章	第7章	第8章	第9章	第10章
第11章	第12章	第13章	第14章	第15章	第16章	第17章	第18章	第19章	第20章	付録

(2) データに対応がある場合

1) 二元配置分散分析

2) 多重比較