| 前口上 | 目次 | 第1章 | 第2章 | 第3章 | 第4章 | 第5章 | 第6章 | 第7章 | 第8章 | 第9章 | 第10章 | 第11章 | 第12章 | 第13章 | 第14章 | 付録 |
| 1 | 2 | 3 | 4 |
医学や薬学では対応のない多標本のデータと同様、対応のある多標本のデータもしばしば登場します。 例えばある血圧降下剤の効果を調べるために5例の高血圧患者にその薬剤を継続投与し、投与前、投与1週後、投与2週後の最高血圧を測定した結果が表4.6のようになったとします。
| 人 | 投与前 | 投与1週後 | 投与2週後 | 計 | 平均 |
|---|---|---|---|---|---|
| 1 | 116 | 106 | 108 | 330 | 110 |
| 2 | 128 | 102 | 100 | 330 | 110 |
| 3 | 129 | 108 | 108 | 345 | 115 |
| 4 | 137 | 118 | 114 | 369 | 123 |
| 5 | 140 | 116 | 110 | 366 | 122 |
| 計 | 650 | 550 | 540 | 1740 | - |
| 平均 | 130 | 110 | 108 | - | 116 |
| 標準誤差 | 4.2 | 3.0 | 2.3 | - | 3.2 |
この場合、データを変動させる要因は各人の血圧の個人差と時期の2つと考えられ、このようにデータを変動させる意味のある要因が2つある場合を二元配置分散分析といいます。 各人の血圧の個人差を誤差と考えてしまえば、これは水準数が3である一元配置分散分析になります。 しかしこれは同じ人で時期を変えて3回測定した対応のあるデータですから、各人の血圧の個人差を誤差から分離して効率の良い分析をすることができます。
通常の二元配置分散分析では一方の要因は効果を分析するのが目的ではなく誤差を減らすのが目的であり、「ブロック因子」と呼ばれています。 では誤差に相当する要因は何でしょうか? それは、時期(または薬剤)による血圧の変動パターンが5例の人によって異なるという要因です。 平ったくいえば、血圧の下がりぐあいが人によって違っていることが誤差になるのです。 これを人(要因A)と時期(要因B)との交互作用(要因A×B)といい、二元配置分散分析における残差になります。
二元配置分散分析ではデータyijを次のように分解して考えます。
この基本式に対応する平方和、自由度、分散と、それらをまとめた分散分析表は次のとおりです。 (注1)
| 分散VT= | ST ―― φT |
| 分散VA= | SA ―― φA |
| 寄与率RA2= | SA ――― SA+SR |
| 分散VB= | SB ―― φB |
| 寄与率RB2= | SB ――― SB+SR |
| 分散VR= | SR ―― φR |
| 要因 | 平方和SS | 自由度φ | 平均平方和Ms(分散V) | 分散比F |
|---|---|---|---|---|
| A | SA | φA | VA | FA=VA/VR |
| B | SB | φB | VB | FB=VB/VR |
| 残差 | SR | φR | VR | |
| 全体 | ST | φT | ||
有意水準5%として表4.6の例題について実際に計算すると、次のようになります。
| 要因 | 平方和SS | 自由度φ | 平均平方和Ms(分散V) | 分散比F |
|---|---|---|---|---|
| 人 | 474 | 4 | 118.5 | 5.780 |
| 時期 | 1480 | 2 | 740 | 36.098 |
| 残差 | 164 | 8 | 20.5 | |
| 全体 | 2118 | 14 | ||
以上の結果より、統計的結論は次のようになります。
もし個人差の要因を無視して残差に含めて一元配置にしてしまうと、次のように二元配置分散分析に比べて誤差が約3倍にもなってしまいます。 その結果、当然、検定や推定の精度は悪くなりますし、個人差に関する情報も得られません。
| VR'= | 638 ―― 12 |
≒53.167 |
実は表4.6のデータは表4.1の対応のないデータを対応のあるデータにしたものですので、一元配置分散分析にした時の結果は表4.1の結果と同じになります。
FAが1より小さく、個人差の変動が誤差より小さい時には、それを残差に含めて一元配置分散分析にした方が検定や推定の精度は良くなります。 つまり要因Aの情報密度が誤差より薄いのですから、それを誤差にまぜてしまって誤差の情報密度を薄めるわけです。 このように対応のあるデータを対応のないデータとして扱って対応のない統計手法を適用した方が効率が良いのは、個人差や個体差による変動が誤差よりも小さい時だけです。 医学・薬学分野で扱うデータは個人差が大きいものが多いので、そのような場合はまずめったにありません。
また二元配置分散分析で要因Bの水準数が2つの時は対応のあるt検定に相当し、一元配置分散分析と同様にF値の平方根がt値に一致します。 この場合、要因Bの変動とは2時期の平均値の差に相当し、誤差(残差)である交互作用とは要因Bの変動パターンが個人によって異なっていること、すなわち2時期の差のバラツキに他ならず、したがって分散比Fはt値に相当することになります。 (注2) (→3.3 2標本の計量値)
なお二元配置分散分析では要因Aと要因Bの検定を行うため、最低でも検定を2回行います。 そのため「検定を複数回行う時は必ず多重比較が必要である!」と誤解している人は、要因Aの検定も多重比較にする必要があると考えるかもしれません。 しかし要因Aと要因Bはそれぞれ目的が異なる独立した検定であり、これらを総合して最終的な1つの結論を採用することはありません。 したがって要因Aの検定を多重比較にする必要はありません。
要因Aの水準と要因Bの水準が同じという条件下で繰り返しデータが得られれば、交互作用も誤差から分離でき、同一条件群内におけるデータのバラツキが誤差になります。 例えば多数のマウスを雄・雌に分け、さらにそれらを各々3群に分けて(つまり全部で6群に分けて)同じ3種類の薬を投与し、薬の種類による効果の差(要因A)と、性による効果の差(要因B)を同時に調べようとする時などがこれに相当します。
このような場合の解析手法を「繰り返しのある二元配置分散分析」といいます。 そしてこの方法と区別するために、前節で説明した二元配置法を「繰り返しのない二元配置分散分析」と呼ぶことがあります。 (注3)
人間を対象とした臨床試験では、多数の患者を2群に分けて一方の群には薬剤A1を、もう一方の群には薬剤A2を投与し、特定の臨床評価項目を多時期にわたって観察することによって薬効を比較することがしばしばあります。 この場合、薬剤を要因A、時期を要因Bと考えると繰り返しのある二元配置型になります。 しかし薬剤を無視すると、このデザインは個人を要因A、時期を要因Bとした繰り返しのない二元配置型と考えることもできます。
繰り返しのある二元配置型と考えた時、同一薬剤投与群における同一時期の個人差が誤差になりますが、人間は個人差が大きいので個人差を誤差から分離した方が効率が良くなります。 そこで繰り返しのある二元配置型と繰り返しのない二元配置型を混合し、個人差を誤差から分離しつつ、要因Aを薬剤にするような特殊な手法が開発されました。 その手法を「繰り返し測定型二元配置分散分析(two-way repeated measures analysis of variace、two-way RMANOVA)」といい、臨床試験などでよく利用されています。 (注4)
繰り返しのある二元配置分散分析または繰り返し測定型二元配置分散分析では、要因Aの検定と要因Bの検定、そして要因AとBの交互作用の検定を行うことができます。 今、要因Aが群に相当するものでその水準が2個あり、要因Bが時期に相当するものでその水準が2個あるとします。 この時、A1のB1−B2、A2のB1−B2の平均値と、3種類の検定結果との関係を模式的に表すと次のようになります。
この模式図から、要因Aの検定はA1とA2のグラフの高さを比較検定したものに相当し、要因Bの検定はA1とA2を合わせた時のB1→B2のグラフの変動を検定したものに相当し、交互作用の検定はA1におけるB1→B2という変動パターンと、A2におけるB1→B2という変動パターンを比較検定したものに相当することがわかると思います。 このため要因Aの検定のことを「レベルの検定」、交互作用の検定のことを「パターンの検定」と呼ぶことがあります。 そして要因Bの水準が2つだけの時、パターンの検定はB1→B2の変化量をA1とA2で比較検定したもの、つまり要因Aに関する変化量の一元配置分散分析に相当します。
したがってA1が薬剤A1投与群、A2が薬剤A2投与群、そしてB1が薬剤投与前、B2が薬剤投与後とすると、交互作用の検定結果が有意になれば薬剤の効果が異なることになります。 ただし初期値が変化量に影響する時は、A1群とA2の初期値が異なっていると公平な比較ができません。 そこでB1におけるA1群の平均値とA2群の平均値を比較し、それがほぼ同じであることを確認しておく必要があります。 これはB1において、要因Aに関する一元配置分散分析を行うことによって確認することができます。 これを「初期値の比較」といい、薬剤の効果を比較したい時には必須になります。
時期数が3つ以上の時、つまり薬剤投与後の時期が2つ以上ある時に薬剤の効果を比較するのは少々複雑です。 例えばA1群とA2群において、薬剤投与前、薬剤投与1週後、薬剤投与2週後の3時期で値を測定したとします。 この場合は、まず最初にA1群とA2群の薬剤投与前の平均値を比較し、それがほぼ同じであることを確認します。
次に薬剤投与1週後の値と薬剤投与2週後の値から薬剤投与前の値を引いて、それぞれの時期の変化量を求めます。 そしてその変化量をデータとし、薬剤投与1週後をB1、薬剤投与2週後をB2として、繰り返しのある二元配置分散分析または繰り返し測定型二元配置分散分析を適用します。
そうすると、要因Aの検定はA1群とA2群の2つの時期の変化量の平均値が異なっているかどうかの検定、つまり投与後の変化量全体が群によって異なっているかどうかの検定になります。 したがってこの検定結果が有意の時は、薬剤A1と薬剤A2の効果が異なっていることになります。
要因Bの検定は、2つの群を合わせた時の変化量が時期によって異なっているかどうかの検定になります。 したがってこの検定結果が有意の時は、薬剤の効果が時期によって異なっていることになります。
交互作用の検定は、2つの時期の変化量の変動パターンが群によって異なっているかどうかの検定になります。 したがってこの検定結果が有意の時は、薬剤A1と薬剤A2では効果の発現時期が異なっていることになります。
以上の3種類の検定結果を検討することによって、薬剤A1と薬剤A2の効果を詳細に比較することができます。 例えば図4.3の右下のグラフで縦軸を変化量=薬剤の効果とすると、投与1週後では2つの薬剤の効果はほとんど変わらず、投与2週後になると薬剤A1は効果が落ちるものの、薬剤A2は効果が持続する、そして全体としては薬剤A2の方が効果が高い、といった詳細な比較をすることができます。
また要因Aを薬剤の有無にし、要因Bを食事療法の有無にした場合、要因Aは薬剤の効果を表し、要因Bは食事療法の効果を表し、交互作用は薬剤と食事療法の間に相乗効果または相殺効果があるかどうかを表します。 例えば図4.6で縦軸を薬効とし、横軸を食事療法の有無とすると、薬剤無−食事療法有無のグラフと薬剤有−食事療法有無のグラフが非平行かどうか、つまり交互作用があるかどうかで薬剤と食事療法の関係が相乗効果、相加効果、相殺効果のどれであるかを検討することができます。
| 要因B:食事療法の有無 | |||
|---|---|---|---|
| 無 | 有 | ||
| 要因A:薬剤の有無 | 無 | 群1 | 群2 |
| 有 | 群3 | 群4 | |
このように二元配置分散分析は応用範囲の広い手法であり、動物実験から臨床試験まで色々な場合に利用されています。 ただし二元配置分散分析を臨床試験に利用する時は、注意しなければならない点があります。 それは分散分析は要因内の各水準はそれぞれ独立であり、お互いに無相関であることを前提にしている点です。
動物実験の場合は、要因内の各水準を独立にすることは比較的容易です。 しかし臨床試験では繰り返し測定型のデータ、つまり同じ人が時期を変えて連続的に測定して得られたデータが多く、このようなデータは独立ではなくお互いに相関があると考えられます。 このため厳密に言えば、繰り返し測定型のデータに対して時期を要因Bにした二元配置分散分析を適用するのは不適切であり、本来は時系列解析を適用すべきです。
時系列解析は、連続測定された多時期のデータを、お互いの相関関係を考慮して総合的に解析するために開発された手法です。 しかし残念なことに時系列解析は現在はあまり一般的ではなく、ホルター心電図データの解析など、特殊な場合しか用いられていません。 (→2.1 データの種類と統計手法)
| 要因 | B1 | … | Bj | … | Bb | 計 | 平均 |
|---|---|---|---|---|---|---|---|
| A1 | y11 | … | y1j | … | y1b | T1. | m1. |
| : | : | … | : | … | : | : | : |
| Ai | yi1 | … | yij | … | yib | Ti. | mi. |
| : | : | … | : | … | : | : | : |
| Aa | ya1 | … | yaj | … | yab | Ta. | ma. |
| 計 | T.1 | … | T.j | … | T.b | TT | − |
| 平均 | m.1 | … | m.j | … | m.b | − | mT |
二元配置分散分析ではデータyijを次のように分解して考えます。

:要因Aiにおける要因Bjの理論的推定値この基本式に対応する平方和、自由度、分散は次のとおりです。













表4.6のデータについて実際に計算すると次のようになります。







前節(注3)のボンフェローニ型を用い、要因Bについて多重比較を行うと次のようになります。


シェッフェ型多重比較を用いると次のようになります。





以上のように、二元配置分散分析で時期数が2つの時は対応のあるt検定と一致します。 対応のあるt検定よりも分散分析の方がきめの細かい分析が可能なので、対応のある2標本の場合にも本当は分散分析を適用するべきです。 第3章第3節 表3.6のデータに二元配置分散分析を適用すると、次のように確かに対応のあるt検定の結果と一致します。 (→3.3 2標本の計量値)
| 要因 | 平方和SS | 自由度φ | 平均平方和Ms(分散V) | 分散比F |
|---|---|---|---|---|
| 人 | 1005 | 9 | 111.667 | 3.073 |
| 時期 | 500 | 1 | 500 | 13.761 |
| 残差 | 327 | 9 | 36.333 | |
| 全体 | 1832 | 19 | ||


| 要因A | B1 | … | Bj | … | Bb | 計 | 平均 |
|---|---|---|---|---|---|---|---|
| A1 | y111 | … | y1j1 | … | y1b1 | T1.1 | m1.1 |
| : | … | : | … | : | : | : | |
| y11k | … | y1jk | … | y1bk | T1.k | m1.k | |
| : | … | : | … | : | : | : | |
| y11r1 | … | y1jr1 | … | y1br1 | T1.r1 | m1.r1 | |
| A1内計 | T11. | … | T1j. | … | T1b. | T1.. | − |
| A1内平均 | m11. | … | m1j. | … | m1b. | − | m1.. |
| : | : | … | : | … | : | : | : |
| Ai | yi11 | … | yij1 | … | yib1 | Ti.1 | mi.1 |
| : | … | : | … | : | : | : | |
| yi1k | … | yijk | … | yibk | Ti.k | mi.k | |
| : | … | : | … | : | : | : | |
| yi1ri | … | yijri | … | yibri | Ti.ri | mi.ri | |
| Ai内計 | Ti1. | … | Tij. | … | Tib. | Ti.. | − |
| Ai内平均 | mi1. | … | mij. | … | mib. | − | mi.. |
| : | : | … | : | … | : | : | : |
| Aa | ya11 | … | yaj1 | … | yab1 | Ta.1 | ma.1 |
| : | … | : | … | : | : | : | |
| ya1k | … | yajk | … | yabk | Ta.k | ma.k | |
| : | … | : | … | : | : | : | |
| ya1ra | … | yajra | … | yabra | Ta.ra | ma.ra | |
| Aa内計 | Ta1. | … | Taj. | … | Tab. | Ta.. | − |
| Aa内平均 | ma1. | … | maj. | … | mab. | − | ma.. |
| 計 | T.1. | … | T.j. | … | T.b. | TT | − |
| 平均 | m.1. | … | m.j. | … | m.b. | − | mT |

:Ai・Bjカラムの理論的推定平均値



















| 要因 | 平方和SS | 自由度φ | 平均平方和Ms(分散V) | 分散比F |
|---|---|---|---|---|
| A | SA | φA | VA | FA=VA/VR |
| B | SB | φB | VB | FB=VB/VR |
| A×B | SAxB | φAxB | VAxB | FAxB=VAxB/VR |
| 残差 | SR | φR | VR | |
| 全体 | ST | φT | ||
SABは、要因Aの第i水準と要因Bの第j水準におけるr個のデータを、それらの平均値mij.ただ1つで代表させた時の全変動であり、「級間平方和」と呼ばれています。 繰り返し数が1である繰り返しのない二元配置分散分析では、級間平方和は全変動の平方和になります。
交互作用の多重比較は、Scheffe型一般対比の考え方を応用して次のようになります。

交互作用が小さくてFAxBが1より小さい時は、交互作用を残差にプールして、繰り返しのない二元配置分散分析にした方が誤差が小さくなり効率が良くなります。
| 要因 | 平方和SS | 自由度φ | 平均平方和 Ms(分散V) | 分散比F |
|---|---|---|---|---|
| A | SA | φA | VA | FA=VA/VR' |
| B | SB | φB | VB | FB=VB/VR' |
| 残差 | SR'=SAxB+SR | φR'=φAxB+φR | VR' | |
| 全体 | ST | φT | ||
| 要因A(群) | 個体 | 時期B1 | … | 時期Bj | … | 時期Bb | 計 | 平均 |
|---|---|---|---|---|---|---|---|---|
| A1 | 1 | y111 | … | y1j1 | … | y1b1 | T1.1 | m1.1 |
| : | : | … | : | … | : | : | : | |
| k | y11k | … | y1jk | … | y1bk | T1.k | m1.k | |
| : | : | … | : | … | : | : | : | |
| r1 | y11r1 | … | y1jr1 | … | y1br1 | T1.r1 | m1.r1 | |
| A1内計 | T11. | … | T1j. | … | T1b. | T1.. | − | |
| A1内平均 | m11. | … | m1j. | … | m1b. | − | m1.. | |
| : | : | : | … | : | … | : | : | : |
| Ai | 1 | yi11 | … | yij1 | … | yib1 | Ti.1 | mi.1 |
| : | : | … | : | … | : | : | : | |
| k | yi1k | … | yijk | … | yibk | Ti.k | mi.k | |
| : | : | … | : | … | : | : | : | |
| ri | yi1ri | … | yijri | … | yibri | Ti.ri | mi.ri | |
| Ai内計 | Ti1. | … | Tij. | … | Tib. | Ti.. | − | |
| Ai内平均 | mi1. | … | mij. | … | mib. | − | mi.. | |
| : | : | : | … | : | … | : | : | : |
| Aa | 1 | ya11 | … | yaj1 | … | yab1 | Ta.1 | ma.1 |
| : | : | … | : | … | : | : | : | |
| k | ya1k | … | yajk | … | yabk | Ta.k | ma.k | |
| : | : | … | : | … | : | : | : | |
| ra | ya1ra | … | yajra | … | yabra | Ta.ra | ma.ra | |
| Aa内計 | Ta1. | … | Taj. | … | Tab. | Ta.. | − | |
| Aa内平均 | ma1. | … | maj. | … | mab. | − | ma.. | |
| 計 | T.1. | … | T.j. | … | T.b. | TT | − | |
| 平均 | m.1. | … | m.j. | … | m.b. | − | mT | |

:群Aiにおける個体kの時期Bjの理論的推定値
:群Aiにおける個体kの時期Bjの群別理論的推定値
























| 要因 | 平方和SS | 自由度φ | 平均平方和 Ms(分散V) | 分散比F |
|---|---|---|---|---|
| A(群) | SA | φA | VA | FA=VA/VSR |
| 個体残差 | SSR | φSR | VSR | |
| 個体 | Ssub | φsub | Vsub | Fsub=Vsub/VSRxB |
| B(時期) | SB | φB | VB | FB=VB/VSRxB |
| A×B | SAxB | φAxB | VAxB | FAxB=VAxB/VSRxB |
| 個体残差×B | SSRxB | φSRxB | VSRxB | |
| 全体 | ST | φT | ||
Ssubは群を無視して個体を要因Aと考えた時の全変動であり、個体差を表します。 SAxBは群と時期との交互作用であり、群ごとの時期変動パターンの違いつまり群平均の時期変動パターンの違いを表します。 SSRxBは個体残差と時期との交互作用であり、各群における個体の時期変動パターンの違い、つまり群平均の時期変動パターンと個体の時期変動パターンの違いを表します。
この分散分析表において、個体より上は個体を全変動とし、群を要因A、個体残差を誤差とした一元配置分散分析になっていて、個体より下は個体を要因A、時期を要因B、個体残差×時期Bを誤差とした二元配置分散分析になっていることがわかると思います。 つまり群の検定は対応のない検定になり、それ以外の検定は対応のある検定になるわけです。
群ごとの時期変動パターンの違いが小さくてFAxBが1より小さい時は、群と時期との交互作用A×Bを個体残差×時期Bにプールした方が誤差が小さくなり、効率が良くなります。 この場合、個体より下は個体と時期の繰り返しのない二元配置分散分析に相当します。
| 要因 | 平方和SS | 自由度φ | 平均平方和 Ms(分散V) | 分散比F |
|---|---|---|---|---|
| A(群) | SA | φA | VA | FA=VA/VSR |
| 個体残差 | SSR | φSR | VSR | |
| 個体 | Ssub | φsub | Vsub | Fsub=Vsub/VSxB |
| B(時期) | SB | φB | VB | FB=VB/VSxB |
| 個体×B | SSxB=SAxB+SSRxB | φSxB=φAxB+φSRxB | VSRxB | |
| 全体 | ST | φT | ||
また個体差が少なくてFsubが1より小さい時は、個体残差を個体残差×時期Bにプールして、一般的な繰り返しのある二元配置分散分析にした方が誤差が小さくなり効率が良くなります。
| 要因 | 平方和SS | 自由度φ | 平均平方和 Ms(分散V) | 分散比F |
|---|---|---|---|---|
| A(群) | SA | φA | VA | FA=VA/VR |
| B(時期) | SB | φB | VB | FB=VB/VR |
| A×B | SAxB | φAxB | VAxB | FAxB=VAxB/VR |
| 残差 | SR=SSR+SSRxB | φSRxB=φSR+φSRxB | VR | |
| 全体 | ST | φT | ||
表4.14のデータで、要因Aにも対応のある時がたまにあります。 例えば同じ被験者に対して、最初は薬剤1を投与して糖負荷試験を行ない、0分、30分、60分、120分の4時点で血糖値を観測し、次に薬剤2を投与して糖負荷試験を行ない、やはり0分、30分、60分、120分の4時点で血糖値を観測したとします。 そしてこのデータを用いて、2種類の薬剤の糖代謝に与える影響を比較したいとします。
この時、要因Aを薬剤すると、要因Aの2つの水準にも対応があることになります。 このようなデータには、本来は被験者を要因A、薬剤を要因B、時期を要因Cとした三元配置分散分析を適用します。 しかし三元配置分散分析は複雑な手法で、結果の解釈も難しいため、実際の研究現場で用いられることはほとんどありません。 そのためこのような場合も、薬剤1を投与した時の被験者と薬剤2を投与した時の被験者は別々の被験者と考えて、繰り返し測定型二元配置分散分析を適用することが多いと思います。
厳密に言えば、このような試験デザインは、時期によって薬剤の影響は変わらないことと、最初に投与した薬剤1の影響が後で投与する薬剤2の結果に影響を与えない──つまり薬剤1の持ち越し効果がないことが前提になっています。 しかし実際には時期によって薬剤の影響が変わること大いに有り得ますし、薬剤の持ち越し効果も有り得ます。 したがってこのような試験デザインは不適切であり、本来は薬剤1を投与する被験者と薬剤2を投与する被験者は別々にし、糖負荷試験を同時に行うデザインにするべきです。