玄関雑学の部屋雑学コーナー統計学入門

4.4 繰り返しのある多標本・多時期の計数値

(1) 順序尺度(順序データ)

データが順序尺度の場合、繰り返しのある二元配置分散分析または共分散分析に相当する手法として、2群用の拡張マンテル(Mantel)検定と多群用の一般化拡張マンテル検定という手法があります。 これらはマンテル・ヘンツェル(Mantel-Haenszel)検定を拡張した手法ですが、マンテル・ヘンツェル検定は名義尺度のデータの繰り返しのある二元配置分散分析または共分散分析に相当する手法ですから、この後で説明します。

1) 2群の場合

繰り返しのある二元配置型の順序尺度のデータとしては、例えば次のようなものがあります。 ある疾患に対する新薬と標準薬の効果を調べるために、薬剤投与後に疾患の改善度を「1:著明改善 2:中等度改善 3:軽度改善 4:不変 5:軽度悪化 6:中等度悪化 7:著明悪化」の7段階で評価したとします。 ただしこの疾患には性差があるので男性と女性でそれぞれ新薬と標準薬を層別無作為割り付けし、薬剤投与後に改善度を判定した結果が表4.4.1のようになったとします。

表4.4.1 性別−薬剤別改善度
要因B:性別
要因A:薬剤標準薬群1改善度群2改善度
11
23
::
46
45例51例
新薬群3改善度群4改善度
11
12
::
56
56例53例

この表は第3節の表4.3.1と同じ形式であり、繰り返しのある二元配置デザインであることがわかると思います。 ただしこの表では同一水準条件の例数が全て少し異なっています。 もちろん全て同じ例数にするのが理想ですが、マウスを対象にした実験と違ってヒトを対象にした試験で例数を揃えるのは難しいので、このようなデータになるのが普通です。 この表のデータを男女別に薬剤と改善度でクロス集計したところ、次のようになったとします。

表4.4.2 薬剤と改善度の性別クロス集計表
性別薬剤著明改善中等度改善軽度改善不変軽度悪化中等度悪化著明悪化
標準薬914121521053
新薬1613141120056
25272626410109
標準薬712171221051
新薬914111200046
1626282421097

このようなデータの場合、要因Aつまり薬剤の効果と要因Bつまり性の効果、そしてそれらの間の交互作用を検討することよりも、性の影響を補正して薬剤の効果を検討する方が多いと思います。 そのため順序尺度のデータに繰り返しのある二元配置分散分析を適用するのではなく、共分散分析を適用すると考えた方が自然です。 それが拡張マンテル検定です。 ただし通常の共分散分析と違って、拡張マンテル検定の共変数にできるのは名義尺度のデータだけです。 (→8.5 共分散分析と二元配置分散分析)

表4.4.2に拡張マンテル検定を適用すると次のようになります。 (注1)

○共通性の検定:修正群差の検定≒要因A(薬剤)の効果
H0:薬剤によって改善度の調整順位平均値は変動しない
χeMm2 = 3.303(p = 0.0691) < χ2(1,0.05) = 3.841 … 有意水準5%で有意ではない
調整順位平均値(修正順位平均値)の差 = -14.7(-7.1%)   95%信頼区間:下限 = -30.5(-14.8%) 上限 = 1.2(0.6%)
寄与率:ηr2 = 0.016  順位相関比:ηr = 0.127
○異質性の検定:非平行性の検定=AxB(薬剤と性の交互作用)
H0:新薬と標準薬の順位平均値の差に男女差はない=薬剤と性の間に交互作用はない
χeMr2 = 0.004(p = 0.9509) < χ2(1,0.05) = 3.841 … 有意水準5%で有意ではない

共通性の検定は共分散分析における修正群差の検定――二元配置分散分析では要因A(薬剤投与群)の検定――に相当し、新薬と標準薬の改善度の順位平均値の差が男と女で同じと仮定し、その差つまり調整順位平均値(修正順位平均値)の差が0かどうかを検定します。

この場合、調整順位平均値の差は-14.7であり、新薬投与群の改善度分布の中心位置が標準薬投与群よりも14.7例分だけ改善側にずれていることがわかります。 この14.7例分のズレを全体の例数206で割って100を掛けると7.1%になります。 2群の改善度分布の中心位置は-50%〜+50%の範囲でずれるため、7.1%のズレはあまり多くないと解釈できます。 この調整順位平均値の差の解釈はウィルコクソンの2標本検定における順位平均値の差の解釈と同様です。 (→4.2 多標本の計数値 (1) 順序尺度(順序データ))

異質性の検定は共分散分析における非平行性の検定――二元配置分散分析では要因A(薬剤投与群)と要因B(性別)の交互作用の検定――に相当し、新薬と標準薬の改善度の順位平均値の差が男と女で同じかどうかを検定します。 このデータではχeMr2の値が非常に小さく、交互作用はほとんどないことがわかります。 事実、次に説明する男女別に拡張マンテル検定を適用した結果を見ると、男の順位平均値の差は-8.4、女の順位平均値の差は-6.3であり、あまり大きな違いはありません。

寄与率は順位の変動のうち薬剤の違いによって説明できる割合を表し、クリスカル・ウォーリスの検定における寄与率に相当します。 このデータではその割合は約2%程度であり、非常に小さいことがわかります。 またクリスカル・ウォーリスの検定と同様に、寄与率の平方根は順位相関比になります。 順位相関比は名義尺度のデータと順序尺度のデータの間の相関性または関連性の指標であり、表4.4.2が横断的研究から得られたデータの時の評価指標になります。

このデータの場合、共通性の検定も異質性の検定も有意ではありません。 しかし異質性の検定結果が有意であり、男と女で順位平均値の差が大きく異なっている時は男女別に拡張マンテル検定を適用します。 表4.4.3の男女別クロス集計表にそれぞれ拡張マンテル検定を適用すると次のようになり、男と女で順位平均値の差は大きく異なっていないことがわかります。

○男
共通性の検定:χeMm2 = 2.029(p = 0.1543) < χ2(1,0.05) = 3.841 … 有意水準5%で有意ではない
順位平均値の差 = -8.4(-7.7%)   95%信頼区間:下限 = -19.9(-18.3%) 上限 = 3.2(2.9%)
寄与率:ηr2 = 0.019  順位相関比:ηr = 0.137
○女
共通性の検定:χeMm2 = 1.304(p = 0.2535) < χ2(1,0.05) = 3.841 … 有意水準5%で有意ではない
順位平均値の差 = -6.3(-6.5%)   95%信頼区間:下限 = -17.2(-17.7%) 上限 = 4.5(4.7%)
寄与率:ηr2 = 0.014  順位相関比:ηr = 0.117

このように異質性の検定結果が有意ではなく、男と女で順位平均値の差がほぼ同じ時は、男女を合わせて拡張マンテル検定を適用すると効率が良くなることがあります。 表4.4.2の男女を合わせて拡張マンテル検定を適用すると次のようになり、共通性のχeMm2の値が性別で調整した時よりもわずかに大きくなります。

表4.4.3 薬剤と改善度のクロス集計表(全体)
薬剤著明改善中等度改善軽度改善不変軽度悪化中等度悪化著明悪化
新薬25272523200102
標準薬16262927420104
41535450620206
共通性の検定:χeMm2 = 3.392(p = 0.0655) < χ2(1,0.05) = 3.841 … 有意水準5%で有意ではない
順位平均値の差 = -14.9(-7.2%)   95%信頼区間:下限 = -30.7(-14.9%) 上限 = 1.0(0.5%)
寄与率:ηr2 = 0.017  順位相関比:ηr = 0.129

なおクロス集計表が1つだけの時、拡張マンテル検定は連続修正を施さないウィルコクソンの2標本検定つまりクリスカル・ウォーリスの検定と一致します。 そのため男女別の層別解析と男女を合わせた全体解析には、それらの検定を適用してもかまいません。 またこのことから拡張マンテル検定はウィルコクソンの2標本検定を利用した共分散分析に相当することがわかると思います。 (注1) (→3.4 2標本の計数値 (1) 順序尺度8.5 共分散分析と二元配置分散分析)

拡張マンテル検定の場合、共分散分析と違って共変数の効果つまり性によって順位平均値が変動するかどうかは検定できません。 そのため薬剤の影響を補正して性差を検討したい時は、薬剤別に性と改善度をクロス集計して拡張マンテル検定を適用する必要があります。

また表4.4.1は層別無作為割付試験から得られたデータですが、新薬と標準薬だけ無作為に割付け、試験終了後に性の影響を補正して薬剤の効果を検討したい時、つまり後知恵または後層別の時も拡張マンテル検定を適用することができます。 ただしその場合、新薬投与群はたまたまほとんどが女性ばかりになり、標準薬投与群はたまたまほとんどが男性ばかりになるということも有り得ます。 そのように極端に偏った時は、拡張マンテル検定によって性の影響を補正できないので注意が必要です。

2) 多群の場合

繰り返しのある二元配置型の順序尺度のデータで、要因Aの水準が3個以上ある時は一般化拡張マンテル検定を適用します。 例えば表4.4.1と同じ形式の層別無作為割付試験で、薬剤がP、A、B、Cの4種類あったとします。 そして薬剤投与後に改善度を評価し、そのデータを男女別と全体でクロス集計したところ次のようになったとします。

表4.4.4 薬剤と改善度の性別クロス集計表
性別薬剤著明改善中等度改善軽度改善不変軽度悪化中等度悪化著明悪化
P12157840046
A894420027
B18114420039
C13103500031
51451821800143
P937010020
A10910610036
B9122110025
C14112230032
4235219600113
全体P211814850066
A1818141030063
B27236530064
C27215730063
938039301400256

表4.4.4に一般化拡張マンテル検定を適用すると次のようになります。 (注1)

○男
共通性の検定:χgMm2 = 5.327(p = 0.1494) < χ2(3,0.05) = 7.815 … 有意水準5%で有意ではない
寄与率:ηr2 = 0.038  順位相関比:ηr = 0.194
○女
共通性の検定:χgMm2 = 4.157(p = 0.2450) < χ2(3,0.05) = 7.815 … 有意水準5%で有意ではない
寄与率:ηr2 = 0.037  順位相関比:ηr = 0.193
○全体
共通性の検定:χgMm2 = 7.652(p = 0.0538) < χ2(3,0.05) = 7.815 … 有意水準5%で有意ではない
寄与率:ηr2 = 0.030  順位相関比:ηr = 0.173
○共通性の検定:修正群差の検定≒要因A(薬剤)の効果
χgMm2 = 7.938(p = 0.0473) > χ2(3,0.05) = 7.815 … 有意水準5%で有意
寄与率:ηr2 = 0.031  順位相関比:ηr = 0.176
○異質性の検定:非平行性の検定=AxB(薬剤と性の交互作用)
χgMr2 = 1.546(p = 0.6718) < χ2(3,0.05) = 7.815 … 有意水準5%で有意ではない

各種の検定結果と寄与率および相関比の解釈方法は拡張マンテル検定と同様です。 そしてクロス集計表が1つだけの時、一般化拡張マンテル検定はクリスカル・ウォーリスの検定と一致します。 そのため男女別の層別解析と男女を合わせた全体解析には、それらの検定を利用してもかまいません。 またこのことから一般化拡張マンテル検定はクリスカル・ウォーリスの検定を利用した共分散分析に相当することがわかると思います。 (注1) (→4.2 多標本の計数値 (1) 順序尺度8.5 共分散分析と二元配置分散分析)

このデータでは異質性の検定結果が有意ではなく、共通性の検定結果が有意です。 しかし全体のクロス集計表に一般化拡張マンテル検定を適用した時の共通性の検定結果は、わずかに有意ではありません。 このように異質性の検定結果が有意ではないからといって、必ず全体の検定結果の方が検定効率が高くなるとは限りません。

拡張マンテル検定も一般化拡張マンテル検定もかなりややこしい手法であり、評価指標がわかりづらくて結果の解釈が難しいという欠点があります。 そのため順序尺度のデータをそのまま計量尺度扱いして共分散分析を適用する方が実際的で、結果の解釈も容易です。 例えば表4.4.1のデータを計量尺度扱いして、共分散分析を適用すると次のようになります。

目的変数y:効果  共変数x:性別
○標準薬投与群
共変数の平均値 = 0.490385  目的変数の平均値 = 2.83654
群別回帰式:y = 2.81132 + 0.0514243x  共通回帰式:yc = 2.79936 + 0.0758227x
群別回帰式の寄与率:r2 = 0.000463703
○新薬投与群
共変数の平均値 = 0.45098  目的変数の平均値 = 2.5098
群別回帰式:y = 2.46429 + 0.100932x  共通回帰式:yc = 2.47561 + 0.0758227x
群別回帰式の寄与率:r2 = 0.00192731
○全体
共変数の平均値 = 0.470874  目的変数の平均値 = 2.67476
群別回帰式:y = 2.63303 + 0.088622x  共通回帰式:yc = 2.63905 + 0.0758227x
群別回帰式の寄与率:r2 = 0.00140351
表4.4.5 共分散分析表
要因平方和自由度平均平方和(分散)F値
群差5.4973915.497393.94645
共通回帰0.29461410.2946140.211496
修正群差5.388915.38893.86857
全体回帰0.40310110.4031010.289377
非平行性0.031393810.03139380.0225369
残差281.3852021.393
全体281.209205
群差の検定:FA = 3.94645(p = 0.0483) > F(1,202,0.05) = 3.888 … 有意水準5%で有意
共通回帰の検定:Fβ = 0.211496(p = 0.6461) < F(1,202,0.05) = 3.888 … 有意水準5%で有意ではない
修正群差の検定:FAA = 3.86857(p = 0.0506) < F(1,202,0.05) = 3.888 … 有意水準5%で有意ではない
全体回帰の検定:Fβ0 = 0.289377(p = 0.5912) < F(1,202,0.05) = 3.888 … 有意水準5%で有意ではない
非平行性の検定:FD = 0.0225369(p = 0.8808) < F(1,202,0.05) = 3.888 … 有意水準5%で有意ではない
修正平均値の差の95%信頼区間:-0.323747±0.324555 → 下限:δL = -0.648302 上限:δU = 0.000808212

この検定結果のうち、修正群差の検定が拡張マンテル検定の共通性の検定に相当し、非平行性の検定が異質性の検定に相当します。 そしてそれらの検定結果は拡張マンテル検定の結果と似ています。 しかし拡張マンテル検定の結果と違って評価指標である平均値が明確で、性で修正しない群差も修正した群差も検定できる上に、群で修正しない性差(全体回帰)も修正した性差(共通回帰)も検定できます。

統計学はデータを要約してその内容をわかりやすくするためのものなので、統計手法を用いたために結果がかえって理解しにくくなったり、解釈しにくくなってしまっては何にもなりません。 そのためこのような場合は「難解な厳密さ」よりも「単純明快な柔軟さ」を選び、順序尺度のデータを計量尺度度扱いして共分散分析を適用する方が実用的です。

(2) 名義尺度(分類データ)

データが名義尺度で繰り返しのある二元配置デザインの場合、2群の時はマンテル・ヘンツェル検定を適用します。 これはコクラン・マンテル・ヘンツェル検定(Cochran-Mantel-Haenszel検定、CMH検定)と呼ばれることもあります。 そして多群の時は順序尺度と同様に一般化拡張マンテル検定を適用します。

1) 2群の場合

表4.4.1と同じ形式の層別無作為割付試験で、改善度を「改善」と「非改善」で評価したとします。 そして薬剤投与後に改善度を判定し、そのデータを男女別と全体でクロス集計したところ次のようになったとします。

表4.4.6 薬剤と改善度の
性別2×2分割表
性別薬剤非改善改善
標準薬252550
新薬173350
4258100
標準薬331750
新薬252550
5842100
全体標準薬5842100
新薬4258100
100100200

表4.4.6にマンテル・ヘンツェル検定を適用すると次のようになります。 (注2)

○男
共通性の検定:χMm2 = 1.991(p = 0.1582) < χ2(1,0.05) = 3.841 … 有意水準5%で有意ではない
寄与率:ηr2 = 0.0262726  順位相関比:ηr = 0.162088
リスク差(改善率の差):RD = 0.16
リスク比(改善率の比):RR = 1.32  ln(RR) = 0.277632
オッズ比:OR = 1.94118  ln(OR) = 0.663294
○女
共通性の検定:χMm2 = 1.991(p = 0.1582) < χ2(1,0.05) = 3.841 … 有意水準5%で有意ではない
寄与率:ηr2 = 0.0262726  順位相関比:ηr = 0.162088
リスク差(改善率の差):RD = 0.16
リスク比(改善率の比):RR = 1.47059  ln(RR) = 0.385662
オッズ比:OR = 1.94118  ln(OR) = 0.663294
○全体
共通性の検定:χMm2 = 4.478(p = 0.0343) > χ2(1,0.05) = 3.841 … 有意水準5%で有意
寄与率:ηr2 = 0.0256  順位相関比:ηr = 0.16
リスク差(改善率の差):RD = 0.16
リスク比(改善率の比):RR = 1.38095  ln(RR) = 0.322773
オッズ比:OR = 1.90703  ln(OR) = 0.645547
○共通性の検定:修正群差の検定≒要因A(薬剤)の効果
χMm2 = 4.572(p = 0.0325) > χ2(1,0.05) = 3.841 … 有意水準5%で有意
寄与率:ηr2 = 0.0261406  順位相関比:ηr = 0.16168
調整リスク差(修正改善率の差):RD = 0.16   95%信頼区間:下限 = 0.0250041 上限 = 0.294996
調整リスク比(修正改善率の比):RR = 1.38095   95%信頼区間:下限 = 1.04382 上限 = 1.82697   ln(RR) = 0.322773
調整オッズ比:OR = 1.94118  95%信頼区間:下限 = 1.06793 上限 = 2.81443   ln(OR) = 0.663294
○異質性の検定:非平行性の検定=AxB(薬剤と性の交互作用)
χMr2 = 0(p = 1) < χ2(1,0.05) = 3.841 … 有意水準5%で有意ではない
※ブレスロー・デイの検定≒異質性の検定
χBD2 = 0(p = 1) < χ2(1,0.05)=3.841 … 有意水準5%で有意ではない

共通性の検定と異質性の検定、そして寄与率と順位相関比(四分点相関係数に相当)の解釈方法は拡張マンテル検定および一般化拡張マンテル検定と同様です。 この場合の共通性の検定はリスク差(出現率の差)の検定です。 そして拡張マンテル検定や一般化マンテル検定と同様に、表4.4.6の薬剤を群、改善/非改善をダミー変数の目的変数にし、性別をダミー変数の共変数にして共分散分析を適用すると、次のように調整リスク差が修正群差に、異質性が非平行性に相当します。 (→8.5 共分散分析と二元配置分散分析)

目的変数y:改善(0:標準薬 1:新薬)  共変数x:性別(0:男 1:女)
○標準薬投与群
共変数の平均値 = 0.5  目的変数の平均値 = 0.42
群別回帰式:y = 0.5 - 0.16x  共通回帰式:yc = 0.5 - 0.16x
群別回帰式の寄与率:r2 = 0.0262726
○新薬投与群
共変数の平均値 = 0.5  目的変数の平均値 = 0.58
群別回帰式:y = 0.66 - 0.16x  共通回帰式:yc = 0.66 - 0.16x
群別回帰式の寄与率:r2 = 0.0262726
○全体
共変数の平均値 = 0.5  目的変数の平均値 = 0.5
群別回帰式:y = 0.58 - 0.16x  共通回帰式:yc = 0.58 - 0.16x
群別回帰式の寄与率:r2 = 0.0256
群差の検定:FA = 5.288(p = 0.0225) > F(1,196,0.05) = 3.889 … 有意水準5%で有意
共通回帰の検定:Fβ = 5.288(p = 0.0225) > F(1,196,0.05) = 3.889 … 有意水準5%で有意
修正群差の検定:FAA = 5.288(p = 0.0225) > F(1,196,0.05) = 3.889 … 有意水準5%で有意
全体回帰の検定:Fβ0 = 5.288(p = 0.0225) > F(1,196,0.05) = 3.889 … 有意水準5%で有意
非平行性の検定:FD = 0(p = 1) < F(1,196,0.05) = 3.889 … 有意水準5%で有意ではない
修正平均値の差の95%信頼区間:0.16±0.137214 → 下限:δL = 0.0227864 上限:δU = 0.297214

またこの手法では性の影響を補正した調整リスク差(調整改善率の差)と順位相関比、さらに調整リスク比(調整改善率の比)調整オッズ比とそれらの信頼区間も求めることができます。 リスク差とリスク比は表4.4.6のデータが前向き研究から得られた時の評価指標です。 そして出現率が小さい(10%未満)時、出現率は指数関数的に変化します。 そのため出現率の差よりも対数出現率の差の方が評価指標として何かと好都合です。 その対数出現率の差を指数変換したものが出現率の比つまりリスク比です。 したがってリスク差とリスク比は出現率の値で使い分けます

オッズ比は相関性または関連性の指標であり、出現率が小さい(10%未満)時はリスク比と近似します。 そしてオッズ比は後ろ向き研究から得られたデータでも、前向き研究から得られたデータでも同じ値になります。 そのため表4.4.6のデータが後ろ向き研究から得られた時の評価指標になります。 そして出現率が小さい時はリスク比の近似値として解釈し、出現率が大きい時は相関性の指標として解釈します。 ただし共通性の検定はあくまでも調整リスク差の検定でもあり、調整リスク比と調整オッズ比は参考値にすぎません。 特に調整オッズ比については次のロジット検定の方が正確です。

ここで注意していただきたいのは、表4.4.6は性で層別無作為割り付けをした結果、表4.4.1と違って標準薬投与群と新薬投与群の男女比がきれいに揃っている点です。 そのため性の影響は2群で平等になり、本来なら性の影響を補正する必要はないと考えられます。 事実、男女別のリスク差と全体のリスク差、そして調整リスク差は全て同じ0.16という値であり、異質性の検定結果とブレスロー・デイの検定結果から薬剤と性の交互作用は全く無いことがわかります。

ところが男と女のリスク比は1.32と1.47059でそれぞれ異なり、全体のリスク比と調整リスク比は1.38095で同じ値ですが、これは男女別のリスク比とは異なっています。 また男と女のオッズ比と調整オッズ比は1.94118で同じ値ですが、全体のオッズ比は1.90703でそれらとは異なっています。 さらに男と女の順位相関比は0.162088で同じ値ですが、全体の順位相関比は0.16、調整した順位相関比は0.16168とそれぞれ微妙に異なっています。

これはリスク比とオッズ比が2種類の値の比であることに起因しています。 2種類の値の比は出現率の差が同じ値でも分母の値が異なると異なった値になります。 そのため薬剤と性の交互作用が無くて男女別のリスク差と全体のリスク差と調整リスク差が全て同じ値でも、リスク比とオッズ比は全て同じ値になるとは限らないのです。 このような時は性で調整した調整リスク比と調整オッズ比が偏りのない正確な値になります。

また全体のリスク差と調整リスク差は同じ値ですが、共通性の検定の有意確率p値は調整リスク差の方がわずかに小さく、検定効率がわずかに高くなっています。 これは共分散分析と同様に、調整前後でリスク差は変わらなくても、性によるデータのバラツキが少なくなる分だけ検定結果の精度が高くなるからです。 そして順位相関比は共通性の検定のχ2値と合計例数に基づいて求めます。 そのためたとえ調整リスク差が同じでも、共通性の検定結果が異なれば異なった値になります。 (→8.2 共分散分析結果の解釈)

したがって2群の背景因子が異なっている時はもちろん、たとえ異なっていなくても、マンテル・ヘンツェル検定を用いて背景因子の影響を補正することをお勧めします。 特に評価指標としてリスク比やオッズ比を用いる時は、マンテル・ヘンツェル検定による背景因子の補正は必須です。

○ロジット検定

オッズ比については、ロジスティック回帰分析またはロジット分析に共分散分析の原理を適用したロジット検定(logit test)で同様の検定を行うことができます。 表4.4.6にロジット検定を適用すると次のようになります。 (注4) (→3.4 2標本の計数値 (2)名義尺度 (注5)第10章 ロジスティック回帰分析)

○男
オッズ比の検定:χOR2 = 2.601(p = 0.1068) < χ2(1,0.05) = 3.841 … 有意水準5%で有意ではない
オッズ比:OR = 1.94118  ln(OR) = 0.663294
○女
オッズ比の検定:χOR2 = 2.601(p = 0.1068) < χ2(1,0.05) = 3.841 … 有意水準5%で有意ではない
オッズ比:OR = 1.94118  ln(OR) = 0.663294
○全体
オッズ比の検定:χOR2 = 5.076(p = 0.0243) > χ2(1,0.05) = 3.841 … 有意水準5%で有意
オッズ比:OR = 1.90703  ln(OR)=0.645547
○調整オッズ比の検定
χORm2 = 5.203(p = 0.0226) > χ2(1,0.05) = 3.841 … 有意水準5%で有意
調整オッズ比:OR = 1.94118  95%信頼区間:下限 = 1.09784 上限 = 3.43236   ln(OR) = 0.663294
○オッズ比の異質性の検定
χORr2 = 0(p = 1) < χ2(1,0.05) = 3.841 … 有意水準5%で有意ではない

2×2分割表がひとつだけの時は、この手法のオッズ比とマンテル・ヘンツェルのオッズ比は一致します。 そしてマンテル・ヘンツェル検定は調整リスク差の検定なので、調整オッズ比の検定と推定はこの手法の方が正確です。 そしてこの手法では男と女のオッズ比と調整オッズ比は同じ値ですが、全体のオッズ比はそれらとは異なっています。 そのため調整リスク差の異質性の検定結果と同様に、薬剤と性の交互作用は全く無いという結果になっています。

この手法はロジスティック回帰分析またはロジット分析に共分散分析の原理を適用したものです。 そのため表4.4.6の改善/非改善を目的変数にし、薬剤と性別をダミー変数の説明変数にしてロジスティック回帰分析を適用すると、次のように薬剤の調整オッズ比がロジット検定の調整オッズ比に、ズレの検定がロジット検定の異質性の検定に対応します。 (→第10章 ロジスティック回帰分析)

○ロジスティック回帰式:l = ln{p/(1-p)} = 0.663294・x1 - 0.663294・x2 (p:改善する確率)
直線性の検定:χβ2 = 5.211(p = 0.0055) > χ2(2,0.05) = 5.991 … 有意水準5%で有意
ズレの検定:χLOF2 = 0(p = 1) < χ2(1,0.05) = 3.841 … 有意水準5%で有意ではない ← ロジット検定の異質性の検定に対応
○薬剤(0:標準薬 1:新薬):x1
調整オッズ比:OR1 = exp(0.663294) = 1.94118 ← ロジット検定の調整オッズ比に対応
回帰係数の検定:χ12 = 5.203(p = 0.0226) > χ2(1,0.05) = 3.841 … 有意水準5%で有意
○性別(0:男 1:女):x2
調整オッズ比:OR2 = exp(-0.663294) = 0.515152
回帰係数の検定:χ22 = 5.203(p = 0.0226) > χ2(1,0.05) = 3.841 … 有意水準5%で有意

また上記のロジスティック回帰分析ではx1(薬剤)とx2(性別)の相関係数は0であり、2つの変数は無相関です。 これは、そうなるように性で層別無作為割り付けをしたので当然です。 普通の重回帰分析では、x1とx2が無相関ならx1を除外して解析してもx2の偏回帰係数の値は変わりません(ただし偏回帰係数の標準誤差は変わります)。 ところがロジスティック回帰分析の場合、x1を除外して解析すると次のようにxxの偏回帰係数の値が変わってしまいます。 そして薬剤のオッズ比がロジット検定の全体のオッズ比に対応します。 (→第7章 重回帰分析)

○ロジスティック回帰式:l = ln{p/(1-p)} = -0.322773 + 0.645547・x1 (p:改善する確率)
直線性の検定:χβ2 = 5.142(p = 0.0234) > χ2(1,0.05) = 3.841 … 有意水準5%で有意
ズレの検定:検定不可能
○薬剤(0:標準薬 1:新薬):x1
オッズ比:OR1 = exp(0.645547) = 1.90703 ← ロジット検定の全体のオッズ比に対応
回帰係数の検定:χ12 = 5.076(p = 0.0243) > χ2(1,0.05) = 3.841 … 有意水準5%で有意

このことから、たとえ特定の背景因子で層別無作為割り付けしても、また薬剤群の背景因子が揃っていて薬剤と背景因子が無相関でも、ロジスティック回帰分析のようにオッズ比やリスク比が目的変数の時は背景因子の影響を補正しなければならないことがわかると思います。 また重回帰分析のように目的変数が普通の計量尺度のデータの時は、薬剤と背景因子が無相関なら、背景因子の影響を補正してもしなくても偏回帰係数の値は変わりません。 しかし背景因子の影響を補正すると偏回帰係数の標準誤差が小さくなって偏回帰係数の誤差の精度が高くなるので、できれば背景因子の影響を補正した方が良いでしょう。

2) 多群の場合

繰り返しのある二元配置型の名義尺度のデータで、要因Aの水準が2つ以上ある時は一般化拡張マンテル検定を適用します。 例えば表4.4.4の改善度について、「軽度改善」以上を「改善」とし、「不変」以下を「非改善」と判定すると次のようになります。

表4.4.7 薬剤と改善度判定の
性別2×2分割表
性別薬剤非改善改善
P123446
A62127
B63339
C52631
29114143
P11920
A72936
B22325
C52732
1598113
全体P135366
A135063
B85664
C105363
44212256

表4.4.7に一般化拡張マンテル検定を適用すると次のようになります。 (注2)

○男
共通性の検定:χgMm2=1.917(p=0.5897)<χ2(3,0.05)=7.815 … 有意水準5%で有意ではない
寄与率:ηr2=0.0135032  順位相関比:ηr=0.116203
○女
共通性の検定:χgMm2=3.110(p=0.3750)<χ2(3,0.05)=7.815 … 有意水準5%で有意ではない
寄与率:ηr2=0.0277665  順位相関比:ηr=0.166633
○全体
共通性の検定:χgMm2=1.875(p=0.5987)<χ2(3,0.05)=7.815 … 有意水準5%で有意ではない
寄与率:ηr2=0.00735361  順位相関比:ηr=0.0857532
○共通性の検定:修正群差の検定≒要因A(薬剤)の効果
χgMm2=2.088(p=0.5543)<χ2(3,0.05)=7.815 … 有意水準5%で有意ではない
寄与率:ηr2=0.0081894  順位相関比:ηr=0.0904953
○異質性の検定:非平行性の検定=AxB(薬剤と性の交互作用)
χgMr2=2.939(p=0.4011)<χ2(3,0.05)=7.815 … 有意水準5%で有意ではない

この結果は表4.4.4の結果と少し違っていて、共通性の検定つまり修正群差の検定結果が有意水準5%で有意になっていません。 これは順序尺度のデータを名義尺度にしたので情報量が減り、検定効率が悪くなったせいです。 また拡張一般化マンテル検定では調整リスク差や調整リスク比を求めることができません。 そのため多群の場合は2群ごとにマンテル・ヘンツェル検定を適用して調整リスク差や調整リスク比を求め、検定と区間推定については多重性の調整をする方が実際的でしょう。

以上のように一般化拡張マンテル検定、拡張マンテル検定、そしてマンテル・ヘンツェル検定は、一連の複数のクロス集計表を合わせて共通性と異質性を検定することができます。 そのため層別解析だけでなく、複数の試験の結果を合わせて総合的に解析するメタアナリシス(meta-analysis)にも利用されます。 また繰り返し測定された順序尺度のデータまたは名義尺度のデータについて、時期を共変数扱いすることによって時期を合わせて総合的に解析することもできます。 例えば生命表解析で用いられるコックス・マンテル(Cox-Mantel)検定は、時期を共変数扱いして死亡率を総合的に解析する手法です。 (注5) (→11.2 生存率の比較方法)


(注1) 要因Aの水準数をa、要因Bの水準数をb、Ai-Bkにおける繰り返し数をNi.kとすると、繰り返しのある二元配置型の順序尺度のデータは次のように表すことができます。 通常、要因Aは群、要因Bは性別や疾患分類などの層別項目または時期、そして群内の繰り返しは被験者です。

表4.4.8 繰り返しのある
二元配置型の順序尺度のデータ
要因AB1BkBb
A1y111y1k1y1b1
:::::
y11(N1.1)y1k(N1.k)y1b(N1.b)
::::::
Aiyi11yik1yib1
:::
yi1(Ni.1)yik(Ni.k)yib(Ni.b)
::::::
Aaya11yak1yab1
:::::
ya1(Na.1)yak(Na.k)yab(Na.b)

順序尺度のデータの順序数をcとして、要因Bの各水準つまり層ごとに要因Aとデータをクロス集計すると、次のようなa×c分割表がb個できます。

表4.4.9 Bk層のa×c分割表
y1yjyc
A1n11kn1jkn1ckN1.k
:::::::
Aini1knijknickNi.k
:::::::
Aana1knajknackNa.k
N.1kN.jkN.ckNk

このa×c分割表に一般化拡張マンテル検定を適用すると次のようになります。 なおこの計算では行列とベクトルを用いるため、ここと同じ雑学コーナーに展示してある「ベクトルと行列」を参考にしてください。 そのページを参考にしても内容がチンプンカンプンの時は、計算式を無視していただいてかまいません。

χgMm2=[-]'-1[-]
     
:Ai群の順位和   :Ai群の順位和期待値
:Ai群の順位和の分散
(i≠i'):Ai群の順位和とAi'群の順位和の共分散
     
:第k層における順位の分散
χgMk2:上式でk=kの1つだけについて計算した値
  χgMr2 = χgMT2gMm2
寄与率:  順位相関比:ηr   ただし
共通性の検定:χgMm > χ2(a-1,α)の時、有意水準100α%で有意
異質性の検定:χgMr2 > χ2((a-1)(b-1),α)の時、有意水準100α%で有意

共通性の検定はb個のa×c分割表に共通して存在する群による順位平均値の差、つまり全ての層において群によって順位平均値に違いがあるかどうかを検定します。 この検定は共分散分析における修正群差の検定に相当します。

異質性の検定は、群による順位平均値の差がb個のa×c分割表ごとに異なっているかどうかを検定します。 この検定は共分散分析における非平行性の検定に相当します。 異質性の検定結果が有意の時は、群による順位平均値の差が層によって異なっていると解釈できます。 そのためb個のa×c分割表を総合して順位平均値の差を検定することは不適当ということになり、共通性の検定は意味を持たなくなります。 その場合は層ごとに一般化拡張マンテル検定を適用する、つまり要因Bによる層別解析を行います。

この検定の場合、層つまり要因Bはブロック因子になり、層によって順位平均値が異なるかどうかの検定は行いません。 層間の検定を行いたい時は層別項目を要因Aに、群を要因Bにして、群ごとに各層と順序尺度のデータをクロス集計してa個のb×c分割表を作成して検定する必要があります。

要因Bの水準数bが1つの時、次のように共通性の検定はクリスカル・ウォーリスの検定と一致します。


  
  

:同位の補正   H:クリスカル・ウォーリスの検定における統計量

また群数aが2で層の数がbの時は次のような式になります。

この式の順位rjkの代わりに、層を合わせた共通順位r.jを用いて計算する手法が拡張マンテル検定です。 群が2つの時、通常はこの手法を適用します。


     

  χeMr2 = χeMT2 - χeMm2
寄与率:  順位相関比:ηr   ただし
共通性の検定:χeMm2 > χ2(1,α)の時、有意水準100α%で有意
異質性の検定:χeMr2 > χ2(b-1,α)の時、有意水準100α%で有意

一般化拡張マンテル検定の計算式からわかるように、χeMk2の分子は第k層におけるA1群の実現度数と期待度数の差に順位を掛けた値を平方したものです。 したがって平方する前の値は、次のように第k層におけるA1群の順位和T1kとその期待値E(T1k)の差になります。

そしてχeMk2の分母は、次のように第k層におけるA1群の順位和の分散V(T1k)になります。 このことから拡張マンテル検定で層の数bが1つの時、共通性の検定はウィルコクソンの2標本検定の連続修正を施さない式つまり群数が2つの時のクリスカル・ウォーリスの検定と一致することがわかります。



:同位の補正
  W:ウィルコクソンの2標本検定における統計量
第3章第4節の(注3)のTmはB群の順位和でありT2に相当するので注意

これらのことから、ウィルコクソンの2標本検定と同様にして拡張マンテル検定における2群の調整順位平均値の差を求め、その区間推定を行うことができます。 (→3.4 2標本の計数値 (注3))

第k層の順位平均値の差:

:順位平均値の差を順位和の差に変換する重み
調整順位平均値の差:

T1m、T2m:群1と群2の調整順位和            
調整順位平均値の差の100(1-α)%信頼区間:
→ 下限:  上限:
第3章第4節の(注3)ではB群の順位平均値からA群の順位和平均値を引いているので注意

層の数bが1つで順位数cが2つだけの時、次のように共通性の検定はマンテル・ヘンツェル検定の連続修正を施さない式と一致します。 そのため(注2)で説明するように、順位数cが2つだけで層の数bが2つ以上の時、通常はマンテル・ヘンツェル検定を適用します。

  
χeMm2の平方前の分子:
χeMm2の分母:
  χmo2:マンテル・ヘンツェル検定における検定統計量


T1、T2:群1と群2の順位和   rd:群1と群2の順位平均値の差   RD:リスク差(群1と群2の出現率の差)
※これらの式によって順位和、順位平均値の差、リスク差を相互変換できる。
※(注2)では群2の順位平均値または出現率から群1の順位平均値または出現率を引いているので注意

まず表4.4.2のデータに拡張マンテル検定を適用してみましょう。 このデータの場合、新薬から標準薬を引いた方がわかりやすいので、新薬を群1、標準薬を群2として計算することにします。

r.1 = 21  r.2 = 68  r.3 = 121.5   r.4 = 173.5  r.5 = 201.5  r.6 = 205.5






  wm = 22.2294 + 24.1856 = 51.4149
χeMT2 = 1.98392 + 1.32315 = 3.30707  χeMr2 = 3.30707 - 3.30328=0.00379
  ηr = 0.127
  
調整順位平均値の差の95%信頼区間:
→ 下限:rdmL = -14.695 - 15.847 = -30.542 上限:rdmU = -14.695 + 15.847 = -1.152

次に表4.4.4のデータに一般化拡張マンテル検定を適用してみましょう。

○k=1:男
r11 = 26  r12 = 74  r13 = 105.5   r14 = 125  r15 = 139.5
u11 = 26×12 + 74×15 + 105.5×7 + 125×8 + 139.5×4 = 3718.5
u12 = 26×8 + 74×9 + 105.5×4 + 125×4 + 139.5×2 = 2075
u13 = 26×18 + 74×11 + 105.5×4 + 125×4 + 139.5×2 = 2483





  
  
  
     

  η1r = 0.194
○k=2:女
r21 = 21.5  r22 = 60  r23 = 88   r24 = 103  r25 = 110.5
u21 = 21.5×9 + 60×3 + 88×7 + 103×0 + 110.5×1 = 1100
u22 = 21.5×10 + 60×9 + 88×10 + 103×6 + 110.5×1 = 2363.5
u23 = 21.5×9 + 60×12 + 88×2 + 103×1 + 110.5×1 = 1303





  
  
  
     

  η2r = 0.193
○全体
     

χgMT2 = 5.32673 + 4.15658 = 9.48331   χgMr2 = 9.48331 - 7.93776 = 1.54555
  ηr = 0.176

(注2) 繰り返しのある二元配置型の2分類データは要因Aの水準数をa、要因Bの水準数をb、Ai-Bkの繰り返し数をNi.kとし、「有」に相当する時は1、「無」に相当する時は0となるダミー変数yを用いると表4.4.8と同じ型式で表すことができます。 この場合も要因Aは群、要因Bは性別や疾患分類などの層別項目または時期、群内の繰り返しは被験者になるのが普通です。 そして層ごとに群と2分類のデータをクロス集計すると、表4.4.9で順序数cを2つだけにした次のような表になります。

表4.4.10 層Bkのa×2分割表
群\分類0(無)1(有)
A1n11kn12kN1.k
::::
Aini1kni2kNi.k
::::
Aana1kna2kNa.k
N.1kN.2kNk

このa×2分割表は全部でb個あり、それらに一般化拡張マンテル検定を適用すれば群と2分類のデータの共通性と異質性を検定することができます。 その時の共通性の検定はb個のa×2分割表に共通して存在する群と2分類の関連性の有無、つまり群によって出現率に違いがあるかどうかを検定します。 この検定は共分散分析の修正群差の検定に相当します。 そして異質性の検定は群による出現率の違いが層によって異なっているかどうかを検定します。 この検定は共分散分析の非平行性の検定に相当します。

その場合、層別項目つまり要因Bはブロック因子になり、層によって出現率が異なるかどうかの検定つまり要因Bの検定は行いません。 層別項目の検定を行いたい時は層を要因Aにし、群を要因Bにして、群ごとに層と名義尺度のデータをクロス集計してa個のb×2分割表を作成する必要があります。

群数aが2つだけの時は、一般化拡張マンテル検定の代わりに順序数cが2つだけの拡張マンテル検定を適用することができます。 しかしその場合、通常はマンテル・ヘンツェル検定(コクラン・マンテル・ヘンツェル検定)を適用します。 まず層Bkの2×2分割表についてマンテル・ヘンツェルの検定のχMk2を計算すると次のようになります。 (→3.4 2標本の計数値 (2) 名義尺度 (注4))


     

b個の2×2分割表を総合してn22kを正規近似すると次のようになります。



  χMr2 = χMT2Mm2
寄与率:  順位相関比:ηr   ただし
χMm'2 > χ2(1,α)の時、有意水準100α%で有意 … 共通性の検定
χMr2 > χ2(b-1,α)の時、有意水準100α%で有意 … 異質性の検定

実は拡張マンテル検定はこの検定を順序尺度のデータに拡張した手法であり、順序数cが2つの時の共通性の検定は、この検定の連続修正を施さない式つまりχMm2と一致します。 またこの手法ではb個の2×2分割表に共通するリスク差とリスク比とオッズ比、つまり層による違いを調整した調整リスク差と調整リスク比と調整オッズ比を求めることができます。

調整リスク差:
RDMHの100(1-α)%信頼区間:
     
     
調整リスク比:
RRMHの100(1-α)%信頼区間:
        
調整オッズ比:
ORMHの100(1-α)%信頼区間:
     

調整リスク比と調整オッズ比の計算に用いるRRMHとORMHは、表内度数n11k、n12k、n21k、n22jのどれかが0の2×2分割表については計算できない時があります。 そこでその時は表内度数に0.5を加え、それに応じて周辺度数にも1を加えて計算します。 これは、(注4)で説明するオッズ比を用いた検定におけるウールフの修正と同じ目的の修正です。 この修正のために各表の表内度数に0がある時は値が少し不正確になります。

ちなみにこの手法で層別項目の代わりに時期を使用し、時期で補正して瞬間死亡率の比較を行う手法が生命表解析におけるコックス・マンテル検定です。 そして群の数が3つ以上の時は一般化拡張マンテル検定を利用して同じような検定をすることができます。 (→11.2 生存率の比較方法)

異質性の検定は次のような方法で計算することもできます。 この手法はブレスロー・デイ(Breslow-Day)の検定と呼ばれています。

  
dk = ORMH - 1   ek = -{(N.2k + N2.k)ORMH + N1.k - N.2k}   fk = ORMHN.2kN2.k
※±記号については 0 ≦ E(ORMH) ≦ min(N.2k, N2.k) になる方を選択する

χBD2 > χ2(b-1,α)の時、有意水準100α%で有意 … 異質性の検定

ブレスロー・デイの検定は表内度数の合計Σn11k、Σn12k、Σn21k、Σn22kのどれかが0の時は計算できません。 そこで各表の表内度数に0がある時はマンテル・ヘンツェル検定と同様にウールフの修正を施し、値が少し不正確になります。

表4.4.6のデータにマンテル・ヘンツェル検定を適用してみましょう。



  
χMT2 = 2.600985 + 2.600985 = 5.20197   χMr2 = 5.20197 - 5.20197 = 0
  ηr = 0.16168


参考までにブレスロー・デイの検定も適用してみましょう。

d1 = 1.94118 - 1 = 0.94118  e1 = -{(42 + 50)×1.94118 + 50 - 42}=-186.588   f1 = 1.94118×50×42 = 4076.47


d2 = 1.94118 - 1 = 0.94118  e2 = -{(58 + 50)×1.94118 + 50 - 58}=-201.647   f2 = 1.94118×50×58 = 5629.41


χBD2 = (25 - 25)2×0.169127 + (33 - 33)2×0.169127 = 0

(注4) マンテル・ヘンツェル検定と同じような分析を、第3章第4節で説明したオッズ比を用いて行うことができます。 この手法は第10章で説明するロジスティック回帰分析(ロジット分析)と関係があるので、ロジット検定(logit test)と呼ぶことにします。 そしてこの手法の異質性の検定のことをウールフの検定(Woolf test)と呼び、ブレスロー・デイの検定と同じような目的で用いることがあります。 この手法でも、各表の表内度数に0がある時は表内度数に0.5を加えるウールフの修正を施します。 (→3.4 2標本の計数値 (2)名義尺度 (注5)第10章 ロジスティック回帰分析)

  ln(ORk)=ln(xk12) + ln(xk21) - ln(xk11) - ln(xk22)

  
  ORm=exp(A) … 調整オッズ比
  χOr2OT2 - χOm2
χOm2>χ2(1,α)の時、有意水準100α%で有意 … 共通性の検定
χOr2>χ2(b-1,α)の時、有意水準100α%で有意 … 異質性の検定(ウールフの検定)
ln(ORm)の100(1-α)%信頼区間:

マンテル・ヘンツェルの検定が調整リスク差の検定であるのに対して、この手法はオッズ比の検定そのものです。 そのため調整オッズ比の検定と推定はこの手法の方が正確です。

表4.4.2のデータにロジット検定を適用してみましょう。

  
  
  
  

χOT2 = 2.60136 + 2.60136 = 5.20272   χOr2 = 5.20272 - 5.20272 = 0
  ORm = exp(0.663294) ≒ 1.94118

(注5) ブレスロー・デイの検定はオッズ比だけでなく色々な評価指標について適用することができます。 また第2節で説明したコクランのQ検定も出現率だけでなく色々な評価指標について適用することができます。 そのためこれらの手法はメタアナリシスで試験結果の異質性つまり試験ごとの評価指標のバラツキ具合を検討する時にも用いられます。 ただしコクランのQ検定をメタアナリシスで用いる時は、次のような式でQ統計量を求めます。 そして異質性の指標としてH統計量I2統計量(情報量)を用います。 (→(2)名義尺度 (注4))

b:試験数  Tk:試験kにおける評価指標推定値   :試験kの重み
:評価指標の重み付き推定値(逆分散法)   
     
Q=χo2>χ2(b-1,α)の時、有意水準100α%で有意
Tの100(1-α)%信頼区間:

評価指標Tは名義尺度のデータではオッズ比やリスク比がよく用いられ、計量尺度のデータでは平均値の差や標準化平方差(SMD:Standard mean difference)つまり効果量(effect size)がよく用いられます。 (→1.6 統計的仮説検定の考え方)

Qはχ2(k-1)に相当するため、それを自由度(k-1)で割ったH2は分散比F(k-1,∞)に相当します。 そのためHは分散比の平方根に相当します。 またH2は誤差分散を1とした時の分散に相当するため、この値が1の時の評価指標のバラツキ具合は誤差程度ということになります。 そこで(H2-1)をH2で割り、擬似的な寄与率に相当する値にしたものがI2です。 この値は-∞〜1の範囲で変動し、0以下の時は評価指標のバラツキつまり異質性は誤差以下ということになります。 そこで0未満の時は0としてしまえば、0〜1の範囲で変動する異質性の寄与率相当の値として利用できます。

分散比Fを寄与率に変換する式はF/{F+(Φ21)}ですが、この場合はΦ1=k-1、Φ2=∞なので正確な寄与率に変換することができません。 そこで致し方なく上記のような式で擬似的な寄与率に変換しているわけです。 (→4.1 多標本の計量値 (注1))