玄関雑学の部屋雑学コーナー統計学入門

(2) 名義尺度(分類データ)

データが名義尺度の時には、度数を利用した分散分析相当の手法を適用します。 やはりここでもデータに対応がない場合から説明しましょう。

1) データに対応がない場合

表4.1のデータを120mmHg未満を「正常」、120mmHg以上を「異常」と分類して、対応のない分類データにしてみましょう。

表4.24 薬剤投与群別収縮期血圧の分類
群内No.A剤投与群B剤投与群C剤投与群
1正常正常正常
2異常正常正常
3異常正常正常
4異常正常正常
5異常正常正常

 

表4.25 正常・異常の例数
分類正常異常
A剤投与群145
B剤投与群505
C剤投与群505
11415

表4.25は3群のデータを2種類に分類した「3×2分割表」ですので、3.4節で説明したχ2検定を適用して、理論度数と実現度数の食い違いを検討することができます。 そこでも説明しましたように、一般にm群のデータをn種類に分類した「m×n分割表」には「m×nのχ2検定」を適用し、次のよう検定します。

自由度φ=(m-1)(n-1)
χo2≧χ2(φ,α)の時有意水準100・α%で有意

χo2は理論度数と実現度数の食い違いを要約する値であり、同時に分散分析における要因A(例題の場合は薬剤)の平方和SAに相当する値でもあります。 この場合の寄与率は、全例数をN、mとnのうち小さい方をsとすると次のようになります。 (注1) (→3.4 2標本の計数値)

寄与率R2= χo2
――――
N(s-1)

有意水準5%として、表4.22の例題について実際に計算すると次のようになります。

χo2=10.909 (p=0.0043)>χ2(2,0.05)=5.991…有意水準5%で有意
R2=0.727(72.7%)

この結果についての考察点は2×2のχ2検定と同様で、A剤投与群とB・C剤投与群の間の異常率の違いが80%あることと、寄与率が約70%であることが医学的にも意味のあることであれば、

医学的結論:薬剤A、B、Cの異常率には違いがあり、薬剤B、Cには降圧効果がある。

ということになります。

m×nのχ2検定でもボンフェローニ型とシェッフェ型の多重比較を行うことができます。 ボンフェローニー形の多重比較を用いて例題について実際に計算すると、次のようになります。 (注2)

・A剤投与群対B剤投与群:χo2=8.182 p=0.0127
・A剤投与群対C剤投与群:χo2=8.182 p=0.0127
・B剤投与群対C剤投与群:χo2=0 p=1

これらの結果に対する注意点も分散分析と同様で、A剤投与群の異常率が80%であるのに対して、B、C剤投与群の異常率が0%であるということが医学的にみても異常率が低いと評価できれば、

医学的結論:薬剤B、Cには降圧効果があり、薬剤A(プラセボ)に比べてどちらも血圧の異常率を80%程度低下させる。

ということになります。 しかし分散分析と違って、χ2検定の多重比較はあまり行いません。 実際問題として全体が有意になった時には、多重比較をするよりも、群ごとの異常率を比べて医学的に意味があるほど率が違っているかどうかを検討する方が有意義です。

2) データに対応がある場合

今度は表4.6のデータを120mmHg未満を「正常」、120mmHg以上を「異常」と分類して、対応のある分類データにしてみましょう。

表4.26 収縮期血圧分類の変化
投与前投与1週後投与2週後
1正常正常正常
2異常正常正常
3異常正常正常
4異常正常正常
5異常正常正常

このデータは人を要因A、時期を要因Bとした2元配置分散分析と同じデータ構造をしていますので、人をブロック因子として個人差を誤差から取り除き、時期によって異常率が変動するかどうかを検定することができます。 その手法を「コックラン(Cochran)のQ検定」といい、表4.26のデータを順位が2つだけの順序分類データと考えてフリードマンの検定を適用したものに相当します。 コックランのQ検定では検定統計量Qを求めます。 この値はフリードマンの検定におけるχo2に相当し、次のようにして検定します。 (注3)

要因Bの自由度φB=時期数-1
要因Bの平方和SB=Q=χo2≧χ2B,α)の時有意水準100・α%で有意
全体の自由度φT=データ数-例数(要因Aの水準数)
要因Bの寄与率RB2= χo2
―――
φT

この検定は順位が2つだけの時のフリードマンの検定に相当しますので、時期数が2つの時は、フリードマンの検定と同様に順位が2つだけの時のウィルコクソンの1標本検定つまりマクネマーの検定に相当し、χ2値の平方根がz値に対応します。 (→4.2 多標本の計数値 (注5))

有意水準5%として、表4.26の例題について実際に計算すると次のようになります。

χo2=8 (p=0.0183)>χ2(2,0.05)=5.991…有意水準5%で有意
RB2=0.8(80%)

これらの結果に対する注意点はフリードマンの検定と同様であり、血圧の自然変動が無視でき、異常率の低下が医学的にも評価できるとすると、

医学的結論:薬剤の投与によって投与1・2週後の収縮期血圧異常率は低下する。

ということになります。

対応のある順序データと同様、対応のある分類データも医学・薬学分野ではあまりお目にかかりませんので、コックランのQ検定はほとんど知られていません。 またマンテル・ヘンツェル検定とブレスロー・デイ(Breslow-Day)検定を利用すると、繰り返しのある二元配置分散分析に相当する分析を行うことができます。 しかしこの手法はコックランのQ検定よりも知られておらず、研究現場でお目にかかることはほとんどありません。 あえてここで説明したのは、「こんな手法もありますよ」という紹介と同時に、統計学の各手法間には密接な関係があり、一見、別の手法に思えるものもデータの条件によっては同一の手法になり、原理は全て同じだということを説明したかったからです。 (注4)


(注1) m×nのχ2検定の計算式は、3.4節の(注8)で説明した2×nのχ2検定を拡張して次のようになります。

表4.27 m×n分割表
分類B1BjBn
A1x11x1jx1nX1
:::::
Aixi1xijxinXi
:::::
Amxm1xmjxmnXm
Y1YjYnN

帰無仮説は、

H0:A1〜Am群におけるBの分類パターンは同一である。

または、

H0:Aの分類とBの分類はお互いに独立である。

となり、この仮説のもとでの計算式は次のようになります。




連続修正をすると非常に繁雑な式になるため、通常、2×2の時以外は連続修正はしません。

全体の変動はAの各群とBの分類が完全に対応する時の要因Aの変動になりますから、Aiに属するXi例が全てBjに分類され、他のカラムは0例である時のχo2値になります。 ところがmとnは等しいとは限りません。 仮にm≦nとしますと、Aiのうち(n-m)個の群については0ではないカラムが2個以上存在することになります。 したがって全体の変動を表すχo2値をχT2としますと、この値は次のようになります。

・1個のカラムだけが0ではない群:個数=m-(n-m)=2m-n

・2個以上のカラムが0ではない群:個数=n-m

AとBは対等な名義尺度ですので、どちらが小さくてもχT2を同じように計算することができます。 したがってmとnのうち小さい方をsとしますと、寄与率R2は次のようになります。

この値は分類Aと分類Bの関連性を表す値でもありますので、「クラメール(Cramer)の関連係数(coefficient of contingency)」と呼ばれることもあります。 (→5.3 計数値の相関)

表4.25の例題について実際に計算してみましょう。



(注2) χ2検定における多重比較の計算式は次のとおりです。

(0) フィッシャー型(LSD(Least Significant Difference)法)

この方法は試験の計画段階で指定した特定の2群の比較だけを行う特殊な方法で、一般には用いるべきではありません。 しかし統計学の解説書に載っていたり、統計学ソフトに組み込まれていたりしますので、一応、紹介しておきます。

m×nのχ2検定の結果が有意という条件付きで、2種類以上の2群比較にフィッシャー型多重比較を用いる手法を「PLSD(Protected Least Significant Difference)法」と呼ぶことがあります。 しかしこの手法は、3群以上になると多重性の調整が不十分なものになるので使用すべきではありません。

xpj:特定のAp群におけるBj分類の例数
xqj:特定のAq群におけるBj分類の例数
Xp:特定のAp群の合計例数  Xq:特定のAq群の合計例数
Yj:Bj分類の合計例数  N:全例数

連続修正を加えた時

(1) ボンフェローニ型(ダンの多重比較)

ボンフェローニの不等式を利用し、個々の2×nのχ2検定の有意確率に検定回数をかけたものを多重比較の有意確率にするだけという、極めて単純で基本的な手法です。 個々の2×nのχ2検定の代わりにフィッシャー型の多重比較の計算式を用い、それで得られた有意確率に検定回数を掛けてもかまいません。

個々の検定は独立であり、それらをORで結合して得られる結論をファミリーとしての結論にするという非常に緩い条件の手法なので、個々の検定の有意水準が小さくなって有意になりにくい反面、応用範囲が広いという特徴があります。 どのような多重比較手法を用いれば良いかわからない時とか、多重比較手法がまだ開発されていない特殊な検定について多重比較を行いたい時は、とりあえずこの手法を用いておけば良いでしょう。

(2) シェッフェ型(シェッフェのs検定)

最も汎用性が高く、したがって最も有意になりにくい手法です。 2群比較の場合はこの手法よりもボンフェローニ型の方が検定効率が高いので、普通はボンフェローニ型を用いた方が良いでしょう。

2群比較の検定式はフィッシャー型と同じ

ボンフェローニ型を用いて表4.25の例題について実際に計算してみましょう。

・A剤投与群対B剤投与群:

・A剤投与群対C剤投与群:

・B剤投与群対C剤投与群:

(注3) 要因Aの水準数(例数)をa、要因Bの水準数(時期数)をb、全データ数をn(=a・b)としてコックランの検定の計算式を導いてみましょう。 多時期の2分類データは、「有」に相当する時は1、「無」に相当する時は0となるダミー変数yを用いて次のように表すことができます。

表4.28 多時期の2分類データ
要因B1BjBb
A1y11y1jy1bT1.
:::::
Aiyi1yijyibTi.
:::::
Aaya1yajyabTa.
T.1T.jT.bTT

この場合の帰無仮説は次のようになります。

H0:要因Bによって有(1)の発生確率は変動せず、母集団におけるB1〜Bb時期の発生確率は全て等しい。

この帰無仮説より、要因Bの各時期ごとの合計T.jの期待値と分散は次のようになります。





これらをもとにしてT.jを標準化すると、次のようになります。

zjの平方を合計して自由度の修正をしたものは、近似的に自由度(b-1)のχ2分布をします。

この場合も通常は連続修正をしません。

全体の変動は、ブロックごとのデータの並びが全て一致した時の要因Bの変動と等しくなります。 例えばB1だけが1で他は0の場合を考えますと、次のようになります。

これは要因Aの変動を取り除いた時の全変動であり、同時にその自由度でもあります。 したがって要因Bの寄与率RB2は次のようになります。

表4.26のデータを順位が2つだけの順序分類データと考え、フリードマンの検定を適用しますと次のようになります。











となり、コックランのQ検定の計算式と一致します。 したがって要因Bの時期数が2つの時には、当然、マクネマーの検定における連続修正を加えない式に一致します。 (→4.2 多標本の計数値 (注5))

表4.26の例題について実際に計算してみましょう。




(注4) 繰り返しのある二元配置型の2分類データは、要因Aの水準数つまり群数をa、群Aiの繰り返し数つまり例数をni、要因Bの水準数つまり時期数をbとし、「有」に相当する時は1、「無」に相当する時は0となるダミー変数yを用いると前節(注6)の表4.22と同じ型式で表すことができます。 そして時期ごとに群と2分類データをクロス集計すると、前節(注6)の表4.23で順序数cを2つだけにした、次のような表になります。

表4.29 時期kのa×2分割表
群\分類0(無)1(有)
A1xk10xk11nk1
::::
Aixki0xki1nki
::::
Aaxka0xka1nka
Xk0Xk1Nk

これらb個のa×2分割表に一般化拡張マンテル検定を適用すれば、群と2分類データの共通性と異質性を検定することができます。 この場合の共通性の検定は、b個のa×2分割表に共通して存在する群と2分類の関連性の有無、つまり群によって出現率に違いがあるかどうかを検定します。 この検定は、繰り返しのある二元配置分散分析の要因Aの検定に対応します。 そして異質性の検定は、群による出現率の違いが時期によって異なっているかどうかを検定します。 この検定は、繰り返しのある二元配置分散分析の交互作用の検定に対応します。

この場合、時期つまり要因Bはブロック因子になり、時期によって出現率が異なるかどうかの検定つまり要因Bの検定は行いません。 時期の検定を行いたい時は時期を要因Aに、群を要因Bにして、群ごとに時期と分類データをクロス集計してa個のb×2分割表を作成する必要があります。

群数aが2つだけの時は、一般化拡張マンテル検定の代わりに順序数cが2つだけの拡張マンテル検定を適用することになります。 しかしその場合はマンテル・ヘンツェルの検定を利用したより正確な手法があり、その手法の方がよく用いられます。 まず時期kの2×2分割表についてマンテル・ヘンツェル検定のχMk2を計算すると、次のようになります。




b個の2×2分割表を総合してnk11を正規近似すると、次のようになります。





実は拡張マンテル検定はこの検定を順序データに拡張した手法であり、順序数cが2つの時の共通性の検定はこの検定の連続修正をはずした式と一致します。 異質性の検定は次のような方法で計算することもでき、こちらの方が多少正確になります。 この手法はブレスロー・デイ(Breslow-Day)の検定と呼ばれています。









ブレスロー・デイの検定は、表内度数の合計Σxk10、Σxk11、Σxk20、Σxk21のどれかが0の時は計算できません。 そこで各表の表内度数に0がある時は、表内度数に0.5を加え、それに応じて周辺度数にも1を加えて計算します。 これは、次に説明するオッズ比を用いた検定におけるウールフの修正と同じ目的の修正です。

マンテル・ヘンツェルの検定と同じような分析を、3.4 2標本の計数値 (注7)で説明したオッズ比を用いて行うことができます。 ただしマンテル・ヘンツェルの検定よりもオッズ比の検定の方が若干ラフな検定ですから、この手法は少しラフな結果になります。 この場合も各表の表内度数に0がある時は、表内度数に0.5を加えるウールフの修正を施します。