玄関雑学の部屋雑学コーナー統計学入門

4.2 多標本の計数値

データが計数値で標本の数が多数の場合には、2標本の場合と同じように主にノンパラメトリック手法を用います。 そしてデータが順序尺度の時と名義尺度の時では、やはり扱いが異なります。

(1) 順序尺度(順序データ)

データが順序尺度か順序分類尺度の時には、順位を利用した分散分析相当の手法を適用します。 話の都合上、ここでもデータに対応がない場合から説明しましょう。

1) データに対応がない場合

表4.1のデータを10刻みでグレード付けして重症度に相当するような順序分類尺度にし、2標本の場合と同様にして順序付けしてみましょう。 (→3.4 2標本の計数値)

表4.18 薬剤投与群別収縮期血圧のグレード
群内No.A剤投与群B剤投与群C剤投与群
1111010
2121010
3121010
4131111
5141111

 

表4.19 グレードの例数と順位
グレード1011121314順位和順位平均
A剤投与群0121156312.6
B剤投与群32000528.55.7
C剤投与群32000528.55.7
65211151208
順位3.5912.51415---

ご覧のようにA剤投与群の中央値はグレード12であり、B剤投与群とC剤投与群の中央値はグレード10です。 2群の場合と同様に、これら3群における分布の中心位置が等しければそれらの順位和(例数が異なる時は順位平均)は等しく、中心位置にズレがあれば順位和は異なるはずです。 このことを利用して3群のグレード分布の中心位置が等しいかどうか、言い換えますと、薬剤という要因によってグレード分布の中心位置が変動するかどうかを検討するのが「クリスカル・ウォーリス(Kruskal-Wallis)のH検定」と呼ばれる手法です。 これはウィルコクソンの順位和検定を多群に拡張したもので、計数値における一元配置分散分析に相当します。 この検定の帰無仮説は次のように表すことができます。

H0:要因A(薬剤)によってグレード分布の中心位置は変動せず、各群のグレード分布の中心位置は等しい。

分散分析と同様に全体の順位平均と各群の順位平均とのズレを平方し、それらを合計した値が分散分析における要因Aの平方和SAに相当する値になります。 この時、全体の順位平均は理論度数であり、各群の順位平均は実現度数であると考えられますので、この値はχ2分布をすることになります。 したがって、

要因Aの自由度φA=群数-1
要因Aの平方和SAo2≧χ2A,α)の時有意水準100・α%で有意

とするか、χo2から有意確率p値を求めて検定を行うことができます。 またこの場合の寄与率RAは、χo2を全体の自由度で割った値になります。 (注1)

全体の自由度φT=全例数-1
要因Aの寄与率RA2= χo2
―――
φT

有意水準5%として、表4.18の例題について実際に計算すると次のようになります。

χo2=8.817 (p=0.0122)>χ2(2,0.05)=5.991…有意水準5%で有意
RA2=0.630(63.0%)

この結果についての考察点は分散分析と同様で、3群のグレード分布が2ランクほどずれているということと、寄与率が約60%あるということが医学的にみても意味があることならば、

医学的結論:薬剤A、B、Cの降圧効果は同一ではない。 すなわち薬剤B、Cには降圧効果がある。

ということになります。

分散分析と同様にこの手法でも多重比較を行うことができ、やはりダネット型、チューキー型、ボンフェローニ型、シェッフェ型の4種類があります。 これらの手法は利用する検定統計量が多少異なっているだけで、原理や特徴は分散分析の場合と全く同じです。

ボンフェローニ型の多重比較を用いて例題について実際に計算すると、次のような結果になります。 (注2)

・A剤投与群対B剤投与群:to=2.571 p=0.0304
・A剤投与群対C剤投与群:to=2.571 p=0.0304
・B剤投与群対C剤投与群:to=0 p=1

これらの結果に対する注意点も分散分析と同様で、A剤投与群に比べてB、C剤投与群のグレード分布が2ランクほど小さいということが医学的にみても降圧効果として評価できれば、

医学的結論:薬剤B、Cには降圧効果があり、薬剤A(プラセボ)に比べてどちらも血圧のグレードを2ランクほど低下させる。

ということになります。

またクリスカル・ウォーリスのH検定と多重比較において、群の数が2つの場合はウィルコクソンの2標本検定(マン・ホイットニィのU検定)に相当し、χ2値の平方根がz値に対応します。 (注3) (→3.4 2標本の計数値)

2) データに対応がある場合

今度は表4.6のデータを10刻みでグレード付けし、対応のある順序分類尺度にしてみましょう。

表4.20 収縮期血圧グレードの変化
投与前投与1週後投与2週後
1111010
2121010
3121010
4131111
5141111

 

表4.21 収縮期血圧グレードの人別順位
投与前投与1週後投与2週後同位の数
131.51.52
231.51.52
331.51.52
431.51.52
531.51.52
順位和157.57.5-

このデータではグレードを変動させる要因は個人差と時期の2つであり、人を要因A、時期を要因Bとした二元配置分散分析と同じデータ構造をしています。 したがって個人差を誤差として時期を要因Aとすれば、クリスカル・ウォーリスのH検定を適用できます。 しかし人をブロック因子として個人差を誤差から取り除いた方が効率が良くなるので、その方法を考えてみましょう。

まず人ごとに3時期のデータを順序付けし、表4.21のようにまとめてみます。 同位の値の扱いは今までと同じです。 この場合の順位は人ごとに付けていますから、各時期の順位和は個人差を取り除いたものになります。 もし時期という要因がデータを変動させなければ、各時期におけるグレード分布の中心位置は等しく、それぞれの順位和は一致するはずです。

このことを利用し、個人差を取り除いた時の各時期におけるグレード分布の中心位置にズレがあるかどうかを検定するのが「フリードマン(Friedman)の検定」という手法で、計数値における繰り返しのない二元配置分散分析に相当します。

検定の帰無仮説は次のように表すことができます。

H0:要因B(時期)によってグレードは変動せず、各時期におけるグレード分布の中心位置は等しい。

分散分析と同様に全体の順位平均と各時期の順位平均とのズレを平方し、それらを合計した値が分散分析における要因Bの平方和SBに相当する値になります。 この値はクリスカル・ウォーリスのH検定と同様にχ2分布をしますので、

要因Bの自由度φB=時期数-1
要因Bの平方和SBo2≧χ2B,α)の時有意水準100・α%で有意

とするか、χo2から有意確率p値を求めて検定を行うことができます。 この手法の場合、順位和そのものから要因Aによる変動分を差し引いてありますから、分散分析と違って要因Aの平方和は求められません。

またこの場合の寄与率RBは、クリスカル・ウォーリスのH検定と同様にχo2を全体の自由度で割った値になりますが、全体の自由度も要因Aの分を差し引いたものになります。 (注4)

全体の自由度φT=データ数-例数(要因Aの水準数)
要因Bの寄与率RB2= χo2
―――
φT

クリスカル・ウォーリスのH検定と同様にこの手法でも要因Bに関する多重比較を行うことができ、やはりダネット型、チューキー型、ボンフェローニ型、シェッフェ型の4種類があります。 そしてフリードマンの検定と多重比較において時期数が2つの場合は、順位が2つだけの時のウィルコクソンの1標本検定つまりマクネマーの検定に相当し、χ2値の平方根がz値に対応します。 (注5)

有意水準5%として、表4.20の例題について実際に計算すると次のようになります。

・要因B
 χo2=10 (p=0.0067)>χ2(2,0.05)=5.991…有意水準5%で有意
 RB2=1(100%)
・多重比較(ボンフェローニ型)
 A剤投与群対B剤投与群:to=2.739 p=0.0185
 A剤投与群対C剤投与群:to=2.739 p=0.0185
 B剤投与群対C剤投与群:to=0 p=1

人ごとの順位付けが全て同じで、投与前に比べて投与1・2週間後が低下していますので寄与率が100%になっています。 これらの結果に対する注意点は分散分析と同様で、血圧の自然変動が無視でき、グレードの低下が医学的にも評価できるとしますと、

医学的結論:薬剤の投与によって投与1・2週後の収縮期血圧は低下する。

ということになります。

対応のある順序データなどというものは医学・薬学分野ではあまりお目にかかりませんので、フリードマンの検定もあまり知られていません。 また順序データの場合、繰り返しのある二元配置分散分析に相当する手法として「拡張マンテル(Mantel)検定」と「一般化拡張マンテル検定」という手法があります。 これはマンテル・ヘンツェル検定を拡張した手法ですが、フリードマンの検定以上に稀にしか使われないのでほとんど知られていません。 実際問題として、いくら数学的に正確とはいえ、わけのわからない順位和などを利用するよりも、順位をそのまま計量値として扱ってしまう方が扱いが簡単ですし、結果を医学的に解釈するのも容易です。 (注6)

統計学とはデータを要約してその内容をわかりやすくするためのものですから、統計手法を用いたがためにかえって結果が理解しにくくなったり、解釈しにくくなってしまっては何にもなりません。 ガチガチに頭の固い数学者ならともかく、我々常人は実用性を重んじ、「難解な厳密さ」よりも「単純な明快さ」を選びましょう。


(注1) 要因Aの群数(水準数)をa、各群の例数をr、全例数をnとしてクリスカル・ウォーリスのH検定の計算式を導いてみましょう。 まずn個のデータを込みにして順位付けを行い、各群ごとに順位和Ti(i=1,…,a)を求めます。 帰無仮説、

H0:A0〜Aa群の母集団における順位分布の中心位置は全て等しい。

より、Tiの期待値と分散は次のようになります。

Tn= a
Σ
i=1
Ti= n(n+1)
――――
2
n=a・r
E(Ti)=r・E(i)= r(n+1)
――――
2
V(Ti)=r・V(i)+2C(i,j)・ r(r-1)
――――
2
   = r(n+1)(n-1)
――――――
12
+2 -(n+1)
――――
12
r(r-1)
――――
2
   = r(n+1)(n-r)
――――――
12

これらをもとにして順位和Tiを標準化しますと、次のようになります。

zi= Ti-E(Ti)
―――――
√V(Ti)
= Ti-r(n+1)/2
――――――――――
√{r(n+1)(n-r)/12}

ziは近似的に標準正規分布をしますので、それらを平方して合計したものは近似的に自由度aのχ2分布をすると考えられます。 しかし要因Aの自由度が(a-1)である関係から、自由度の修正をして、

χo2= a-1
――
a
a
Σ
i=1
zi2 = a-1
――
a
Σ{Ti-r(n+1)/2}2
―――――――――
r(n+1)(n-r)/12
  = 12(a-1)
――――――
a(n+1)(n-r)
Σ{ Ti2
――
r
-(n+1)Ti r(n+1)2
――――
4
}
  = 12(n/r-1)
―――――――
n(n+1)(n-r)/r
Ti2
――
r
-(n+1)Tn n(n+1)2
――――
4
}
  = 12(n-r)
――――――
n(n+1)(n-r)
Ti2
――
r
- 2Tn2
―――
n
+ Tn2
――
n
)
  = 12
――――
n(n+1)
Ti2
――
r
- Tn2
――
n
)
  = 6
――
Tn
Ti2
――
r
- Tn2
――
n
)= 6
――
Tn
Σ Ti2
――
r
- 6Tn
――
n

という値が自由度(a-1)のχ2分布をします。 (→付録1 各種の確率分布)

より正確にはそれぞれのziについて連続修正をしなければなりませんが、そうしますと非常に煩雑な式になりますので通常は連続修正をしません。 同位の値があれば、2標本の場合と同様に同位の補正を用いて次のようにします。

平均順位rj= Σrj-1+ gj+1
―――
2
同位の補正K=1- Σ(gj3-gj)
――――――
n3-n
χo2= 6
――
KTn
Ti2
――
r
- Tn2
――
n
)

全体の変動は各群が1例で、しかもその値がそれぞれ異なっている時の要因Aの変動に等しくなりますから、

Ti=i
χT2= 6
――
Tn
Ti2
――
1
- Tn2
――
n
)= 6
――
Tn
(Σi2- Tn2
――
n
)
  = 6・2
――――
n(n+1)
{ n(n+1)
―――――
(2n+1)・6
- n(n+1)2
――――
4
}
  =6( 2n+1
―――
3
- n+1
――
2
) =4n+2-3n-3=n-1

となり、全体の自由度と等しくなります。 したがって要因Aの寄与率RA2は次のようになります。

RA2= χo2
――
χT2
= χo2
――
n-1

各群の例数が不揃いの時は次のようになります。

n= a
Σ
i=1
ri (i=1,…,a)
χo2= 6
――
KTn
Ti2
――
ri
- Tn2
――
n
)

要因Aについての検定は次のようになります。

χo2≧χ2A,α)の時有意水準100・α%で有意

表4.18の例題について実際に計算してみましょう。

T1=63  T2=28.5  T3=28.5  Tn=120
K=1- 336
―――
3360
=1-0.1=0.9
χo2= 6
―――――
0.9×120
×( 632
――
5
+ 28.52
―――
5
+ 28.52
―――
5
- 1202
――
15
)
  = 158.7
―――
108
≒8.817 (p=0.0122)>χ2(2,0.05)=5.991
RA2= 8.817
―――
14
≒0.630(63.0%)

(注2) 順位和検定における多重比較の計算式は次のとおりです。

(0) フィッシャー型(LSD(Least Significant Difference)法)

この方法は試験の計画段階で指定した特定の2群の比較だけ行い、2種類以上の検定結果を総合したファミリーとしての結論は作らない特殊な方法であり、厳密な意味では多重比較とはいえません。 しかし統計学の解説書に載っていたり、統計学ソフトに組み込まれていたりしますので、一応、紹介しておきます。

H検定の結果が有意という条件付きで、2種類以上の2群比較にフィッシャー型多重比較を用い、それらを総合してファミリーとしての結論を採用する手法を「PLSD(Protected Least Significant Difference)法」と呼ぶことがあります。 しかしこの手法は、3群以上になると多重性の調整が不十分なものになるので使用すべきではありません。

Tp:特定のp群の順位和  Tq:特定のq群の順位和  Tn:全体の順位和
r:両群の例数(同一)  a:群数  K:同位の補正
o= Tp/r-Tq/r
――――――――
√{(2/r)KTn/6}
= Tp/r-Tq/r
―――――――
√{KTn/(3r)}
|to|≧t(∞,α)の時有意水準100・α%で有意
t(∞,α):標準正規分布における100・α%点
(1) ダネット型(ダネットのd検定)

特定の群を対照として、他の全ての群を対照群と比較する時に用います。 この手法では群の数をaとすると(a-1)回の検定を行い、それらの検定は同じ対照群と比較するため独立ではなくお互いに相関があります。 このためファミリーとしての有意水準は各検定が独立である場合よりも小さくなり、その結果として個々の検定の有意水準はボンフェローニ型よりも少し大きくなります。 つまり個々の検定結果が有意になりやすくなるわけですが、ファミリーとしての結論の制約が厳しく、条件付きの結論しか採用できないのでこれは当然のことです。

Tp:p群の順位和  Tq:対照となるq群の順位和  Tn:全体の順位和
r:各群の例数(全て同一)  a:群数  K:同位の補正
o= Tp/r-Tq/r
――――――――
√{(2/r)KTn/6}
= Tp/r-Tq/r
―――――――
√{KTn/(3r)}
|do|≧d(a-1;∞,α)の時有意水準100・α%で有意
d(a-1;∞,α):ダネットの数表における群数a、自由度∞の100・α%点

統計学の教科書などに載っているd(a-1;∞,α)の値は、各群の例数が等しいことを前提にして計算した値です。 各群の例数が異なると検定間の相関関係が変化し、ファミリーとしての有意水準が変わってしまうためこの値は各群の例数が等しい時しか利用できません。 しかし最近は各群の例数が異なる時はd(a-1;∞,α)の値を補正して検定する少々手の込んだ手法が開発され、例数が異なる場合でもダネット型の多重比較を適用できるようになりました。

(2) チューキー型(チューキーのq検定、WSD(Wholly Significant Difference)法)

多群でリーグ戦を行う時、つまりあらゆる2群の比較をする時に用います。 群の数をaとすると{a×(a-1)/2}回の比較を行い、その中には同じ群と比較するものがあるので、ダネット型と同様に各検定は独立ではなくお互いに相関があります。 このためダネット型と同様に、各検定の有意水準はボンフェローニ型よりも少し大きくなります。

Tp:p群の順位和  Tq:q群の順位和  Tn:全体の順位和
r:各群の例数(全て同一)  a:群数  K:同位の補正
qo= Tp/r-Tq/r
――――――――
√{(1/r)KTn/6}
= Tp/r-Tq/r
―――――――
√{KTn/(6r)}
|qo|≧q(a;∞,α)の時有意水準100・α%で有意
q(a;∞,α):スチューデント化範囲の数表における群数a、自由度∞の100・α%点

統計学の教科書などに載っているq(a;∞,α)の値は、ダネットの数表と同様に各群の例数が等しいことを前提にして計算した値のため、各群の例数が等しい時しか利用できません。 しかし最近は各群の例数が異なる時はq(a;∞,α)の値を補正して検定する少々手の込んだ手法が開発され、例数が異なる場合でもチューキー型の多重比較を適用できるようになりました。

(3) ボンフェローニ型(ダンの多重比較)

ボンフェローニの不等式を利用し、個々の検定の有意確率に検定回数をかけたものを多重比較の有意確率にするだけという、極めて単純で基本的な手法です。 個々の検定の代わりにFisher型の多重比較の計算式を用い、それで得られた有意確率に検定回数を掛けてもかまいません。

個々の検定は独立であり、それらをORで結合して得られる結論をファミリーとしての結論にするという非常に緩い条件の手法なので、個々の検定の有意水準が小さくなって有意になりにくい反面、応用範囲が広いという特徴があります。 各群の例数が異なる時にダネット型やチューキー型の代用として用いるのはもちろん、どのような多重比較手法を用いれば良いかわからない時とか、多重比較手法がまだ開発されていない特殊な検定について多重比較を行いたい時は、とりあえずこの手法を用いておけば良いでしょう。

(4) シェッフェ型(シェッフェのs検定)

最も汎用性が高く、したがって最も有意になりにくい手法です。 この手法も各群の例数が異なる時にダネット型やチューキー型の代用として用いることができますが、その場合はボンフェローニ型の方が効率が良いので、この手法よりもボンフェローニ型を用いた方が良いでしょう。

Tp:p群の順位和  Tq:q群の順位和  Tn:全体の順位和
rp:p群の例数  rq:q群の例数  a:群数  K:同位の補正
χo2= (Tp/rp-Tq/rq)2
―――――――――
(1/rp+1/rq)KTn/6
χo2≧χ2(a-1,α)の時有意水準100・α%で有意
χ2(a-1,α):クリスカル・ウォーリスのH検定における基準のχ2値と同じ100・α%点

シェッフェ型はいくつかの群を合わせた平均値と、他のいくつかの群を合わせた平均値を比較することもできます。 これがこの手法の大きな特徴で、これを「一般対比」といい、次のような計算式を用います。

ri:i群の例数  Cti:i群の係数
a
Σ
i=1
Cti=0 (例えばCt1=1,Ct2=1,Ct3=-1,Ct4=-1,Ct5=0,…,Cta=0等)
χo2= (ΣCtiTi/ri)2
――――――――
Σ(Cti/ri)KTn/6
χo2≧χ2(a-1,α)の時有意水準100・α%で有意

ボンフェローニ型を用いて表4.18の例題について実際に計算してみましょう。

・A剤投与群対B剤投与群:
to= |63/5-28.5/5|
――――――――――
√(2×0.9×120/5/6)
= 6.9
―――
√7.2
  ≒2.571 標準正規分布より p=0.01013×3=0.0304
・A剤投与群対C剤投与群:
to= |63/5-28.5/5|
――――――――――
√(2×0.9×120/5/6)
= 6.9
―――
√7.2
  ≒2.571 標準正規分布より p=0.01013×3=0.0304
・B剤投与群対C剤投与群:
to=0 標準正規分布より p=1×3=3→p=1

シェッフェ型を用いると次のようになります。

・A剤投与群対B剤投与群:
χo2= (63/5-28.5/5)2
―――――――――――
(1/5+1/5)×0.9×120/6
= 47.61
―――
7.2
  ≒6.6125 (p=0.0367)>χ2(2,0.05)=5.991
・A剤投与群対C剤投与群:
χo2= (63/5-28.5/5)2
―――――――――――
(1/5+1/5)×0.9×120/6
= 47.61
―――
7.2
  ≒6.6125 (p=0.0367)>χ2(2,0.05)=5.991
・B剤投与群対C剤投与群:
χo2=0 (p=1) < χ2(2,0.05)=5.991

(注3) クリスカル・ウォーリスのH検定において要因Aの群数aを2にすると、

χo2= 6
――
KTn
Ti2
――
ri
- Tn2
――
n
)
  = 12
―――――
K・n(n+1)
{ T12
――
r1
+ T22
――
r2
- n(n+1)2
――――
4
}
  = 12
―――――
K・n(n+1)
(r2T1-r1T2)2
――――――――
r1r2n
  = {T1-r1(n+1)/2}2
――――――――――
K・r1r2(n+1)/12
=zo2

となり、ウィルコクソンの2標本検定における連続修正を加えない式に一致します。 (→3.4 2標本の計数値)

(注4) 要因Aの水準数(例数)をa、要因Bの水準数(時期数)をb、全データ数をn(=a・b)としてフリードマンの検定の計算式を導いてみましょう。 要因Aの各ブロック(人)ごとに順位付けを行いますから、ブロックごとの順位和は全てb(b+1)/2になり、全体の順位和Tは次のようになります。

n=a・b
T= a・b(b+1)
―――――
2
= n(b+1)
――――
2

帰無仮説、

H0:要因Bによってデータは変動せず、母集団におけるB1〜Bb時期の順位分布の中心位置は全て等しい。

より、要因Bの各時期ごとの順位和Tj(j=1,…,b)の期待値と分散は次のようになります。

T= b
Σ
j=1
Tj= n(b+1)
――――
2
E(Tj)=a・E(j)= a(b+1)
――――
2
= T

b
V(Tj)=a・V(j)= a(b+1)(b-1)
――――――
12

これらをもとにして順位和Tjを標準化しますと、次のようになります。

zj= Tj-E(Tj)
――――――
√V(Tj)
= Tj-T/b
――――――――――
√{a(b+1)(b-1)/12}

クリスカル・ウォーリスのH検定と同様に、zjの平方を合計して自由度の修正をしたものは近似的に自由度(b-1)のχ2分布をします。

χo2= b-1
――
b
b
Σ
j=1
zj2 = b-1
――
b
Σ{Tj-T/b}2
――――――――
a(b+1)(b-1)/12
  = 12
――――
ab(b+1)
b
Σ
j=1
(Tj2- 2Tj・T
――――
b
+ T2
――
b2
)
  = 6a
――
T
Tj2
――
a
- T2
――
n
)= 6(Σ Tj2
――
T
- T

b
)

この場合も通常は連続修正をしません。 そして同位の値があれば、同位の補正を用いて次のようにします。

同位の補正K=1- Σ(gk3-gk)
――――――
a(b3-b)
χo2= 6a
――
KT
Tj2
――
a
- T2
――
n
) = 6

K
Tj2
――
T
- T

b
)
χo2≧χ2(b-1,α)の時有意水準100・α%で有意

b個のデータが全て同位の値であるブロックについては、それらのデータを全て省いて計算しても同じ結果になります。 例えばC個のブロックが全て同位の時、ブロック数をa'=a-c、全体の順位和をT'、同位の補正をK'としますと、次のようにχo2値は変わりません。

T'= a'・b(b+1)
――――――
2
= a

a'
・T
K'=1- Σ(gk3-gk)-c(b3-b)
――――――――――
a'(b3-b)
= a'

a
・K
χo2= 6a'
――――
K'・T'
{Tj-c(b+1)/2}2
――――――――
a'
- T'2
――
a'b
]
  = 6a'
――
KT
a

a'
Tj2
――
a
- T2
――
ab
)= 6a
――
KT
Tj2
――
a
- T2
――
n
)

全体の変動はブロックごとの順位が全て一致し、しかも同位の値がない時の要因Bの変動と等しくなりますから次のようになります。

Tj=a・j
χT2= 6a

T
Tj2
――
a
- T2
――
n
)= 6a

T
(aΣj2 - T2
――
n
)
  = 6a

T
{ ab(b+1)(2b+1)
―――――――
6
- T2
――
ab
}
  = 6a( 2b+1
―――
3
- b+1
――
2
)=a(4b+2-3b-3)=a(b-1)=n-a

これは要因Aの変動を取り除いた時の全変動であり、同時にその自由度でもあります。 したがって要因Bの寄与率RB2は次のようになります。

RB2= χo2
―――
χT2
= χo2
―――
n-a

この値は見方を変えればブロックごとの順位付けがどの程度一致しているかを表す値でもあるので、「ケンドール(Kendall)の一致係数(coefficient of concordance)W」とも呼ばれています。 (→5.4 級内相関係数と一致係数)

要因Bに関する多重比較はクリスカル・ウォーリスのH検定と同様ですが、次のように標準誤差(計算式の分母)が若干変わります。

(0) フィッシャー型(LSD(Least Significant Difference)法)
Tp:特定のp時期の順位和 Tq:特定のq時期の順位和 T:全体の順位和
a:例数  K:同位の補正
to= Tp/a-Tq/a
―――――――――
√{(2/a)KT/(6a)}
= Tp-Tq
―――――
√(KT/3)
|to|≧t(∞,α)の時有意水準100・α%で有意
t(∞,α):標準正規分布における100・α%点
(1) ダネット型(ダネットのd検定)
Tp:p時期の順位和  Tq:対照となるq時期の順位和  T:全体の順位和
a:例数  K:同位の補正
do= Tp/a-Tq/a
―――――――――
√{(2/a)KT/(6a)}
= Tp-Tq
―――――
√(KT/3)
|do|≧d(b-1;∞,α)の時有意水準100・α%で有意
d(b-1;∞,α):ダネットの数表における時期数b、自由度∞の100・α%点
(2) チューキー型(チューキーのq検定、WSD(Wholly Significant Difference)法)
Tp:p時期の順位和  Tq:q時期の順位和  T:全体の順位和
a:例数  K:同位の補正
qo= Tp/a-Tq/a
―――――――――
√{(1/a)KT/(6a)}
= Tp-Tq
―――――
√(KT/6)
|qo|≧q(b;∞,α)の時有意水準100・α%で有意
q(b;∞,α):スチューデント化範囲の数表における時期数b、自由度∞の100・α%点
(3) ボンフェローニ型(ダンの多重比較)

2時期ごとにウィルコクソンの1標本検定を行うかフィッシャー型の多重比較を行い、その有意確率に検定の回数を掛けた値を有意確率にします。

(4) シェッフェ型(シェッフェのs検定)
Tp:p時期の順位和  Tq:q時期の順位和  T:全体の順位和
a:例数  K:同位の補正
χo2= (Tp/a-Tq/a)2
―――――――――
(1/a+1/a)KT/(6a)
= (Tp-Tq)2
―――――
KT/3
χo2≧χ2(b-1,α)の時有意水準100・α%で有意
χ2(b-1,α):フリードマンの検定における基準のχ2値と同じ100・α%点

一般対比は次のようになります。

Ctj:j時期の係数
b
Σ
j=1
Ctj=0
χo2= (ΣCtjTj/a)2
―――――――――
Σ(Ctj/a)KT/(6a)
= (ΣCtjTj)2
――――――
Σ(Ctj)KT/6
χo2≧χ2(b-1,α)の時有意水準100・α%で有意

表4.20の例題について実際に計算してみましょう。

・フリードマンの検定
  T1=15  T2=7.5  T3=7.5  T=30
  K=1- 5×(23-2)
―――――
5×(33-3)
=1- 30
――
120
=1-0.25=0.75
  χo2= 6×5
――――
0.75×30
( 152
――
5
+ 7.52
――
5
+ 7.52
――
5
- 302
――
15
)=10
  χo2=10 (p=0.0067)>χ2(2,0.05)=5.991
  RB2= 10
―――
15-5
=1(100%)
・ボンフェローニ型多重比較
 投与前対投与1週後:
  to= |15-7.5|
――――――――
√(0.75×30/3)
=2.739
   標準正規分布より p=0.00617×3=0.0185
 投与前対投与2週後:
  to= |15-7.5|
――――――――
√(0.75×30/3)
=2.739
   標準正規分布より p=0.00617×3=0.0185
 投与1週後対投与2週後:
  to=0 標準正規分布より p=1×3=3→p=1

(注5) フリードマンの検定において要因Bの時期数bを2にしますと、順位は1と2だけになります。 2つのデータが同位の値の場合はどちらの順位も1.5になりますが、ブロック内のデータが全て同位の時は計算から省きますので、1.5という順位は計算とは無関係になると同時に同位もなくなります。 B1時期における順位1の個数をx、順位2の個数をyとすると、

a=x+y  n=2a
T1=x+2y=a+y  T2=y+2x=a+x
T= 2a(2+1)
――――
2
=3a
χo2= 6a

T
・(Σ Tj2
――
a
- T2
――
n
)=2{ (a+y)2
――――
a
+ (a+x)2
――――
a
- 9a

2
}
  = 2(x-y)2
――――
2a
= (x-y)2
――――
a
=zo2

となり、マクネマーの検定における連続修正を加えない式に一致します。 したがってこの式は、ウィルコクソンの1標本検定において順位が2つだけの時の連続修正を加えない式にも一致します。 (→3.2 1標本の計数値)

(注6) 繰り返しのある二元配置型の順序データは、要因Aの水準数つまり群数をa、群Aiの繰り返し数つまり例数をni、要因Bの水準数つまり時期数をbとし、順序データyの順序数をcとして次のように表すことができます。 ただし要因Bは時期とは限らず、例えば性別や疾患分類などでもかまいません。

表4.22 繰り返しのある二元配置型の順序データ
群(要因A)\時期(要因B)B1BkBb
A1y111y1k1y1b1
:::
y11ky1kky1bk
:::
y11r1y1kr1y1br1
::::
Aiyi11yik1yib1
:::
yi1kyikkyibk
:::
yi1riyikriyibri
::::
Aaya11yak1yab1
:::
ya1kyakkyabk
:::
ya1rayakrayabra

時期ごとに群と順序データをクロス集計すると、次のようなa×c分割表がb個できます。

表4.23 時期kのa×c分割表
群\順序データy1yjyc
A1xk11xk1jxk1cnk1
:::::
Aixki1xkijxkicnki
:::::
Aaxka1xkajxkacnka
Xk1XkjXkcNk

この時期kのa×c分割表に一般化拡張マンテル検定を適用すると、次のようになります。 なおこの計算では行列とベクトルを用いますので、ここと同じ雑学コーナーに展示してある「ベクトルと行列」を参考にしてください。 このページを参考にしても内容がチンプンカンプンの時は、計算式を無視していただいてかまいません。

χgMm2=[-]'-1[-]
=





u1

ui

ua-1






  =





e1

ei

ea-1






=





w11

wi1

w(a-1)1




w1i

wii

w(a-1)i




w1(a-1)

wi(a-1)

w(a-1)(a-1)






ui= b
Σ
k=1
( c
Σ
j=1
rkj・xkij)
ei= b
Σ
k=1
( c
Σ
j=1
rkj nki・Xkj
―――――
Nk
)
wii= b
Σ
k=1
nki(Nk-nki)
――――――
Nk-1
σk,r2
wii'=- b
Σ
k=1
nki・nki'
―――――
Nk-1
σk,r2  (i≠i')
Nk= a
Σ
i=1
nki
rkj=Xk1+…+Xk(j-1)+ Xkj+1
―――
2
r~k= c
Σ
j=1
rkj Xkj
――
Nk
σk,r2= c
Σ
j=1
(rkj-r~k)2 Xkj
――
Nk
= 1
――
Nk
( c
Σ
j=1
rkj2・Xkj-Nk・r~k2)
χgMk2=(上式でk=kの1つだけについて計算した値)
χgMT2= b
Σ
k=1
χgMk2
χgMr2gMT2gMm2
χgMm2≧χ2(a-1,α)の時有意水準100・α%で有意 … 共通性の検定
χgMr2≧χ2((a-1)(b-1),α)の時有意水準100・α%で有意 … 異質性の検定

共通性の検定は、b個のa×c分割表に共通して存在する群による平均順位のズレ、つまり時期を通して群によって順位データの中心位置がずれているかどうかを検定します。 この検定は繰り返しのある二元配置分散分析の要因Aの検定に対応します。 異質性の検定は、b個のa×c分割表において群と平均順位のズレ具合に違いがあるかどうかを検定します。 この検定は繰り返しのある二元配置分散分析の交互作用の検定に対応します。 異質性の検定結果が有意の時は、群による平均順位のズレ具合が時期によって異なっているということになります。 このためb個のa×c分割表を総合して平均順位のズレを検定することは不適当ということになり、共通性の検定は意味を持たなくなります。

この検定法の場合、時期つまり要因Bはブロック因子になり、時期によって平均順位が異なるかどうかの検定つまり要因Bの検定は行いません。 時期の検定を行いたい時は時期を要因Aに、群を要因Bにして、群ごとに時期と順序データをクロス集計してa個のb×c分割表を作成する必要があります。

ちなみに、共通性の検定は時期数bが1つの時はクリスカル・ウォーリスのH検定と一致します。 また群数aが2で時期数がbの時は次のような式になります。

χgMm2=[ b
Σ
k=1
{ c
Σ
j=1
rkj(xk1j- nk1・Xkj
―――――
Nk
)}]2
     [ b
Σ
k=1
{ nk1・nk2
―――――
Nk(Nk-1)
( c
Σ
j=1
rkj2・Xkj-Nk・r~k2)}]-1

この式の順位rkjの代わりに、時期を合わせた共通順位r.jを用いて計算する方法もあります。 その方法を拡張マンテル検定といい、群数が2つの時はこの手法がよく用いられます。

χeMk2={ c
Σ
j=1
r.j(xk1j- nk1・Xkj
―――――
Nk
)}2
     { nk1・nk2
―――――
Nk(Nk-1)
( c
Σ
j=1
r.j2・Xkj-Nk・r~k2)}-1
r.j=X.1+…+X.(j-1)+ X.j+1
―――
2
X.j= b
Σ
k=1
Xkj
r~k= c
Σ
j=1
r.j Xkj
――
Nk
χeMm2=[ b
Σ
k=1
{ c
Σ
j=1
r.j(xk1j- nk1・Xkj
―――――
Nk
)}]2
     [ b
Σ
k=1
{ nk1・nk2
―――――
Nk(Nk-1)
( c
Σ
j=1
r.j2・Xkj-Nk・r~k2)}]-1
χeMT2= b
Σ
k=1
χeMk2
χeMr2eMT2eMm2
χeMm2≧χ2(1,α)の時有意水準100・α%で有意 … 共通性の検定
χeMr2≧χ2(b-1,α)の時有意水準100・α%で有意 … 異質性の検定

時期数bが1つの時、共通性の検定はウィルコクソンの順位和検定の連続修正をしない式、つまり群数が2つの時のクリスカル・ウォーリスのH検定と一致します。 そして時期数bが1つで順位数cが2つだけの時、共通性の検定はマンテル・ヘンツェルの検定の連続修正をしない式と一致します。 順位数cが2つだけで時期数bが2つ以上の時は、拡張マンテル検定を適用する代わりに連続修正を施したマンテル・ヘンツェルの検定を利用して共通性の検定を行うことができます。 その手法については次節の(注4)で説明します。 (→3.4 2標本の計数値 (注6)4.4 多標本の計数値 (2) 名義尺度 (注4))