玄関雑学の部屋雑学コーナー統計学入門

3.2 1標本の計数値

データが計数値で標本の数が1つの時は、主にノンパラメトリック手法を用います。 ただしデータが順序尺度の時と名義尺度の時では扱いが異なります。

(1) 順序尺度(順位データ)

第2章で説明したように数値と数値の間隔が同じではないため通常の四則演算は行えないものの、データに順序を付けることのできるものが順序尺度のデータです。 そのため重症度や改善度のようにデータが具体的な計量値ではなくても、科学的に順序が付けられる時は順序尺度のデータとして扱います。 このデータは平均値や標準偏差を求めることができないため、データそのものではなく、データを小さい順に並べかえた時の順位(rank)を用いて色々な統計計算を行います。

例として第1節の表3.1.1のデータを順序尺度として扱い、要約値を求めてみましょう。 (注1)

表3.1.1 脂質異常症患者のTC(mg/dL)
No.12345678910
TC219221221222222224225227231238
図3.1.1 度数分布 図3.1.2 累積度数分布
○計量尺度として扱った場合
例数 = 10  平均値 = 225  標準偏差 = 6  標準誤差 = 1.8
母平均μの95%信頼区間 = 225±4.1 → 下限:μL = 220.9 上限:μU = 229.1
○順序尺度として扱った場合
例数 = 10  中央値 = 223   範囲 = 19 (正規分布の場合:)
母中央値μ'の95%信頼区間 下限:μ'L = 221 上限:μ'U = 231

なにぶん例数が少ないのではっきりとは言えないものの、図3.1.1の度数分布と図3.1.2の累積度数分布を見ると、データの分布が少し左に偏っていて——これを左傾といいます——正規分布から少しずれているようです。 そのため平均値225は中央値223よりもやや大きく、7番目のデータと同じ値になっています。 しかし計量尺度として扱った時も順序尺度として扱った時も要約値は大して変わらず、この程度のズレなら正規分布と考えてしまってかまわないことがわかります。

ちなみにデータが対数正規分布すると仮定し、対数変換して計量値として扱うと次のようになります。

図3.2.1 対数変換後の度数分布 図3.2.2 対数変換後の累積度数分布
○対数変換後のデータ:y=log(x)
例数 = 10  平均値 = 2.352  標準偏差 = 0.011  標準誤差 = 0.0034
母平均μの95%信頼区間 = 2.352±0.0077 → 下限:μL = 2.344 上限:μU = 2.360
○元のデータに戻した時:x = 10y   変動係数:
例数 = 10  幾何平均値 = 225  変動係数:CV = 0.025 → 標準偏差 = 225×0.025 ≒ 6
母幾何平均μ*の95%信頼区間  下限:μ*L = 220.9 上限:μ*U = 229.0

ご覧のように、このデータの場合、データ数が少ないこともあって対数変換しても元の結果とほとんど変わりません。 医学・薬学で扱うデータは対数正規分布風の分布をするものが多く、分布の形だけで判断して対数変換して処理したり、ノンパラ手法を適用したりすることがよくあります。 しかし第2章で説明したように、統計手法はデータの分布状態ではなく医学・薬学的に見てどの要約値が一番意義があるか、つまり医学・薬学的にどの要約値が評価指標としてふさわしいかという観点から決めるべきです。 (→2.2 データの分布と統計手法)

このデータの場合も平均値を評価指標として用いるのが医学的に妥当なら、分布の形によらず計量尺度扱いした結果を採用すべきです。 そうではなく実測値よりも順序の方が医学的に重要であり、順位平均値を評価指標として用いるのが妥当なら分布の形によらず順序尺度扱いした結果を採用すべきです。 また10→1という変化と100→10という変化が医学的に同等であり、幾何平均値を評価指標として用いるのが妥当なら対数変換して計量尺度扱いした結果を採用すべきです。

例えばマラソンレースの場合、競技者の実力はタイムに反映されるので競技者の実力を客観的に評価したい時は計量尺度であるタイムを評価指標にします。 しかしレースの結果を重視し、競技者の相対的な成績を評価したい時は順序尺度である順位を評価指標にします。 つまりコーチのように競技者の実力を評価したい時はタイムを評価指標にし、マスコミのスポーツ報道のようにレースの結果だけを評価したい時は順位を評価指標にするわけです。 ただし順位を評価指標にした時は、それを競技者の実力と勘違いしないように注意が必要です。 例えば1位と2位のタイム差が1時間でも1秒でも順位は同じですが、競技者の実力差は全く違うからです。

順序尺度では、母集団を特定の基準値で2分した時、基準値よりも大きい群のデータと、基準値よりも小さい群のデータが同じように分布しているかどうかを検定する手法があります。 この手法はウィルコクソン(Wilcoxon)の1標本検定またはウィルコクソンの符号付き順位検定(signed rank test)と呼ばれるもので、順序尺度における1標本t検定に相当します。

第1節と同様に170mg/dLをTCの正常値と考えて、これを基準値μ0にします。 そして母集団である脂質異常症患者を、TCがこの基準値よりも大きい群と小さい群に2分します。 そのため表3.1.1のデータから170を引いた差dをあらためてデータにし、差が0のデータを除いて正・負に分けて整理します。 このデータの場合、差dは全て正です。 次に差の絶対値|d|に順位を付けます。 この時、51や52のように同じ値が2つ以上ある時は、それらを同位の値(tied value)と呼んで全てに次のような平均順位を付けます。

第k番目からg個が同位の時の平均順位:
51の場合:   52の場合:

さらにこうして付けた順位を正・負群別に合計して順位和を求めます。 そして正群の順位和から負群の順位和を引いた符号付き順位和を求め、それを例数で割って符号付き順位平均値を求めます。

正群の順位和:T+ = 1+2.5×2+4.5×2+6+7+8+9+10=55  負群の順位和:T- = 0
全体の順位和:
符号付き順位和:Ts = T+-T- = 55-0 = 55  符号付き順位平均値:
表3.2.1 脂質異常症患者のTCとその差d(=TC-170)
No.12345678910
TC219221221222222224225227231238
d+49+51+51+52+52+54+55+57+61+68
表3.2.2 差dの例数と順位
差の絶対値|d|4951525455576168順位和
正の例数1221111155
負の例数000000000
順位12.54.567891055
図3.2.3 差の符号付き順位分布

差dの順位にdと同じ符号を付け、その度数分布を描くと図3.2.3のようになります。 符号付き順位平均値はこの符号付き順位分布の中心位置を表します。 もし母集団のデータが基準値を中心にしてその上下で同じように分布していれば、差dは0を中心にした分布になります。 そして差の符号付き順位分布の中心も0になり、符号付き順位平均値は0になるはずです。 そのためこの検定の帰無仮説を次のように表すことができます。

H0:母符号付き順位平均値は0である。

ここで注意しなければならないことは、この帰無仮説は「母中央値は基準値と等しい」という帰無仮説とは異なるということです。 母中央値が基準値と等しく、しかも基準値よりも大きい値と基準値よりも小さい値が同じように分布していれば、符号付き順位平均値は0になります。 差dの分布が近似的に正規分布(厳密には対称分布)していて、しかも母中央値が基準値と一致している時はそのような状態になります。

しかしたとえ母中央値が基準値と一致していても、中央値よりも大きいデータは中央値から離れて分布していて、中央値よりも小さいデータは中央値付近にかたまって分布していると符号付き順位平均値は0になりません。 逆に母中央値が基準値と一致していなくても、基準値よりも大きいデータの分布の中心位置と基準値よりも小さいデータの分布の中心位置が基準値から同じ距離にあれば、符号付き順位平均値は0になります。

例えば表3.2.1の代わりに次のようなデータがあったとします。 このデータについて基準値を170とすると、中央値と基準値は一致しますが、符号付き順位平均値は0にはなりません。

表3.2.3 TCとその差d(=TC-170)
No.12345678910
TC160160160160160180200200200200
d-10-10-10-10-10+10+30+30+30+30
表3.2.4 差dの例数と順位
差の絶対値|d|1030順位和
正の例数1437.5
負の例数5017.5
順位3.58.555
TCの中央値 = 170 = 基準値
正群の順位和:T+ = 3.5+4×8.5 = 37.5  負群の順位和:T- = 3.5×5 = 17.5
符号付き順位和:Ts = T+-T- = 37.5-17.5 = 20  符号付き順位平均値:rs= 2 > 0

つまりこの手法はあくまでも符号付き順位平均値に関する検定であり、中央値に関する検定ではないということです。 そこでこの検定の対立仮説を設定するには、「符号付き順位平均値が0からこの程度ずれていてもTCが基準値よりも異常に高いまたは低いわけではない」という符号付き順位平均値に関する医学的な許容範囲を決める必要があります。

ただしこの許容範囲は符号付き順位平均値単位では不都合です。 この検定における母集団はn例の符号付き順位分布であり、例えば表3.2.3では10例の順位分布です。 そのため符号付き順位平均値が2とすると、符号付き順位分布の中心位置は原点0から2例分だけ正の方向にずれている、つまり分布全体の20%分だけ正の方向にずれていることになります。 それに対して全例数が100例の時に符号付き順位平均値が2とすると、符号付き順位分布の中心位置は原点0から分布全体の2%分だけ正の方向にずれていることになり、意義が大きく異なります。 したがって一般化するために許容範囲は例数に対する符号付き順位平均値の割合を用いて決める必要があります。

差dが全て正(または負)の時、符号付き順位は図3.2.3のように全体が正(または負)の領域に分布します。 そしてその分布の中心つまり符号付き順位平均値は(n+1)/2になり、原点0から分布全体の約50%分ずれます。 つまり符号付き順位平均値は最大で原点0から分布全体の約50%分ずれるわけです。 ただし符号付き順位平均値の最大値は(n+1)/2なので、分布全体に対する正確な割合は{(n+1)/(2n)}×100%です。 そのため表3.2.3のデータでは、n=10より(11/20)×100=55%になります。

このズレの最大値を考慮して、例えば符号付き順位平均値の医学的な正常範囲を±10%未満とすると、対立仮説を次のように表すことができます。

H1:母符号付き順位平均値は原点0から-10%または+10%ずれている。

標本符号付き順位平均値は、標本平均と同じように中心極限定理によって近似的に正規分布します。 そこで符号付き順位平均値とその標準誤差を利用して推定と検定を行うことができます。 そしてこの場合は正規分布を利用して検定を行うので正規検定になり、検定統計量をz値またはu値と呼ぶ習慣があります。 このz値はt検定におけるt値に相当する値であり、t値と同じように実験結果のzo値から有意確率p値を計算し、それを有意水準αと比較することによって検定することができます。 またp値を計算する代りに正規分布つまり自由度無限大のt分布における100α%点t(∞,α)の値と比較して、次のように検定することもできます。

|zo| > t(∞,α)の時、有意水準100α%で有意

表3.2.2のデータについて有意水準5%、信頼係数95%として検定と推定を行うと次のようになります。 (注2)

|zo| = 2.807(p=0.0050) > t(∞,0.05) = 1.96 … 有意水準5%で有意
符号付き順位平均値の95%信頼区間 = 5.5(55%)±3.84 → 下限 = 1.66(16.6%) 上限 = 9.34(93.4%)→5.5(55%)

符号付き順位分平均値の95%信頼区間の上限は、正規分布に基づいて単純計算すると9.34です。 しかし符号付き順位平均値の理論的な最大値が5.5なので、上限はこの最大値になります。 これらの結果から次のような統計的結論を採用することができます。

統計的結論:脂質異常症患者のTCと170の差の符号付き順位平均値は高い方にずれている。
 そのズレは5.5例分(55%)であり、幅をもたせれば1.66例分(16.6%)〜5.5例分(55%)の間である。

この結論は単なる統計的結論ですから、これに基づいて医学的な結論を検討する必要があります。 このデータの場合、符号付き順位平均値の医学的な正常範囲を±10%未満としたので、最低でも16.6%、最大で55%というズレは医学的に正常範囲外のズレといえます。 そこで次のような医学的結論を採用することができます。

医学的結論:高脂血症患者のTCは異常に高い。

この結果を論文化する時は統計的結論だけでなく医学的結論まで記載し、さらに必要に応じて考察を加えなければならないことはt検定と同様です。

なおこの場合、本来なら試験を行う前に有意水準と検出力を決め、医学的な許容範囲に基いて試験の必要例数を計算し、試験終了後に実際のデータに基づいて検出力分析を行う必要があります。 しかし説明を簡潔にするために、それらの煩雑な手順は省略します。 興味のある方は第1章第8節の(注1)を参考にして計算してみてください。 (→1.8 科学的研究の種類 (注1) 6.順序尺度・1標本の場合)

また検定の有意確率p値が0.0050なので、有意水準を1%にしても有意になります。 そのためこのような時、論文などには「有意水準1%で有意」と記載することが多いと思います。 しかしこの場合、本来は事前に有意水準を5%として試験の必要例数を求めているはずです。 そのためいくらp値が0.0050でも、有意水準を1%にするための条件を満足していなければ「有意水準1%で有意」ということに意味はあまりありません。 そしてもし有意水準を1%にするのなら、推定結果も「99%信頼区間」を記載する必要があります。

検定は資格試験のようなものであり、有意水準はその合格基準に相当します。 そのため合格基準を満足していればトップ合格でも基準すれすれの合格でも資格が得られる、つまり統計的結論を採用できることに変わりはないのです。 したがっていくらp値が0.0050でも検定結果は「有意水準5%で有意」と記載し、推定結果は「95%信頼区間」を記載しておくのが合理的です。


(注1) 第2章で説明したように、中央値の定義は次のとおりです。 (→2.2 データの分布と統計手法)

○離散分布の場合:n個のデータを小さい順に並べ、r=(n+1)/2として
データ数nが奇数の時:μ' = xr (小さい方から(n+1)/2番目のデータの値)
データ数nが偶数の時: (小さい方から(n/2)番目のデータと(n/2+1)番目のデータの平均値)
○連続分布の場合:変数xの確率密度関数をf(x)、確率分布関数をF(x)として
となる時のμ'

中央値は母集団のデータの分布状態によって標準誤差が変わってしまうので、信頼区間を直接求めることはできません。 そこでrを利用して間接的に求めます。 中央値の100(1-α)%信頼区間は正規分布の100α%点の値t(∞,α)を用いて次のようになります。 (→1.3 データの要約方法 (注7))

(切り捨てによって整数化する)
※α=0.05の時はt(∞,0.05)=1.96≒2より次のようになる。
(切り捨てによって整数化する)
下限:μ'L = xr(小さい方からr番目のデータ)   上限:μ'U = xn-r+1(大きい方からr番目のデータ)

表3.1.1のデータについて実際に計算してみましょう。

より
中央値:
より下限が2番目のデータで上限が9番目のデータ
母中央値の95%信頼区間 下限:μ'L = 221 上限:μ'U = 231

(注2) 順位を用いる手法では順位に関する次のような各種統計量を利用します。

1からnまでの順位和:
aからnまでの順位和:
順位の2乗和:


順位の期待値(平均値)と分散・共分散:n個の値(x1,…,xi,…,xn)が独立に等確率であるとすると
順位の確率分布関数:





n個の一部分u個を選んだ時の順位和Tuについて


:有限修正。 n個の有限母集団からu個を選んだ時にTuの分散が少し小さくなることを補正する値。 (→1.8 科学的研究の種類 (注1))
図3.2.4 順位和計算の模式図

上記の統計量は同位の値つまり順位が同じデータはないという前提で計算したものです。 データの中に同位の値がある時は、同位の値を次のような方法で扱います。

  1. 無視する。
  2. 無作為に該当する順位を与える。
  3. 作業仮説に有利・不利に分けてみる。
  4. 生データに戻ってみる。
  5. 直接計算を試みる。
  6. 平均順位を与える。

これらの中で最も一般的なものは6番の平均順位を与える方法です。 その場合、第k番目から始まるg個の同位について次のような平均順位をg個全てに与えます。

この時、順位和は同位の無い時と変わらないものの2乗和が多少小さくなり、その結果、分散も多少小さくなります。 同位がない時の2乗和をq、分散をV(i)、同位がある時の2乗和をq*、分散をV*(i)とすると、同位がある時は次のようになります。





※Σ(g3-g)は複数の同位グループを全て合計することを表す

∴V*(i) = K・V(i)  C*(i,j) = K・C(i,j)

Kのことを同位の補正といい、順位を利用した手法ではこの補正を行います。

ここで「符号付き順位平均値は0である=正群の母順位和と負群の母順位和は等しい」という帰無仮説が正しいとすると、各種統計量は次のようになります。

正の順位を得る確率p(+)=負の順位を得る確率p(-)=0.5
  

  
     
Ts=T+-T-   
※同位がある時
同位の補正:
  
検定統計量 = 順位和T+を標準化した値:

平均順位和Tn/2は正群の順位和T+と負群の順位和T-の平均であり、2群の順位和が等しければどちらもこの平均順位和に一致します。 また正群の順位和と平均順位和の差は、正群の順位和と負群の順位和の差つまり符号付き順位和Tsの半分になります。 そのため符号付き順位和の分散V(Ts)はV(T+)の4倍になり、正群の順位和と平均順位和の差の検定は符号付き順位和の検定と同じものになります。

検定統計量zは中心極限定理によって近似的に正規分布します。 そのため近似正規分布を利用して検定と推定を行うことができます。 ただしzの分布は離散分布のため、連続分布である正規分布で近似する時は連続修正またはイェーツ(Yates)の補正と呼ばれる補正を施します。 連続修正の原理は(2)名義尺度の(注2)で説明します。 (→(2) 名義尺度(分類データ) (注2))


※sgn(Ts):次のような性質を持つ符号関数
 Ts < 0 の時 sgn(Ts)=-1
 Ts = 0 の時 sgn(Ts)=0
 Ts > 0 の時 sgn(Ts)=1
※本来のイェーツの補正は(T+-Tn/2)に0.5の補正をするが、Tsは2倍されているため補正を1にする。
検定:|zo|>t(∞,α)の時、有意水準100α%で有意
符号付き順位和の100(1-α)%信頼区間:
 →下限:  上限:
符号付き順位平均値の100(1-α)%信頼区間: → 下限:  上限:
※ただし|zo|>2の時は連続修正を省いて次のように計算した方が近似が良くなる。

ここで全てのデータが正で、値も全て同じとすると次のようになります。

  

この場合、順位データの変動は全て正群と負群の順位平均値の違いで説明できます。 そのため符号付き順位検定の寄与率を次式で求めることができます。

寄与率:

また順位和から有意確率p値を直接計算する方法もあります。 同位が無いとして例数が1、2、3、…、(n-1)、nの時を考えると、順位の組み合わせとその順位和Tは次のようになります。

1例の時 … {なし}:T=0 {1}:T=1
2例の時 … {なし}:T=0 {1}:T=1 {2}:T=2  {1,2}:T=3
3例の時 … {なし}:T=0 {1}:T=1 {2}:T=2 {1,2}:T=3  {3}:T=3 {1,3}:T=4  {2,3}:T=5 {1,2,3}:T=6
 :
(n-1)例の時 … {なし}:T=0 {1}:T=1 … {n-1}:T=n-1  {1,2}:T=3 … {n-2,n-1}:T=2n-3 … {1,…,n-1}:T=(n-1)n/2
n例の時 … {なし}:T=0 {1}:T=1 … {n-1}:T=n-1  {1,2}:T=3 … {n-2,n-1}:T=2n-3 … {1,…,n-1}:T=(n-1)n/2
 {n}:T=n  {1,n}:T=1+n … {n-1,n}:T=2n-1
 {1,2,n}:T=3+n … {n-2,n-1,n}:T=3n-3 … {1,…,n}:T=n(n+1)/2=Tn

以上のようにn例の時の順位和Tは最小値が0、最大値がTn=n(n+1)/2で、順位の組み合わせは全部で2n通りあり、それぞれ等確率(1/2n)で生じます。 そしてn>2の時は、順位の組み合わせが違っても同じ順位和になるものが生じます。 そのため特定の順位和を得る確率は、その順位和になる順位の組み合わせ数を全組み合わせ数2nで割った値になります。

この確率を直接求めるのはかなり大変です。 そこでnが増えると順位和の組み合わせがどのように増えるか考えてみましょう。 まず1例の時と2例の時を比べると、2例の時は1例の時の順位の組み合わせ{なし}と{1}を全て含んだ上で、さらにこれらに順位「2」が追加された{なし,2}={2}と{1,2}——上の例で太字で表記したもの——が増え、順位の組み合わせの数が2倍になることがわかります。

これを一般化すると、n例の時は(n-1)例の時の順位の組み合わせを全て含んだ上で、さらにこれらに順位「n」が追加された順位の組み合わせが増え、順位の組み合わせの数が2倍になります。 このことからn例の時に順位和がTになる順位の組み合わせ数つまりTの頻度を頻度関数f'(n,T)で表すと、これは例数が(n-1)の時に順位和がTになる頻度f'(n-1,T)に、順位和が(T-n)になる頻度f'(n-1,T-n)を足した数になることがわかります。

またn>0の時はT=0になる順位の組み合わせは{なし}だけであり、T=1になる順位の組み合わせは{1}だけです。 そしてT=Tn=n(n+1)/2になる順位の組み合わせは{1,…,n}だけであり、T=Tn-1={n(n+1)/2-1}になる順位の組み合わせは{2,…,n}だけです。 またT<0またはT>Tn=n(n+1)/2になる順位の組み合わせは存在しません。 さらにf'(n,T)は平均順位和Tn/2を中心にして左右対称になります。 これらのことからf'(n,T)を次のような漸化式で表すことができます。

f'(n≦0,T) = f'(n,T<0) = f'(n,T>Tn) = 0
f'(n>0,0) = f'(n>0,1) = f'(n>0,Tn) = f'(n>0,Tn-1) = 1
f'(n,T) = f'(n-1,T) + f'(n-1,T-n)
f'(n,T) = f'(n,Tn-T) (左右対称)

この頻度関数f'(n,T)を全頻度つまり順位の組み合わせ総数2nで割ると、確率密度関数f(n,T)になります。

これらと同様にして、頻度分布関数F'(n,T)確率分布関数F(n,T)を次のような漸化式で表すことができます。 (ちなみにコンピュータでこれらの漸化式を計算する時は、再帰法というプログラム技法を利用して実にエレガントなプログラムを組むことができます)

○頻度分布関数
F'(n<0,T) = F'(n,T<0) = 0  F'(n≧0,0) = F'(0,T≧0) = 1
F'(n>0,1) = 2  F'(n≧0,T≧Tn) = 2n

○確率分布関数

この確率分布関数F(n,T)を利用して有意確率p値を計算することができます。

T+、T-のうち小さい方をTとして
片側確率:p = F(n,T)  両側確率:p = 2×F(n,T) (F(n,T)>0.5の時はp=1にする)

この方法で求めたp値は同意がない時の値であり、同位がある時のp値はこれよりも多少小さくなります。 また例数が多くなるとこの方法は非常に膨大な計算量になってしまい、実用的ではなくなります。 そのため普通は正規近似法を用います

表3.2.2のデータについて実際に両方の方法で計算してみましょう。

○直接計算
T+ = 55  T- = 0
T+ > T- よりT = T- = 0として F'(10,0) = 1
< 0.05
○正規近似計算
Ts = 55 - 0 = 55      

|zo|>2より、連続修正を省いて
(p=0.0050) > t(∞,0.05) = 1.96
符号付き順位和の95%信頼区間 = 55±1.96×19.6 = 55±38.4 → 下限:TsL = 16.6 上限:TsU = 93.4→55
符号付き順位平均値の95%信頼区間 = 5.5±3.84 → 下限:rsL = 1.66  上限:rsU = 9.34→5.5
※符号付き順位平均の理論的な最大値が5.5のため上限は5.5になる
寄与率:
図3.2.5 順位和の確率密度関数f(10,T) 図3.2.6 直接計算と近似計算の両側p値

図3.2.5と図3.2.6を見ると、順位和分布の正規分布による近似はかなり正確なことがわかります。 そしてp値がだいたい0.05以下(|zo|にして2以上)では、連続修正を施さない方が近似が良くなることもわかると思います。 また順位平均値の分布は図3.2.5と図3.2.6の横軸をT/nにしただけであり、本質的に順位和の分布と変わりません。

データが正規分布する時、t検定に対する順位和検定の漸近相対効率(=平均値の分散/順位平均値の分散)は3/πになる、つまり約95%になることが証明されています。 そしてデータが正規分布からずれると順位和検定の漸近相対効率が1よりも大きくなる、つまり順位和検定の方が検出力が高くなることがあります。 そのため統計学の解説書などに「データが正規分布しない時はt検定は使えないので、順位和検定を使わなければならない!」と書かれていることがあり、これを盲信している人もいると思います。 しかしデータが正規分布しない時はt検定が使えないわけではなく、単に順位和検定の方が検出力が高くなることがあるだけです。

正規分布では平均値と中央値と順位平均値が一致し、順位和検定の検定の帰無仮説がt検定の帰無仮説「母平均と基準値は等しい」と実質的に同じものになります。 そのため順位和検定とt検定の検出力を比べることに、ある程度は意味があります。 しかしデータが正規分布からずれている時は平均値と中央値と順位平均値が一致するとは限りません。 そのため2つの手法の帰無仮説は異なるものになり、検定の目的も異なるものになるので、2つの手法の検出力を比べることに意味はありません。

したがって「2つの手法の検出力を比べて、検出力の高い方を使うべきだ!」という主張は、要約値の科学的な意義を無視した非合理な主張です。 これは、食べ過ぎで胃もたれがするので消化薬を買いに薬局に行ったら、薬剤師から「胃腸薬は効果の弱いものしか置いてないので、代わりに効果の強い花粉症の薬を使いなさい!」と、的はずれな助言されるようなものでしょう。

検定手法はデータの分布状態や検定効率で使い分けるのではなく、あくまでも要約値の種類によって使い分けるべきです。 そして研究目的に最も適した科学的に有意義な要約値を評価指標にすべきです。