統計学入門−第14章

後発医薬品——先発医薬品の特許が切れるとゾロゾロ出てくるので、業界用語でゾロ品といいます。でもイメージが悪いので、表向きはジェネリック医薬品と言い換えています(^_-)——が先発医薬品と同じ薬効を持つことを検証する試験として、生物学的同等性試験(Bioequivalence Study、BE試験、生同試験)というものがあります。通常、この試験では薬物動態学的指標を比較することによって、先発品と後発品の生物学的な同等性を検証します。

本来は先発品と後発品の薬効を比較すべきですが、薬効の比較には大規模な臨床試験が必要であり、開発費が少ないことがメリットであるゾロ品でそれを行うのは困難です。そこで薬物動態学的指標が同じなら薬効も同じだろうという想定のもとに、薬物動態学的指標を代理評価指標にした試験を行うのです。

BE試験では主として曲線下面積AUC、最大血中濃度C_max、最大血中濃度時間t_maxを評価指標にします。しかしこれらの指標をコンパートメントモデルを利用して求めるのは面倒なので、通常は実際のデータから近似的に求めます。例えば第3節の表14.3.3のデータでは次のようになります。

(2) クロスオーバーデザイン

表14.3.3 内服後の血中濃度データ(溶解時間補正後)
時間(hr)	0.07	0.32	0.57	0.72	1.07	1.57	2.07	2.57	3.57	4.57	5.57
血中濃度	8.79	20	21.3	17	10.7	6.46	3.72	2.47	1.17	0.64	0.41

通常、BE試験は先発品を対照薬、後発品を試験薬として、クロスオーバーデザイン(cross-over design)で行います。クロスオーバーデザインとは、表14.5.1のように同一の被験者に時期を変えて対照薬と試験薬を投与し、効率的な比較を行おうというデザインです。このデザインでは被験者を無作為に2群に分け、一方の群は対照薬→試験薬の順で投与し、もう一方の群は試験薬→対照薬の順に投与し、同じ時期に対照薬と試験薬を投与します。このように2つの薬剤をクロスして投与することによって、季節変動などで投与時期によって薬効が異なるという現象つまり時期効果を打ち消すことができます。

表14.5.1 2薬剤×2時期の
クロスオーバーデザイン
群	第1期	第2期
群I：対照薬先行群	対照薬投与	試験薬投与
群II：試験薬先行群	試験薬投与	対照薬投与

このデザインは、先に投与した薬剤が後から投与する薬剤の効果に影響を及ぼすという現象つまり持ち越し効果がある時は公平な比較ができません。例えば試験薬は原因療法であり、疾患を完治して被験者を健常人にするのに対して、対照薬は対症療法であり、薬剤を投与している間だけ被験者を一時的に健常人にする効果があるとします。その場合、対照薬先行群では第1期は一時的に効果があるものの、それは第2期の試験薬の効果に影響を及ぼしません。しかし試験薬先行群では第1期で被験者が完治してしまい、その効果が第2期にも持ち越されて対照薬の効果に影響を及ぼします。その結果、対照薬の効果が本来の効果よりも過大に評価され、公平な比較ができません。

そもそも薬剤は疾患を完治して病人を健常人にするのが本来の目的です。そのため持ち越し効果があるのが普通であり、持ち越し効果のない薬剤は良い薬剤とはいえません。実際、現実の治療現場では最初に効果の強い薬剤を投与して疾患をある程度治療し、その後は効果は弱いものの副作用が少ない薬剤を長期間投与してじっくりと治療するという治療を行うことがよくあります。これは、まさに薬剤の持ち越し効果を利用した治療法です。

このような理由から、一般的な臨床試験でこのザインが用いられることはほとんどありません。しかし薬物が体内に蓄積されず、一定時間で体外に完全に排出される薬剤の場合、薬物の血中濃度に関してだけは持ち越し効果はないと考えられます。そのためBE試験では、通常はクロスオーバーデザインが用いられます。

(3) クロスオーバーデザインのモデル

クロスオーバーデザインのモデルは少々ややこしいので、模式図によってその内容と解析方法を考えてみましょう。話を簡単にするために、ここでは対照薬を薬効のないプラセボとします。

このモデルでは次のような3種類の効果を検討することができます。

○順序効果(群または持ち越し効果)：t₁とt₂の和の群間比較
(δ_II1 + δ_II2) - (δ_I1 + δ_I2) = (2π + α + ω_a + 2β_II + τ₁ + τ₂) - (2π + α + ω_p + 2β_I + τ₁ + τ₂) = 2(β_II - β_I) + (ω_a - ω_p)
※順序効果は対照薬先行群と試験薬先行群の背景因子効果の差つまり群の効果と、試験薬と対照薬の持ち越し効果の差を合わせたものであり、2つの効果を分離して検出することはできない。
ただしβ_I = β_IIの時、持ち越し効果の差を純粋に検出可能であり、ω_a = ω_pの時、背景因子効果の差を純粋に検出可能である。
○時期効果(期間効果)：t₁とt₂のクロス差の群間比較
(δ_II2 - δ_II1) - (δ_I1 - δ_I2) = (-α + ω_a + τ₂ - τ₁) - (-α - ω_p + τ₁ - τ₂) = 2(τ₂ - τ₁) + (ω_a + ω_p)
※ω_a=ω_p = 0またはω_a = -ω_pの時、時期効果を純粋に検出可能。
※対照薬先行群と試験薬先行群を合わせたt₁とt₂の群内比較つまりt₁とt₂の差についての対応のあるt検定は次のようになり、2群の例数が等しい時だけ時期効果から試験薬の効果αを取り除くことができる。

n₁：対照薬先行群の例数　n₂：試験薬先行群の例数
n₁ = n₂ = nの時：

しかし2群の例数が異なると時期効果に試験薬の効果が入り込んでしまうので不適切。それに対してt₁とt₂のクロス差の群間比較は(δ_II2 - δ_II1)の平均値と(δ_I1 - δ_I2)の平均値の差を求めるので、2群の例数が異なっても時期効果から試験薬の効果を取り除くことができる。
○薬剤効果(処理効果)：t₁とt₂の差の群間比較
(δ_II1 - δ_II2) - (δ_I1 - δ_I2) = (α - ω_a + τ₁ - τ₂) - (-α - ω_p + τ₁ - τ₂) = 2α + (ω_p - ω_a)
※ω_a = ω_pの時、薬剤効果を純粋に検出可能。
※対照薬先行群はt₂からt₁を引き、試験薬先行群はt₁からt₂を引き、それらを合わせた群内比較は次のようになり、時期効果と同様に2群の例数が等しい時だけ薬剤効果から時期効果(τ₂-τ₁)を取り除くことができる。

n₁ = n₂ = nの時：

しかし例数が異なると、薬剤効果に時期効果が入り込んでしまうので不適切。それに対してt₁とt₂の差の群間比較は(δ_II1 - δ_II2)の平均値と(δ_I1 - δ_I2)の平均値の差を求めるので、2群の例数が異なっても薬剤効果から時期効果を取り除くことができる。

上記の式から、クロスオーバーデザインによって薬剤効果を純粋に検出できるのは対照薬と試験薬の持ち越し効果が無いか、もしくは同等の時に限られることがわかります。そして対照薬先行群と試験薬先行群の背景因子を群間比較し、それが同等なら順序効果は持ち越し効果の差だけになり、持ち越し効果の差を純粋に検出できます。したがって対照薬先行群と試験薬先行群の背景因子が同等で、かつ順序効果が無ければ薬剤効果を純粋に検出することができます。なおこれらの効果は本来の効果(β_II - β_I)、(τ₂ - τ₁)、αを2倍したものなので、信頼区間を計算する時に注意が必要です。

これらの効果の検出には、どれも2標本t検定とそれに対応する区間推定を適用することができます。しかしこれらの分析を総合的に行うためのクロスオーバー用分散分析が開発されているので、普通はその手法を適用します。ただしクロスオーバー用分散分析は対照薬先行群と試験薬先行群の例数が等しいという前提で組み立てられています。そのため2群の例数が異なる時は2標本t検定とそれに対応する区間推定を用いる方が無難です。でも検定と推定は2群の例数が同じ時に最も効率が高くなるので、クロスオーバーデザインでは2群の例数をできるだけ揃えることが大切です。

(4) BE試験の例題

今、先発品Aを対照薬、後発品Bを試験薬にして、18名の被験者を無作為に9例ずつの2群に分け、それぞれ対照薬先行群と試験薬先行群にしてクロスオーバーデザインのBE試験を行ったとします。そして18名の血中濃度データに基いて台形法でAUC求めたところ、表14.5.2のようになったとします。

表14.5.2 BE試験のAUCデータ
群	被験者ID	第1期	第2期
対照薬先行群 (A→B)	101	101.245	162.947
102	132.748	180.26
103	214.553	212.685
104	99.9775	147.795
105	101.175	98.45
106	165.27	236.787
107	158.31	185.81
108	181.073	217.873
109	94.0075	140.327
試験薬先行群 (B→A)	201	88.415	136.037
202	162.817	208.84
203	182.82	151.745
204	107.745	202.25
205	151.98	223.492
206	138.627	168.692
207	183.407	236
208	117.1	165.695
209	99.88	159.17

このデータにクロスオーバー用分散分析を適用すると、次のような結果になります。 _(注1)

表14.5.3 クロスオーバー用分散分析表(ANOVA table)
要因	平方和SS	自由度φ	平均平方和Ms(分散V)	分散比F
順序効果	79.2664	1	79.2664	0.0297297
被験者残差	42659.7	16	2666.23

被験者	42739	17	2514.06	5.46556
時期効果	15779.8	1	15779.8	34.3052
薬剤効果	198.599	1	198.599	0.431753
残差	7359.7	16	459.981
全体	66077	35

BE試験の場合、原則として順序効果はないという前提でクロスオーバーデザインを採用します。そして対照薬先行群と試験薬先行群の例数を同じにします。 2群の例数が異なっても薬剤効果から時期効果を取り除くことができますが、順序効果と時期効果と薬剤効果の間に関連性が生じるので好ましくありません。また合計例数が一定なら2群の例数が同じ時に効率が最も高くなるので、できるだけ例数を同じにします。

結果は対照薬と試験薬のAUC平均値の差の90％信頼区間が、対照薬のAUC平均値に対する比として±0.20(±20％)の範囲内に入っていれば生物学的に同等と評価します。上記の結果ではAUC平均値の差の90％信頼区間はその範囲内に入っているので、生物学的に同等と評価されます。また90％信頼区間つまり区間推定の代わりに統計的仮説検定を用い、薬剤効果の検定結果が有意水準10％で有意でなければ生物学的に同等と評価する時もあります。上記の検定は全て有意水準10％で検定していますが、これは90％信頼区間つまり信頼係数を90％にすることに対応したものです。

信頼区間で同等性を評価する時も、統計的仮説検定で同等性を評価する時も、事前に信頼係数または有意水準と検出力、そして検出差を決め、母標準偏差を推測して、必要例数を求めてから試験を実施する必要があります。 BE試験の場合は原則として信頼係数を90％、有意水準を10％、検出力を80％とし、検出差を対照薬のAUC平均値に対する比として±0.20(±20％)にします。そして母標準偏差は先行研究の結果や予備試験の結果から推測します。 _(注2)

統計的仮説検定で結果が有意でなければ、「『AUC平均値の差は検出差未満である』ということが80％の確率で断言できる」ということになります。しかし検定結果が有意の時は「『AUC平均値の差が0ではない』ということが90％以上の確率で断言できる」ということになり、「『AUC平均値の差が検出差以上である』ということが90％以上の確率で断言できる」という意味ではありません。そのためたとえ検定結果が有意になっても、90％信頼区間が検出差の範囲内に入っていれば同等と評価できます。したがって、やはり検定結果ではなく推定結果で同等性を評価する方が理にかなっています。 (→1.7 ハンディキャップ方式の検定 (注2))

BE試験ではあまり問題になりませんが、薬剤効果を正当に評価するためには本来は順序効果があるかどうかを検討する必要があります。 BE試験に限らずクロスオーバーデザインを用いた試験では、順序効果の検定結果が有意水準10〜20％程度で有意にならなければ「順序効果はない」と評価することがよくあります。しかしこの場合も検定ではなく、順序効果の信頼区間が許容範囲内に入っているかどうかで順序効果の有無を評価する方が理にかなっています。

上記の結果では、対照薬先行群と試験薬先行群のAUC平均値の差の90％信頼区間の上限が±20％の許容範囲からほんのわずかに外れています。しかしこの程度なら「順序効果はない」と評価しても良いと思います。

ちなみに同じデータに2標本t検定を用いると次のような結果になります。分散分析の結果と比較すると、検定結果は同じで平均値の差とその90％信頼区間の値が2倍になっていることがわかると思います。

(5) 評価項目の変数変換

BE試験の場合、原則としてt_max以外の評価項目は対数変換してから解析することになっています。その理由は「t_max以外の評価項目は対数正規分布することが多い」からだとされています。しかし平均値等の統計量はデータがどんな分布をしていても中心極限定理によって近似的に正規分布をし、検定はその性質を利用しています。また検定に必要な正規性はデータそのものの正規生ではなく、検定誤差つまり残差の正規性です。したがって「データが対数正規分布することが多い」という数学的な理由で評価項目を対数変換せず、評価項目の医学的意義をよく考えて変数変換するかどうかを決めるべきです。 (→2.2 データの分布と統計手法、2.3 パラメトリック手法とノンパラメトリック手法)

AUCについては、この指標が薬効をどのように反映するかをよく考える必要があります。第1節と第2節で説明したように、AUCは初期濃度C₀を排出速度定数k_eで割った値として求めることができます。そしてk_eは最も直接的に薬効を反映すると考えられる有効血中濃度持続時間t_EDと反比例するので、AUCとt_EDは比例します。

またk_eに分布容積V_dを掛けると全クリアランスCl_Tになります。クリアランスは薬剤を浄化する能力を表し、クレアチニン・クリアランスは腎機能を表す臨床評価項目としてよく用いられます。そしてクレアチニン・クリアランスは腎機能を正比例的に反映すると考えられるので、普通は実測値のまま解析します。 (→14.1 コンパートメントモデル、14.2 内服モデル)

これらのことを考慮するとAUCは実測値のまま解析するか、たとえ変換するにしても対数ではなく逆数にして解析するのが合理的ということになります。またC_maxはk_eと吸収速度定数k_aの差の逆数との間に指数関係があるので対数変換して解析し、t_maxはk_eとk_aの差との間に反比例関係があるので実測値のまま解析するのが合理的ということになります。

参考までに、表14.5.2のデータを自然対数変換してから解析すると次のような結果になります。

表14.5.4 クロスオーバー用分散分析表(自然対数変換後)
要因	平方和SS	自由度φ	平均平方和Ms(分散V)	分散比F
順序効果	0.00697921	1	0.00697921	0.0598471
被験者残差	1.86588	16	0.116617

被験者	1.87286	17	0.110168	5.18909
時期効果	0.697902	1	0.697902	32.8723
薬剤効果	0.00775544	1	0.00775544	0.365294
残差	0.339691	16	0.0212307
全体	2.9182	35

AUCを対数変換して解析した場合、対照薬と試験薬の対数変換後のAUC平均値の差の90％信頼区間が±0.2231436の範囲内に入っていれば生物学的に同等と評価します。これはAUC幾何平均値の比の許容範囲を0.8〜1.25にしたものであり、実測値の場合の平均値の差が±0.20という許容範囲に対応したものです。なおAUCを常用対数変換した時は、幾何平均値の比が0.8〜1.25という許容範囲は対数変換後のAUC平均値の差が±0.09691001という許容範囲になるので注意が必要です。

上記の結果では、対照薬先行群と試験薬先行群のAUC幾何平均値の比の90％信頼区間の上限が1.25からほんのわずかに外れています。しかしこの程度なら「順序効果はない」と評価しても良いと思います。そして対照薬と試験薬のAUC幾何平均値の比は0.8〜1.25の許容範囲内に入っているので、生物学的に同等と評価されます。

(6) ノンパラメトリックな手法

BE試験の評価指標は全て計量尺度ですが、クロスオーバーデザインの一般的な試験では評価指標が順序尺度や名義尺度になることも有り得ます。その場合、クロスオーバー用分散分析に対応するノンパラメトリック手法はまだ開発されていないので、2標本t検定に対応するノンパラメトリック手法を適用します。例えば表14.5.2のデータを順序尺度扱いして、ウィルコクソンの順位和検定(マン・ホイットニィのU検定)を適用すると次のような結果になります。

○順序効果：t₁とt₂の和の順位の群間比較
帰無仮説 H₀：順位に対する2群の背景因子効果は等しく、かつ対照薬と試験薬の持ち越し効果は等しい。
z = 0(p = 1) ＜ t(∞,0.10)=1.645 … 有意水準10％で有意ではない
対照薬先行群の順位平均値 = 9.44444　　試験薬先行群の順位平均値 = 9.55556
順位平均値の差の90％信頼区間 = -0.111111(-0.617283％) ± 4.13946 → 下限 = -4.25057(-23.6143％)　上限 = 4.02835(22.3797％)
U値の90％信頼区間 = 40(49.3827％) ± 18.6276 → 下限 = 21.3724(26.3857％)　上限 = 58.6276(72.3797％)
○時期効果：t₁とt₂のクロス差の順位の群間比較
帰無仮説 H₀：順位に対する時期1と時期2の時期効果は等しい。
z = 3.31133(p = 0.0009) ＞ t(∞,0.10) = 1.645 … 有意水準10％で有意
時期1の順位平均値 = 5.33333　　時期2の順位平均値 = 13.6667
順位平均値の差の90％信頼区間 = -8.33333(-46.2963％) ± 4.13946 → 下限 = -12.4728(-69.2933％)　上限 = -4.19388(-23.2993％)
U値の90％信頼区間 = 3(3.7037％) ± 18.6276 → 下限 = 0(0％)　上限 = 21.6276(26.7007％)
○薬剤効果：t₁とt₂の差の順位の群間比較
帰無仮説 H₀：対照薬と試験薬の順位平均値は等しい。
z = 0.883022(p = 0.3772) ＜ t(∞,0.10) = 1.645 … 有意水準10％で有意ではない
対照薬の順位平均値 = 10.6667　　試験薬の順位平均値 = 8.33333
順位平均値の差の90％信頼区間 = -2.33333(-12.9629％) ± 4.13946 → 下限 = -6.47279(-35.9599％)　上限 = 1.80612(10.034％)
U値の90％信頼区間 = 30(37.037％) ± 18.6276 → 下限 = 11.3724(14.0401％)　上限 = 48.6276(60.034％)

通常のBE試験では評価指標が計量尺度ばかりなので、順位平均値の差の90％許容範囲は規定されていません。仮に計量尺度として扱った時の許容範囲である±20％を適用すると、上記の結果では順位平均値の差の90％信頼区間の幅が±20％以上つまり40％以上あるので、生物学的に同等かどうか評価することはできないという結論になります。パラメトリック手法に比べてノンパラメトリック手法は検出力が低いので、このようなことが起きても不思議ではありません。

またデータが順序尺度の場合、厳密にいえばt₁とt₂の和や差を求めることはできません。そのため上記のような解析は順序尺度を計量尺度のように扱っていることになり、理論的に好ましくありません。もしt₁とt₂の和や差の順位を合理的に定義することができれば、その順位を利用して解析する方が合理的です。しかし順序尺度のデータを近似的に計量尺度化して、クロスオーバー用分散分析によって解析する方が実際的だと思います。

データが名義尺度の場合も、普通はt₁とt₂の和や差を求めることができません。そこでもしt₁とt₂の和や差の分類を合理的に定義することができれば、その分類に2群の出現率の検定を適用して上記のような解析をすることができます。しかしこの場合も名義尺度のデータを近似的に計量尺度化して、クロスオーバー用分散分析によって解析する方が実際的でしょう。

(注1)　表14.5.2を一般化すると次のようになります。

表14.5.5 クロスオーバーデザインの一般的データ
群	被験者	第1期	第2期	計	平均
G₁	1	y₁₁₁₁	y₁₂₂₁	T₁..₁	m₁..₁
	:	:	:	:	:
	l	y_111l	y_122l	T₁.._l	m₁.._l
	:	:	:	:	:
	n₁	y_111(n1)	y_122(n1)	T₁.._(n1)	m₁.._(n1)
	小計	T₁₁₁.	T₁₂₂.	T₁...	−
	平均	m₁₁₁.	m₁₂₂.	−	m₁...
G₂	1	y₂₁₂₁	y₂₂₁₁	T₂..₁	m₂..₁
	:	:	:	:	:
	l	y_212l	y_221l	T₂.._l	m₂.._l
	:	:	:	:	:
	n₂	y_212(n2)	y_221(n2)	T₂.._(n2)	m₂.._(n2)
	小計	T₂₁₂.	T₂₂₁.	T₂...	−
	平均	m₂₁₂.	m₂₂₁.	−	m₂...
計		T.₁..	T.₂..	T_T	−
平均		m.₁..	m.₂..	−	m_T
薬剤合計		T..₁.	T..₂.	T_T	−
薬剤平均		m..₁.	m..₂.	−	m_T

i：群(i = 1,2)　　j：時期(j = 1,2)　　k：薬剤(k = 1,2)　　l：被験者(l = 1,…,n_i)

被験者数：

　　総データ数：n = 2N
T..₁. = T₁₁₁. + T₂₂₁.　T..₂.=T₁₂₂. + T₂₁₂. 　　

全体：

　　φ_T = n - 1 　　

群：

　　φ_G = 2 - 1 = 1 　　

被験者：

　　φ_sub = N - 1 　　

被験者残差：

φ_SR = φ_sub - φ_G = N - 2 　　

時期：

　　φ_P = 2 - 1 = 1 　　

薬剤：

　　φ_D = 2 - 1 = 1 　　

残差：

φ_R = φ_T - φ_sub - φ_P - φ_D = N - 2 　　

表14.5.6 クロスオーバー用分散分析表(ANOVA table)
要因	平方和SS	自由度φ	平均平方和Ms(分散V)	分散比F
順序効果	S_G	φ_G	V_G	F_G=V_G/V_SR
被験者残差	S_SR	φ_SR	V_SR

被験者	S_sub	φ_sub	V_sub	F_sub=V_sub/V_R
時期効果	S_P	φ_P	V_P	F_P=V_P/V_R
薬剤効果	S_D	φ_D	V_D	F_D=V_D/V_R
残差	S_R	φ_R	V_R
全体	S_T	φ_T

○順序効果の100(1-α)％信頼区間：対照薬先行群と試験薬先行群の平均値の差の信頼区間
標準誤差：

　　上下限：δ_G = (m₂...-m₁...) ± t(φ_SR,α)SE_SR
○時期効果の100(1-α)％信頼区間：時期1と時期2の平均値の差の信頼区間
標準誤差：

　　上下限：δ_P = (m.₂..-m.₁..) ± t(φ_R,α)SE_R
○薬剤効果の100(1-α)％信頼区間：対照薬と試験薬の平均値の差の信頼区間
標準誤差：

　　上下限：δ_D = (m..₂.-m..₁.) ± t(φ_R,α)SE_R

信頼区間を求めるための標準誤差の式で残差分散V_SRとV_Rを2で割っているのは、クロスオーバー用分散分析では順序効果、時期効果、薬剤効果を実際の2倍にして解析しているからです。このことは図14.5.2のクロスオーバーデザインのモデルを見れば納得できると思いますし、上記の式でデータ数が被験者数の2倍になり、平方和を求める式の平均値が2倍されているものがあることからもわかると思います。

またこれは2薬剤×2時期のクロスオーバーデザインですが、これを一般化してa薬剤×a時期のクロスオーバーデザインに拡張することもできます。その場合は上記の式の添字i、j、kを1…aにすることによって同様の分散分析を行うことができます。

表14.5.2のデータについて実際に計算してみましょう。

N = 9 + 9 = 18　　n = 2×18 = 36
S_T = 973652 - 36×158.778² ≒ 66077 　　φ_T = 36 - 1 = 35
S_G = 18×157.294² + 18×160.262² - 36×158.778² ≒ 79.2664 = V_G 　　φ_G = 2 - 1 = 1
S_sub = 950314 - 36×158.778² ≒ 42739 　　φ_sub = 18 - 1 = 17 　　

S_SR = 42739 - 79.2664 = 42659.7 　　φ_SR = 18 - 2 = 16 　　

S_P = 18×137.842² + 18×179.714² - 36×158.778² ≒ 15779.8 = V_P 　　φ_P = 2 - 1 = 1
S_D = 18×161.127² + 18×156.429² - 36×158.778² ≒ 198.599 = V_D 　　φ_D = 2 - 1 = 1
S_R = 66077 - 42739 - 15779.8 - 198.599 = 7359.7 　　φ_R = 18 - 2 = 16 　　

○順序効果の95％信頼区間

δ_G = (160.262-157.294) ± 1.74588×17.21185 = 2.968 ± 30.05
○時期効果の95％信頼区間

δ_P = (179.714-137.842) ± 1.74588×7.149056 = 41.872 ± 12.4814
○薬剤効果の95％信頼区間

δ_D = (156.429-161.127) ± 1.74588×7.149056 = -4.698 ± 12.4814

これらを分散分析表にまとめることによって表14.5.3ができます。なお分散分析は各要因が独立で各要因の平方和間に相加性がある、つまり各要因の平方和を合計すると全体の平方和に一致するという前提で組み立てられた手法です。そのためn₁とn₂が異なっていると平方和を計算する順序によって結果が異なり、2標本t検定を用いた結果と食い違う時があります。したがってn₁とn₂が異なっている時は2標本t検定を用いた方が無難です。

(注2)　クロスオーバーデザインにおける必要例数は、同等性の検証のための必要例数の計算式を利用して求めます。 (→1.7 ハンディキャップ方式の検定 (注2))

n₁ = n₂：G₁群とG₂群の例数　　N = n₁ + n₂ = 2n₁：全例数
n_c = 1 または 2：t分布を正規分布で近似したことによる補正
1-α：信頼係数(α：有意水準)　　1-β：検出力　　δ*：同等性範囲幅/2 = 検出差　　σ：母標準偏差
V_R：残差分散　　φ_R = N - 2：残差自由度

これは母平均値の差δが0の時に、(1-α)信頼区間が(1-β)の確率で-δ* 〜 +δ*の同等性範囲にすっぽり入る時の必要例数になります。そしてこれは基準値を-δ*にした時の非劣性検定と、基準値を+δ*にした時の非優越性検定の両方が片側有意水準α/2、検出力(1-β)で同時に有意になる時の必要例数でもあります。もし母平均値の差δが0ではないと考えられる時は、次のような方法で必要例数を求めます。

P((-δ* - δ) + t(φ_R,α)SE_R ≦ d ≦ (δ* - δ) - t(φ_R,α)SE_R) ≧ 1-β を満足する時のn₁
0 ≦ δ ＜ δ*　　

　(残差分散V_Rを2で割るのは薬剤効果が2倍されているため)
※この時の必要例数はδ = 0の時の必要例数以上になるので、上記のδ = 0時の必要例数n₁を初期値として、n₁を増やしながら上式を満足する時のn₁を求める。

同等性を検証するのではなく非同値性を検証する時は、計量尺度・2標本の場合の必要例数の計算式を利用して求めます。この時の必要例数は同等性の検証のための必要例数よりも少し少なくなります。 (→1.8 科学的研究の種類 (注1))

※クロスオーバーデザインではn₁ = n₂にし、σ² ≒ V_R/2と推測する。

表14.5.2に関するクロスオーバー用分散分析の結果を用いて、信頼係数を90％(有意水準10％)、検出力を80％、検出差を対照薬の平均値の±20％、母標準偏差推定値を残差分散から推測して実際に計算してみましょう。

δ* = 161.127×0.2=32.2254　　V_R = 459.981
○同等性の検証のための必要例数

　　n₂ = 5　　N = 10
※δ ≒ d = 4.6975の時の必要例数：n₁ = 5を初期値にしてn₁ = 6の時

　　t(φ_R) = t(10)：自由度10のt分布の値
P((-32.2254 - 4.6975) + 1.812×8.7556 ≦ d ≦ 32.2254 - 4.6975 - 1.812×8.7556) = P(-21.058 ≦ d ≦ 11.663)
　= P(-2.405 ≦ t(10) = d/SE_R ≦ 1.332) = 0.8938 - 0.0185 = 0.8753 ≧ 0.8
∴n₁ = n₂ = 6　　N = 12
○非同値性の検証のための必要例数

　　n₂ = 4　　N = 8

前口上	目次	第1章	第2章	第3章	第4章	第5章	第6章	第7章	第8章	第9章	第10章
第11章	第12章	第13章	第14章	第15章	第16章	第17章	第18章	第19章	第20章	付録

14.5 生物学的同等性試験

(1) 生物学的同等性試験の評価指標

(2) クロスオーバーデザイン

(3) クロスオーバーデザインのモデル

(4) BE試験の例題

(5) 評価項目の変数変換

(6) ノンパラメトリックな手法