玄関雑学の部屋雑学コーナー統計学入門

付録4 多施設共同臨床試験における終了施設数曲線のシミュレート

1.前提

多施設共同臨床試験を次のような条件で実施することを前提にします。

(1) 症例数

m施設において1施設あたりr例で実施、全例数n = m×r例。

例:m = 100、r = 5 → n = 100×5 = 500例

(2) 準備期間

各施設に臨床試験を依頼してから実際に臨床試験を開始するまでに、準備期間(契約・倫理審査・体制整備等)として平均p時間が必要。

例:p = 6w

(3) 試験期間

1例の試験期間(前期観測期間・介入期間・後期観察期間)をc時間とする。

例:前期観測期間4週間・薬剤投与期間12週間・後期観察期間4週間 → c = 4w + 12w + 4w = 20w

2.仮定

試験実施に関して次のような仮定を置きます。

(1) 症例発生頻度

各施設は平均h時間間隔で試験対象症例が発生する。

例:h = 2w(2wあたり1例発生する)

(2) 1単位時間

各施設における試験開始から終了までの時間の期待値tuを「1単位時間」と定義し、この単位に換算した試験開始からの相対経過時間をTで表す。 1施設あたりr例で、試験対象症例がh時間間隔で発生し、1例の試験期間がcの時、tuは次のようになる。

tu(1単位時間) = h×r(r例が発生する時間の期待値) + c(最後のr例目が試験終了するまでの時間)
例:r = 5、h = 2w、c = 20wの時 → tu = 2w×5 + 20w = 30w

準備期間pを1単位時間で表すと次のようになる。


例:p = 6w、tu = 30wの時 → Tp = 0.2

(3) 遅延要因

各施設において、試験進行を1単位時間遅らせる遅延要因が1単位時間あたり確率aで発生する。

例:a = 0.01 → tu = 30wとすると、試験進行を30w遅らせる遅延要因が30wあたり100施設に1施設発生する

遅延要因としては準備期間中の契約トラブル、施設で開かれる治験審査委員会(IRB:Institutional Review Board)トラブル、施設への薬剤搬入トラブル、試験対象症例発生頻度の低下、症例の除外・脱落、有害事象の発生等が考えられます。 これらの遅延要因は種類によって遅延時間も発生確率も異なるのが普通です。 しかし遅延時間を1単位時間にし、遅延時間の期待値が同じ値になるように発生確率を調整することによって、遅延時間を1単位時間に固定した遅延要因として統一的に扱うことができます。

例えば遅延時間0.1単位時間の遅延要因が1単位時間あたり0.1の確率で発生するとします。 この時、遅延時間の期待値は0.1×0.1 = 0.01です。 そして遅延時間が1単位時間の時の期待値が0.01になるのは発生確率が0.01の時です。 そこでこの遅延要因を遅延時間が1単位時間で1単位時間あたり0.01の確率で発生する遅延要因として扱うことにするわけです。 それによって全施設の平均的な遅延要因発生確率aを求めることが可能になります。

3.演繹結果

(1) 遅延要因が全く発生しない時

遅延要因が全く発生しない時、各施設における理想的な試験終了時間Tは次のようになります。

試験終了時間:T = Tp + 1

そして各施設が同時に試験を開始すると、全施設が遅延要因なしで終了する理想的な試験終了時間は次のようになります。

全施設終了時間 = 1施設終了時間:T = Tp + 1

例えばTp = 0.2、tu = 30wの時、実際の全施設終了時間tは次のようになります。

実際の全施設終了時間:t = (Tp + 1)×tu = (0.2 + 1)×30w = 36w(約9ヶ月)
図 付録4.1 遅延要因が全く発生しない時(1施設) 図 付録4.2 遅延要因が全く発生しない時(全施設)

(2) 遅延要因が1つ以上発生する時

ある施設において発生確率aの遅延要因が平均してb種類あり、それらがお互いに独立だとすると、遅延要因が全く発生しない確率λは次のようになります。

1つの遅延要因が発生しない確率 = 1 - a
∴b種類の遅延要因が全て発生しない確率:λ = (1 - a)b

例えばa = 0.1、b = 5の時は次のようになります。

λ = (1 - 0.1)5 = 0.95 = 0.59049 ≒ 0.6
∴1つ以上の遅延要因が発生する確率 = 1 - λ ≒ 0.4

b個の遅延要因が独立ではないと、λの値が少し変わります。 しかしそのような場合も含めて遅延要因が全く発生せずに試験が終了する確率をλとすれば、遅延要因が全く発生しない時はλ=1になり、遅延要因が1つ以上発生する時は1>λ>0になります。 そしてこのような施設がm個あり、それらの施設がお互いに独立だとすると、全施設において遅延要因が全く発生しない確率は次のようになります。

1つの施設で遅延要因が全く発生しない確率 = λ
∴全施設で遅延要因が全く発生しない確率 = λm

例えばλ = 0.4、m = 10の時は次のようになります。

全施設で遅延要因が全く発生しない確率 = 0.410 ≒ 0.0001
∴1つ以上の施設で1つ以上の遅延要因が発生する確率 = 1 - 0.0001 = 0.9999

以上のように、個々の遅延要因の発生確率低くても、それが複数あると1つ以上の遅延要因が発生する確率は意外に高くなります。 さらに施設が複数あると、全施設で遅延要因が全く発生しないのは稀であることがわかると思います。 そのため全施設で遅延要因が全く発生しない理想的な試験は現実にはほとんど有り得ないと考えられます。

遅延要因が1つ以上発生し、さらに話を単純にするためにλは施設によっても時間によっても変化しない定数であると仮定します。 その場合、試験開始時(T0 = 0)からT1 = Tp + 1までは1施設も終了しません。 そしてT1の時点で遅延要因が全く発生しなかったλ×m施設が終了します。 そして次に1単位時間遅れてλ(m - λm)施設が終了し、以後は同様のことを繰り返します。

これは生存時間解析において、イベントを各施設の試験終了とし、ハザードつまり単位時間あたりのイベント発生確率を各施設の試験終了確率とし、その確率が一定であると仮定した時のパラメトリックモデルに相当します。 そしてそれは指数分布モデル(標的モデル)になります。 (→11.6 パラメトリック生命表解析)

図 付録4.3 遅延要因が発生する時

指数分布モデルの生存率関数S(T)と死亡率関数F(T)は次のようになります。

S(T) = exp(-λT)  F(T) = 1 - S(T) = 1 - exp(-λT)  (0<λ<1)

多施設共同臨床試験の場合、λは遅延要因が発生せずに試験が終了する確率になり、S(T)は試験未終了確率関数になり、F(T)は試験終了確率関数になります。 そのため時点Tにおける試験終了施設数yは次のような関数で表すことができます。

y(T) = 0  (0≦T≦Tp)
y(T) = m×F(T) = m{1 - exp(-λT)}  (Tp<T)

(3) 全施設中100g%が終了するまでの時間

全施設中100g%の施設が終了するまでの時間Tgは次のようになります。

y = g×m = m{1 - exp(-λT)} → exp(-λT) = 1 - g  (0<g<1)
 → 
実際の時間:tg = Tg×tu

例えばTp = 0.2、λ = 0.6、tu = 30wとすると次のようになります。

・g = 0.5の時(半減期)
(約0.8年)
・g = 0.8の時
(約1.7年)
・g = 0.9の時
(約2.3年)

(4) 全施設が終了するまでの時間

全施設が終了するまでの時間Tmを指数関数でまともに計算すると無限大になってしまいます。 そこで、まず最後の1施設になるまでの時間T(m-1)を求めます。

y = m - 1 = m{1 - exp(-λT)} → m・exp(-λT) = 1
 → 

T(m-1)後は、最後の1施設が終了すれば全施設が終了します。 その最後の1施設にも遅延要因が発生する可能性がありますが、話を単純にするために、この施設は遅延要因が発生せずに終了するとしてTmを近似的に求めます。


実際の時間:tm = Tm×tu

例えばm = 100、Tp = 0.2、λ = 0.6、tu = 30wとすると次のようになります。

(約5年)

(5) 100g%が終了するまでの相対時間

100g%が終了するまでの時間と全施設が終了するまでの時間の比、つまり全施設が終了するまでの時間に対する100g%が終了するまでの相対時間は次のようになります。


Tp以後に限ると

つまり100g%が終了するまでの相対時間は近似的に施設数mと割合gだけで決まり、遅延要因発生率aや遅延要因の平均的な数bとは無関係になります。

・m = 100、g = 0.8の時

・m = 100、g = 0.9の時

・m = 10、g = 0.9の時

※実際にはT10は上記の値よりも1単位時間大きいので、比は1よりも少し小さくなる。

以上のように10施設の臨床試験では、全施設が終了するまでの時間は90%の施設が終了するまでの時間プラス最後の1施設が終了するまでの時間(1単位時間)です。 ところが100施設程度の臨床試験では、全施設が終了するまでの時間は80%の施設が終了するまでの時間の約3倍、90%の施設が終了するまでの時間の約2倍かかります!

この原因は次のようなものです。 どの時点でも遅延要因が同じ確率で発生するとすれば、「図 付録4.3 遅延要因が発生する時」のグラフのように、施設数が多い試験初期は遅延要因が発生せずに終了する施設の絶対数は多くなります。 そして施設数が少なくなっていくのに従って終了する施設の絶対数が減っていきます。 さらに試験末期になると施設数がかなり少なくなり、それに応じて終了する施設の絶対数もかなり減り、終了しない施設がいつまでも残るのです。

臨床試験の担当者は、往々にして全施設中80〜90%程度の施設が終了するまでの期間をだいたいの試験期間と捉え、最後の10〜20%の施設は特別なトラブルが発生した例外的な施設と考えやすいと思います。 しかしトラブルが全く発生しない臨床試験は現実的にはほとんど有り得ず、必ずどこかの施設で何らかのトラブルが発生します。 そしてその場合、トラブルの発生率や発生件数とはほぼ無関係に、最後の10〜20%の施設が終了する時間は80〜90%の施設が終了するまでの時間の1〜2倍もかかるのです。

そのため100施設程度の臨床試験では、全施設終了予定期間の半分が過ぎた時点で全施設の90%が終了していないと予定通り終了しません。 つまり全施設終了予定期間の半分が過ぎた時点で80%程度が終了していたとしたら、予定以上に順調に進行していると考えず、予定よりも遅れているので何らかの対策を施す必要があると考えなければならないのです。

最も効果的な対策は施設を追加することです。 しかし試験途中で施設を追加するのは難しいので、最初から施設数を必要数の1〜2割増しにしておくと安全です。 例えば必要施設数m = 100、g = 0.8として、最初からm×(1/g) = 100/0.8 = 125施設にしておけば、80%の施設が終了した時点で必要例数が確保できることになります。

実際の臨床試験では試験開始時は遅延要因が比較的多く、試験進行中は少なくなり、試験終了時にまた増えると考えられます。 また試験開始初期はプールされた症例を導入するので比較的速く進行し、試験末期になるほど症例が減り、しかも問題症例が増えると考えられます。 そのため実際の終了施設数曲線は試験開始初期は増え方がより急であり、試験末期になるほど増え方がより緩やかになると考えられます。

4.多施設共同作業の基本定理

以上のような理論は、多施設共同臨床試験に限らず、多くの施設または人が共同して仕事を行う時にはたいてい当てはまると思います。 そこで、

多施設で共同作業をする時、100g%の施設が作業を終了するまでの時間と全施設が作業を終了するまでの時間の比は施設数だけに依存し、施設数が多くなるほど小さくなる。 そして100施設程度なら80%の施設が作業を終了するまでの時間は全施設が作業を終了するまでの時間の3分の1程度になる、つまり全施設が作業を終了するまでの時間は80%の施設が作業を終了するまでの時間の約3倍かかる。

または、より具体的に、

100施設程度の共同作業では、全施設が作業を終了する予定期間の半分が過ぎた時点で約80%の施設が作業を終了していたとしたら、予定以上に順調に進行していると考えず、予定よりも遅れているので何らかの対策を施す必要があると考えなければならない!

これを、私は多施設共同作業の基本原理と名付けました。