この章では生命表解析の原理と結果の解釈方法、多変量生命表解析、比例ハザードモデルと変数選択法、そしてパラメトリック生命表解析について解説します。
医学分野では、腫瘍の手術のように、ある治療を行うことによって患者がどの程度延命するか、つまり患者の生存率をどの程度上げることができるかによって、治療の効果を判定することがしばしばあります。 そもそも治療行為の最終的な目的は、病気を治すことによって、患者が健康で長生きできるようにすることですから、生存率は治療の究極的な評価指標ということになります。
臨床試験では、治療の評価指標のことを「エンドポイント(end point)」といいます。 これは生存率が究極の評価指標であり、患者の生死を観察することによって治療の評価を行うことに由来します。
しかしたいていの疾患は死亡までの期間が長く、生存率を評価指標にして臨床試験を行うことは困難です。 そこでそのような疾患では、生存率と深い関係があることが解明されていて、治療効果を短期間で評価することのできる臨床検査値、例えば血圧や血中脂質値などを暫定的な評価指標にします。 このような暫定的な評価指標のことを、「代用エンドポイント(surrogate end point)」といいます。 それに対して生存率のような究極の評価指標のことを、「真のエンドポイント(true end point)」と呼ぶことがあります。
この究極の評価指標である生存率を解析するための統計手法のことを、「生命表解析(life table analysis)」または「生存時間解析(survival time analysis)」といいます。 生命表解析は人口統計学の分野で古くから使われてきた手法であり、現在でも生命保険会社によって盛んに利用されています。 医学分野では主として腫瘍研究の分野で利用されていて、生存時間解析という名前で呼ばれることが多いようです。
生命表解析では、手術や投薬開始という明確な出発点から個体の追跡を開始し、死亡や疾患の再発といった非可逆的なイベント(event)が発現するまで観察を続けます。 ただし、途中で個体が偶発的な出来事で研究から脱落(drop out)したり、研究期間が終了して観察打ち切り(termination of the study)になることもあります。
原則としてイベントは非可逆的な反応でなければなりませんが、再手術、治療法の切り替え、効果や副作用の発現といった、緩い意味での非可逆的な反応にすることもできます。 また最初から脱落が発生することを想定しているため、脱落例が発生する可能性が高い臨床試験、例えば治癒率が非常に高い疾患の臨床試験などにも適しています。 これらのことから、生命表解析は医学分野で広く応用することが可能な手法といえるでしょう。
またこの手法ではイベントが発現するまで観察を続け、その発現率を問題にするため、原則として前向き研究で得られたデータに適用します。 ところが実際の医学研究では、後ろ向き研究で得られたデータにこの手法を間違って適用することがしばしばあります。 これは、医学研究では後ろ向き研究が多用されることに起因しているようです。 生命表解析を適用する場合は、このあたりのことに十分注意する必要があります。
今、22例の腫瘍患者について、12例にはA法という手術を施し、10例にはB法という手術を施して、予後を観察した結果が表11.1のようになったとします。
| 症例番号 | 手術法 | 観察期間(月) | 転帰 |
|---|---|---|---|
| 1 | A | 4 | 脱落 |
| 2 | A | 5 | 死亡 |
| 3 | A | 8 | 死亡 |
| 4 | A | 13 | 死亡 |
| 5 | A | 16 | 打ち切り |
| 6 | A | 27 | 死亡 |
| 7 | A | 28 | 死亡 |
| 8 | A | 32 | 打ち切り |
| 9 | A | 35 | 打ち切り |
| 10 | A | 36 | 死亡 |
| 11 | A | 50 | 打ち切り |
| 12 | A | 56 | 打ち切り |
| 13 | B | 2 | 死亡 |
| 14 | B | 4 | 死亡 |
| 15 | B | 6 | 死亡 |
| 16 | B | 12 | 死亡 |
| 17 | B | 13 | 死亡 |
| 18 | B | 15 | 打ち切り |
| 19 | B | 18 | 死亡 |
| 20 | B | 20 | 脱落 |
| 21 | B | 25 | 死亡 |
| 22 | B | 35 | 死亡 |
転帰項目の「脱落」は、研究期間が終了する前に偶発的な出来事で研究から脱落した症例であり、「打ち切り」は、研究期間が終了したため生存中であるにもかかわらず観察を打ち切った症例です。 これらの症例は、生命表解析ではどちらも同じように取り扱います。
人口統計学の分野では対象となる個体数が非常に多いため、表11.1のように個々の個体を正確に観察することは困難です。 そこで観察期間をある期間で区切り、その期間内に発生した死亡数と脱落または打ち切り数を観察し、表11.2のような「生命表(life table)」にまとめます。 そして、この生命表の中の累積生存率とその標準誤差の推移を折れ線グラフで描いたものが、図11.1の累積生存率曲線です。 なお表11.2では、脱落と打ち切りを区別せずに「脱落数」として集計しています。
| 群 | 観察期間 | 期間当初生存数 | 期間中死亡数 | 脱落数 | 有効生存数 | 生存率 | 累積生存率 | 累積生存率の標準誤差 |
|---|---|---|---|---|---|---|---|---|
| A | 12 | 12 | 2 | 1 | 11.5 | 0.826 | 0.826 | 0.112 |
| 24 | 9 | 1 | 1 | 8.5 | 0.882 | 0.729 | 0.134 | |
| 36 | 7 | 3 | 2 | 6 | 0.5 | 0.364 | 0.163 | |
| 48 | 2 | 0 | 0 | 2 | 1 | 0.364 | 0.163 | |
| 60 | 2 | 0 | 2 | 1 | 1 | 0.364 | 0.163 | |
| B | 12 | 10 | 4 | 0 | 10 | 0.6 | 0.6 | 0.155 |
| 24 | 6 | 2 | 2 | 5 | 0.6 | 0.36 | 0.161 | |
| 36 | 2 | 2 | 0 | 2 | 0 | 0 | 0 |
基本的に、ある期間の死亡率は、期間中の死亡数を期間当初の生存数つまり対象数で割った値です。 例えば0〜12ヶ月におけるA群の死亡数は2例であり、期間当初の生存数は12例ですから、死亡率は2/12≒0.167になります。
ところがこの期間中に脱落例が1例あり、その症例を対象数から除外する必要があります。 そこで平均的に期間の中央で脱落が生じたと考え、脱落例の半分の例数を対象数から除外し、それを有効生存数(有効観察例数)とします。 その有効生存数を用いて死亡率と生存率を計算すると、次のようになります。
| 有効生存数=12- | 1 ― 2 |
=11.5 |
| 死亡率= | 死亡数 ――――― 有効生存数 |
= | 2 ―― 11.5 |
≒0.174 |
同様に、次の期間である12〜24ヶ月におけるA群の死亡率と生存率は次のようになります。
| 有効生存数=9- | 1 ― 2 |
=8.5 |
| 死亡率= | 1 ―― 8.5 |
≒0.118 |
ここで、A群における24ヶ月後の生存率の計算方法を考えてみましょう。 24ヶ月後の生存者は、0〜12ヶ月間を生存し、さらに12〜24ヶ月間も生存した例です。 したがって、ある個体が24ヵ月後に生存する確率は、0〜12ヶ月の生存確率である0.826と、12〜24ヶ月の生存確率である0.882を掛けた値になります。 この掛け合わせた生存率のことを、「累積生存率(cumulative survival rate)」または「生命表生存率(life table survival rate)」といいます。
もし脱落例が無ければ、24ヵ月後の累積生存率は、単に24ヵ月後の生存数を開始時の対象例数で割った値になります。 しかし臨床試験などでは脱落例が生じるのが普通なので、表11.1のような生命表を作成して累積生存率を計算する必要があります。 これが古典的な生存率の計算方法であり、「カトラー・エデラー(Cutler-Ederer)法」または「生命保険数理法(acturial method、狭義の生命表法)」と呼ばれています。 (注1)
医学分野では対象となる個体数が比較的少ないため、表11.1のデータをそのまま用いて生命表を作成し、正確な生存率を計算することができます。 その正確な生命表が表11.3であり、その中の累積生存率の推移を折れ線グラフで描いたものが、図11.2の累積生存率曲線です。
| 群 | 症例番号 | 生存期間(転帰) | 生存数/観察数 | 累積生存率 | 累積生存率の標準誤差 |
|---|---|---|---|---|---|
| A | 1 | 4(+) | (12/12) | 1 | 0 |
| 2 | 5 | 10/11 | 0.909 | 0.087 | |
| 3 | 8 | 9/10 | 0.818 | 0.116 | |
| 4 | 13 | 8/9 | 0.727 | 0.134 | |
| 5 | 16 + | (8/8) | 0.727 | 0.134 | |
| 6 | 27 | 6/7 | 0.623 | 0.15 | |
| 7 | 28 | 5/6 | 0.519 | 0.157 | |
| 8 | 32 + | (5/5) | 0.519 | 0.157 | |
| 9 | 35 + | (4/4) | 0.519 | 0.157 | |
| 10 | 36 | 2/3 | 0.346 | 0.176 | |
| 11 | 50 + | (2/2) | 0.346 | 0.176 | |
| 12 | 56 + | (1/1) | 0.346 | 0.176 | |
| B | 13 | 2 | 9/10 | 0.9 | 0.095 |
| 14 | 4 | 8/9 | 0.8 | 0.126 | |
| 15 | 6 | 7/8 | 0.7 | 0.145 | |
| 16 | 12 | 6/7 | 0.6 | 0.155 | |
| 17 | 13 | 5/6 | 0.5 | 0.158 | |
| 18 | 15 + | (5/5) | 0.5 | 0.158 | |
| 19 | 18 | 3/4 | 0.375 | 0.161 | |
| 20 | 20(+) | (3/3) | 0.375 | 0.161 | |
| 21 | 25 | 1/2 | 0.188 | 0.155 | |
| 22 | 35 | 0/1 | 0 | 0 |
表11.3の生存期間項目の(転帰)には、脱落を「(+)」、打ち切りを「+」で表記し、死亡は何も表記してありません。 ただし脱落と打ち切りの生存率計算上の取り扱いは同じですから、これらは単に表記上の区別にすぎません。
正確な生命表では、死亡または脱落が発生するたびに、その瞬間の死亡率と生存率、そして累積生存率を計算します。 例えばA群では、4ヵ月後に症例番号1番の症例が脱落しています。 この症例は4ヵ月後までは生存していましたので、この時点の瞬間死亡率は0で、瞬間生存率は12/12=1になり、累積生存率も1になります。 表11.3で、1番の症例の「生存数/観察数」が括弧付きで(12/12)と表記されているのは、脱落の場合は生存数と観測数が同じになるため、瞬間生存率が1になって累積生存率が変わらないからです。
次に5ヵ月後に症例番号2番の症例が死亡しているので、この時点の瞬間死亡率と瞬間生存率、そして累積生存率は次のようになります。
| 瞬間死亡率= | 死亡数 ―――― 観察数 |
= | 1 ―― 11 |
≒0.091 |
| 瞬間生存率= | 生存数 ―――― 観察数 |
= | 10 ―― 11 |
≒0.909 |
| 瞬間死亡率= | 1 ―― 10 |
=0.1 |
| 瞬間生存率= | 9 ―― 10 |
=0.9 |
もし脱落例が無ければ、古典的な生命表と同様に、ある時点の累積生存率は、単にその時点の生存数を開始時の対象例数で割った値になります。 これが正確な生存率の計算方法であり、「カプラン・マイヤー(Kaplan-Meier)法」と呼ばれています。 (注2)
この計算法では死亡例が発生した時点で累積生存率がカタンと落ちるため、累積生存率曲線は図11.2のように階段状の折れ線グラフになります。 そして脱落または打ち切りの有無と時期がわかるように、それらが発生した時点に短い縦棒をプロットしてあります。
観察期間は等間隔にするのが普通ですが、等間隔にしなければならないというわけではありません。 ある左開右閉区間(ti-1,ti]についての死亡率、生存率、累積生存率、そして累積生存率の標準誤差は次のようになります。










表11.2のA群について実際に計算すると、次のようになります。










48ヵ月後と60ヵ月後は死亡例がないため、累積生存率とその標準誤差は変化しません。


…死亡例だけ掛け合わせる
…死亡例だけ足し合わせる
表11.3のB群について実際に計算すると、次のようになります。













最後の症例は35ヵ月後に死亡例しているため、35ヵ月後の累積生存率は0になります。
この方法で累積生存率を計算した時、累積生存率が0.5になる時点つまり「50%生存時間(Median Sarvival Time、MST)」と、その95%信頼区間を求める方法が考案されています。 累積生存率がπになる時点tを挟む前後の観察時期をu、vとすると、100π%生存時間とその100(1-α)%信頼区間を次のようにして求めることができます。

この方法は、図11.2の累積生存率曲線の上下に100α%信頼区間つまりt(∞,α)×SEを描き、その下限がπ以上になるπの直近の時点を下限にし、その上限がπ以下になる直近の時点を上限にする、という方法に相当します。
この式にπ=0.5、α=0.05を代入すれば、MSTとその95%信頼区間を求めることができます。 表11.3のA群について、50%生存時間とその95%信頼区間を計算すると次のようになります。

この結果から、MSTは約35.11ヶ月であり、これ以前で95%信頼区間の下限が最初に0.5以上になるのは時点3つまり8ヵ月後であることと、MST以後では最後の時点10でも95%信頼区間の上限が0.5より大きいことがわかります。 したがってMSTの95%信頼区間の下限は8ヶ月、上限は56ヶ月以上ということになります。
ちなみにB群のMSTは15ヶ月、その95%信頼区間の下限は4ヶ月、上限は25ヶ月になります。