玄関雑学の部屋雑学コーナー統計学入門

11.4 比例ハザードモデル

(1) 比例ハザードモデルによる重回帰型生命表解析

原理的にはハザードを目的変数にし、生存率に影響を与える因子を説明変数つまり共変数にして重回帰分析を行えば、それらの因子が生存率に与える影響を解析することができます。 しかしその場合はハザード関数λ(t)の具体的な姿を規定する必要があり、それは現実的には非常に困難です。 そこでロジスティック回帰分析と同じように、次のようなリンク関数を用いた重回帰型モデルを想定します。 (→10.1 ロジスティック回帰分析の原理 (3) 一般化線形モデル)

η=ln{ λ(t|x1,…,xp)
―――――――
λ0(t)
}=β01x1+…+βjxj+…+βpxp+ε  (j=1,…,p)
λ(t|x1,…,xp)
―――――――
λ0(t)
=exp(β01x1+…+βjxj+…+βpxp+ε) =exp(η)=HR
λ(t|x1,…,xp)=λ0(t)・exp(η)=λ0(t)・HR
η:対数ハザード比  HR:ハザード比
λ(t|x1,…,xp):ハザード関数  λ0(t):基準ハザード関数(baseline hazard function)
β0:定数  βj:偏回帰係数  ε:誤差

基準ハザード関数λ0(t)は全ての共変数の値が0の時のハザード関数であり、ハザード関数λ(t|x1,…,xp)はどれか1つ以上の共変数の値が0ではない時のハザード関数です。 そしてこのモデルは、ハザード関数は共変数によっても時間によっても形を変えず、λ(t|x1,…,xp)とλ0(t)の比を対数変換した値つまり対数ハザード比と共変数の間に線形関係があると仮定したものです。 ハザード比を対数変換するのは、共変数との関係をより線形に近づけるためです。

このモデルは、共変数はハザード関数の形には影響を与えず値だけに影響を与える、つまり図11.4でいえばλ(t)のグラフを単に上下に平行移動させるだけであり、しかもその移動比率を対数変換した値は共変数の値に比例するという、現実にはほとんど有り得ないものです。 しかしこのモデルには、ハザード関数の具体的な姿を想定する必要がないという大きなメリットがあります。

そこで、一般的な多変量生命表解析ではこのモデルを想定します。 これを「比例ハザードモデル(proportional hazard model)」といい、このモデルに基づいた多変量生命表解析のことを、「Coxの比例ハザードモデルによる重回帰型生命表解析」といいます。 数学的には、この手法は第2節で説明したコックス・マンテルの検定を多変量に拡張した手法に相当します。

(2) 基準生存関数と補正ハザード比

比例ハザードモデルでは、共変数と生存関数S(t|x1,…,xp)の間に次のような関係があります。

S(t|x1,…,xp)=exp{-∫λ(t|x1,…,xp)dt}
ln{S(t|x1,…,xp)}=-∫λ(t|x1,…,xp)dt=-exp(η)∫λ0(t)dt=exp(η)ln{S0(t)}
∴S(t|x1,…,xp)={S0(t)}exp(η)={S0(t)}HR
S0(t):基準生存関数(baseline survival function)

基準生存関数S0(t)は、原理的には全ての共変数の値が0の時の生存関数です。 しかしS0(t)を求めるのは難しいため、実際のデータでは共変数を無視した時の累積生存率曲線をカプラン・マイヤー法によって求め、それをS0(t)にします。 このS0(t)は全ての共変数が平均値の時の生存関数に相当するため、その時の対数ハザード比ηが0になるように定数β0を調整します。

上記の関係から、共変数に任意の値を入れた時の累積生存率曲線を理論的に計算し、グラフを描くことができます。 その理論的な累積生存率曲線は、図11.5の赤い累積生存率曲線と青い累積生存率曲線ように、t=0の時の値が1で、それ以後は基準生存関数S0(t)を平行移動したような形になります。

比例ハザードモデルは重回帰型ですから、偏回帰係数βjは、他の共変数が一定で共変数xjだけが「1」増加した時に、対数ハザード比がいくつ変化するかを表す値、つまり対数ハザード比の変化量になります。 対数ハザード比の変化量は、次のように共変数が「1」増加した時の対数ハザード比になりますから、それを指数変換して元のハザード比に戻すと、これは他の共変数が一定で共変数xjだけが「1」増加した時に、ハザードが何倍になるかを表す値になります。 このためこのハザード比は、他の共変数の影響を取り除いた補正ハザード比になります。

・xj=0の時の対数ハザード比
 ηj0=ln{ λj0(t)
―――
λ0(t)
}
・xj=1の時の対数ハザード比
 ηj1=ln{ λj1(t)
―――
λ0(t)
}
・対数ハザード比の変化量
 ηj1j0=ln{ λj1(t)
―――
λ0(t)
}-ln{ λj0(t)
―――
λ0(t)
}=ln{ λj1(t)
―――
λj0(t)
}=βj
λj1(t)
―――
λj0(t)
=exp(βj)=HRj
HRj:xjのハザード比

(3) 比例ハザードモデルの具体例

比例ハザードモデルは一般化線形モデルの一種であり、対数ハザード比の回帰誤差が特殊な分布になります。 そこで回帰誤差が近似的に正規分布すると仮定して、重回帰分析と同じように最小2乗法を利用して回帰分析を行う方法も考えられますが、普通は最尤法を利用した繰り返し近似計算によって回帰分析を行います。 ただし最尤法を正確に適用するためには、基準ハザード関数を具体的に規定する必要があります。 そこで実際の計算では、基準ハザード関数を無視して最尤解を近似計算するかなりラフな手法を用います。

例えば表11.8のデータに比例ハザードモデルを当てはめ、最尤法を利用して解を求めると次のようになります。 (注1)

y=ln{ λ(t|x1,x2)
―――――
λ0(t)
}=b0+b1・x1+b2・x2=-0.420-0.669x1+0.735x2
S(t|x1,x2)={S0(t)}exp(y)={S0(t)}HR
x1:治療(0:無 1:有)  x2:重症度(0:症状無 1:軽症 2:重症)

また観察期間と転帰のデータを用いて、カプラン・マイヤー法によって生命表を求めると次のようになります。

表11.9 カプラン・マイヤー法による生命表
症例番号生存期間(転帰)生存数/観察数累積生存率累積生存率の標準誤差
11 69/700.9860.014
22 68/690.9710.020
32 67/680.9570.024
43 66/670.9430.028
53 65/660.9290.031
63 64/650.9140.033
373 63/640.90.036
74 62/630.8860.038
84 61/620.8710.040
94 60/610.8570.042
384 59/600.8430.043
105 58/590.8290.045
115 57/580.8140.046
125 56/570.80.048
135 55/560.7860.049
395 54/550.7710.050
405 53/540.7570.051
146 52/530.7430.052
417 51/520.7290.053
158 50/510.7140.054
168 49/500.70.055
179 48/490.6860.055
429 47/480.6710.056
4310 46/470.6570.057
4410 45/460.6430.057
4511 44/450.6290.058
1812 43/440.6140.058
1912 42/430.60.059
2012 41/420.5860.059
2112 40/410.5710.059
2213 39/400.5570.059
4613 38/390.5430.060
4714 37/380.5290.060
2316 36/370.5140.060
4818 35/360.50.060
4918 34/350.4860.060
5019 33/340.4710.060
5119 32/330.4570.060
5221 31/320.4430.059
5323 30/310.4290.059
5425 29/300.4140.059
5526 +(29/29)0.4140.059
2427 27/280.3990.059
5627 26/270.3850.058
2528 25/260.3700.058
2628 24/250.3550.057
5728 23/240.3400.057
5828 +(23/23)0.3400.057
5930 21/220.3250.056
2731 20/210.3090.056
6032 19/200.2940.055
2832 +(19/19)0.2940.055
2933 17/180.2780.054
6133 +(17/17)0.2780.054
3034 15/160.2600.054
3135 +(15/15)0.2600.054
6235 +(14/14)0.2600.054
3236 +(13/13)0.2600.054
6337 11/120.2390.053
3344 +(11/11)0.2390.053
6449 9/100.2150.053
6552 +(9/9)0.2150.053
6654 7/80.1880.053
3454 +(7/7)0.1880.053
3555 5/60.1570.052
6756 4/50.1250.050
3656 +(4/4)0.1250.050
6858 +(3/3)0.1250.050
6959 +(2/2)0.1250.050
7060 +(1/1)0.1250.050

この生命表中の生存期間と累積生存率をプロットしたものが累積生存率曲線になり、それが基準生存関数S0(t)になります。 そしてS0(t)を利用すれば、共変数が任意の値の時の理論的生存関数を求めることができます。 例えば重症度が軽症で、治療が無い時と有る時の理論的生存関数は次のようになり、それらをグラフ化すると図11.5のようになります。 なお図11.5のグラフでは、理論的生存関数には脱落例をプロットしてありません。

・治療無(x1=0)で軽症(x2=1)の時の理論的生存関数
 y=-0.420-0.669×0+0.735×1=0.315
 S(t|x1=0,x2=1)={S0(t)}exp(0.315)={S0(t)}1.370
・治療有(x1=1)で軽症(x2=1)の時の理論的生存関数
 y=-0.420-0.669×1+0.735×1=-0.355
 S(t|x1=1,x2=1)={S0(t)}exp(-0.355)={S0(t)}0.701
図11.5 基準生存関数と理論的生存関数

この場合のx1とx2のハザード比は、それぞれ次のようになります。 そしてあまり意味はありませんが、ロジティック回帰分析と同様に、最尤法による解が漸近的に正規分布するという性質を利用して、偏回帰係数が0かどうか、つまりハザード比が1かどうかの検定を行うことができます。

x1:HR1=exp(b1)=exp(-0.669)=0.512
 χβ12=5.925(p=0.0149)>χ2(1,0.05)=3.841…有意水準5%で有意
x2:HR2=exp(b2)=exp(0.735)=2.085
 χβ22=16.316(p=0.00005)>χ2(1,0.05)=3.841…有意水準5%で有意

(4) コックス・マンテル検定との関係

表11.8の重症度を無視し、治療の有無についてコックス・マンテルの検定を適用すると次のようになります。 (注2)

コックス・マンテルの検定:zo=1.519(p=0.1288)<t(∞,0.05)=1.96…有意水準5%で有意ではない
ハザード比:HR=0.633

この結果と比例ハザードモデルによる結果を比べると、重症度の影響を補正すると治療の有無のハザード比が1からより離れる、つまり治療有と治療無のハザードの差がより大きくなり、生存率の差がより大きくなることがわかります。

図11.6は、治療の有無別に実際の累積生存率曲線を実線で描き、そこに比例ハザードモデルを利用して求めた理論的生存関数を破線で重ねて描いたものです。 この図を見ると、重症度の影響を補正すると治療の有無の生存率の差が少し大きくなることがわかると思います。

図11.6 治療の有無の累積生存率曲線

比例ハザードモデルは現実にはほとんど有り得ないモデルであり、最尤解を求める計算も非常にラフな近似計算ですから、計算結果の信頼性はかなり低くなります。 したがって計算結果が医学的に納得できないものだったならば、共変数の組み合わせを変えてみたり、モデルを変えてみたりして、色々と検討する必要があります。 信頼性の低い計算結果に振り回されるのは賢明ではありません。


(注1) 表11.8を一般化して、比例ハザードモデルを当てはめると次のようになります。

表11.10 共変数がp個の一般的データ
共変数観測期間転帰
x11x1jx1pt1d1
:::::
xi1xijxiptidi
:::::
xn1xnjxnptndn

※di:死亡例は1、脱落例は0のダミー変数

・比例ハザードモデル







回帰誤差εiが正規分布すると仮定せず、最尤法によってβの最尤推定値を求めます。

死亡例の確率:f(ti|i)=λ(ti|i)S(ti|i)
脱落例の確率:S(ti|i)
全体の尤度:
対数尤度:

この式を解くにはλ0(t)を規定する必要があります。 そこでコックスは、この式を直接用いず、λ0(t)を任意の負ではない局外関数としたままを近似的に推定する手法を開発しました。

まず、上記の尤度関数をλ0(t)を含む部分と含まない部分に分けます。 そしてλ0(t)を含む部分がの推定に与える影響は少ないとして、λ0(t)を含まない部分だけで尤度を計算します。 これを部分尤度(partial likelihood)といい、次のように表されます。


:死亡例だけを掛け合わせる
R(t):リスク集合。t=tまで生存していた死亡例と脱落例の集合
:リスク集合について合計する

実際のデータには同時死亡例または同時脱落例があるため、それを考慮したブレスロー・ペトの近似方法(Breslow-Peto approximation method)によって部分尤度を計算します。

部分尤度:
対数部分尤度:
dt:t=tにおける同時死亡例数
:dt例のを合計したもの

この対数部分尤度関数にニュートン・ラプソン法を適用すると、次のようになります。 (→10.3 ロジスティック回帰分析の計算方法 (注2))




:リスク集合R(t)に関する、指数的な重みwiを付けたxjの平均値相当の値


:リスク集合R(t)に関する、指数的な重みwiを付けたxjとxlの共分散相当の値
Ct:有限修正。またはCt=1(ブレスロー・ペトの近似)
Nt:t=tにおける観察対象数(生存例数+死亡例数)  st:t=tにおける生存例数

偏回帰係数が0かどうかの検定、つまりハザード比が1かどうかの検定は、最尤推定値の漸近的正規性を利用したワルドの検定によって行います。


またロジスティック回帰分析と同様に、共変数がない時の尤度つまり偏回帰係数が全て0の時の尤度と、共変数がp個の時の尤度の比を利用した尤度比検定によって、共変数全体の回帰の検定を行うことができます。 (→10.3 ロジスティック回帰分析の計算方法 (2) 最尤法を利用する方法 (注2))

対数尤度差:
尤度比検定: の時有意水準100α%で有意

偏回帰係数の初期値0は、全て0にするのが一般的な方法です。 しかし、次のような方法で求めることもできます。 前節で説明したように、ハザード関数λ(t)が時間とは無関係に一定だとすると、生存関数S(t)は指数関数になります。

λ(t)=λ(定数)  S(t)=exp(-λt)

この場合、個体の理論的な生存時間は∞です。 そこで現実的にはS(t)が非常に小さな値eになった時に死亡すると仮定すると、生存時間tとハザードモデルの間には次のような関係があります。

S(t)=exp(-λt)=e  ln(e)=-λt


ln(t0)は基準ハザード関数の生存時間に相当するため、共変数を無視した時の、対数変換した生存時間の平均値になります。 このため上記のモデルは、対数変換した生存時間ln(t)を目的変数にした、定数項を少し修正した重回帰モデルになります。 したがって対数変換した生存時間を目的変数にした重回帰分析を行い、その時の偏回帰係数の符号を反対にしたものを初期値0にすることができます。

表11.8のデータについて、実際に計算してみましょう。 まず表11.8の観察期間を対数変換したものを目的変数にし、治療の有無と重症度を説明変数にした重回帰分析を行うと次のような結果になります。

y=2.9135+0.77911x1-0.60483x2
y:ln(観察期間)  x1:治療(0:無 1:有)  x2:重症度(0:症状無 1:軽症 2:重症)

この重回帰式における偏回帰係数の符号を反対にしたものを、比例ハザードモデルにおける偏回帰係数の初期値にします。 比例ハザードモデルの定数項は、全ての共変数に平均値を代入した時の対数ハザード比が0になるように調整します。 このため、偏回帰係数だけをニュートン・ラプソン法で推定します。

初期値:



更新された1を用いて同様の計算を繰り返すと、3回目で値が収束します。 そしてこの偏回帰係数と、x1の平均値0.485714とx2の平均値1.01429から定数項b03を求めます。 また3-1の対角要素を利用して、偏回帰係数の検定を行うことができます。






b03=0.669111×0.485714-0.734744×1.01429=-0.4202469
・比例ハザードモデル:y=-0.420-0.669x1+0.735x2
・偏回帰係数の検定
 
 
・全回帰の尤度比検定
 このモデルの尤度:
 偏回帰係数が全て0の時の尤度:
 

(注2) 比例ハザードモデルにおいて、説明変数が1つだけで、しかもそれが0または1の値を取るダミー変数の場合について考えてみましょう。


回帰係数の初期値b10=0とすると、


 (dt1:t=tにおけるx1=1の死亡例数)
 (nt1:t=tにおけるx1=1の総例数)
 (U:コックス・マンテルの検定における分子)

有限修正をにすると、
 (nt0:t=tにおけるx1=0の総例数)
 (I:コックス・マンテルの検定における分母)
 (b:コックスのβ推定値)
 (z:コックス・マンテルの検定統計量)

以上のように、この場合の回帰係数b1はコックス・マンテルの検定におけるコックスのβと一致し、回帰係数の検定は連続修正をしないコックス・マンテルの検定と一致します。 (→11.2 生存率の比較方法 (注1))

表11.8の治療の有無について、比例ハザードモデルを適用した結果と、コックス・マンテルの検定を適用した結果は次のようになります。 両者の結果はわずかに異なっていますが、これは両者の有限修正の有無と連続修正の有無が原因です。

・比例ハザードモデル:y=0.212-0.43647x1
 回帰係数の検定:χβ12=2.616(p=0.1058)<χ2(1,0.05)=3.841
 x1のハザード比:HR=exp(-0.43647)=0.646314
・コックス・マンテルの検定:zo=1.519(p=0.1288)<t(∞,0.05)=1.96 (zo2=2.307)
 コックスのβの推定値:b=-0.458029
 ハザード比:HR=exp(-0.458029)=0.632529