玄関雑学の部屋雑学コーナー統計学入門

11.3 多変量生命表解析

(1) 多変量生命表解析

表11.1.1では生存率に影響を与える因子として手術法だけを取り上げています。 しかし実際の研究現場では生存率に影響を与える因子が複数存在する場合が多いでしょう。 例えば表11.3.1のように、治療の有無と疾患の重症度が生存率に影響を与えているような場合が考えられます。

表11.3.1 腫瘍患者の術後生存期間
症例番号治療重症度観察期間(月)転帰
1重症1死亡
2軽症2死亡
3重症2死亡
4軽症3死亡
5重症3死亡
6重症3死亡
7軽症4死亡
8軽症4死亡
9軽症4死亡
10症状無5死亡
11症状無5死亡
12軽症5死亡
13重症5死亡
14軽症6死亡
15軽症8死亡
16重症8死亡
17軽症9死亡
18症状無12死亡
19症状無12死亡
20軽症12死亡
21重症12死亡
22症状無13死亡
23軽症16死亡
24重症27死亡
25症状無28死亡
26症状無28死亡
27軽症31死亡
28症状無32脱落
29重症33死亡
30症状無34死亡
31症状無35脱落
32軽症36脱落
33症状無44脱落
34症状無54脱落
35軽症55死亡
36症状無56脱落
37重症3死亡
38重症4死亡
39軽症5死亡
40重症5死亡
41軽症7死亡
42重症9死亡
43重症10死亡
44重症10死亡
45重症11死亡
46軽症13死亡
47症状無14死亡
48症状無18死亡
49軽症18死亡
50重症19死亡
51重症19死亡
52軽症21死亡
53重症23死亡
54軽症25死亡
55重症26脱落
56症状無27死亡
57軽症28死亡
58軽症28脱落
59軽症30死亡
60重症32死亡
61軽症33脱落
62症状無35脱落
63重症37死亡
64軽症49死亡
65軽症52脱落
66症状無54死亡
67症状無56死亡
68症状無58脱落
69軽症59脱落
70症状無60脱落

このような場合に複数の因子が生存率に与える影響を解析する手法として、多変量解析と生命表解析を組み合わせた多変量生命表解析(multivariate life table analysis)または多変量生存時間解析(multivariate survival time analysys)が開発されています。

(2) 生存関数とハザード関数

多変量生命表解析の説明の前に、生存率に関する基本的な概念を説明しておきましょう。 累積生存率曲線を時間の関数として生存関数(survival function)で表すと、その典型的なグラフは図11.3.1のS(t)のようになります。 この時、累積死亡率の時間的な変化を表す関数を死亡関数とすると、これは1からS(t)を引いたものになり、そのグラフは図11.3.1のF(t)のようになります。

さらにF(t)を時間で微分したものをf(t)とすると、これは時点tにおける死亡率を表す関数であると同時に、生存時間の分布を表す関数にもなります。 ただしf(t)は全例を分母にした時の死亡率になるので、これまで説明してきた瞬間死亡率つまり時点tにおける死亡者数をその時点の生存者数で割ったものとは違います。 そこで時点tにおける死亡者数{f(t)×全例}を、その時点の生存者数{S(t)×全例}で割って瞬間死亡率{f(t)×全例}/{S(t)×全例} = f(t)/S(t)にしたものをハザード関数(hazard function)といい、そのグラフは図11.3.1のλ(t)のようになります。

図11.3.1 各種の関数
F(t) = 1 - S(t)     

原理的には観測期間全体を通して患者が死亡する危険性つまりハザードが存在し、そのハザードの時間的な変化を表す関数がハザード関数λ(t)であると考えられます。 そしてそのハザードに晒されることによって、時点tにおいてある割合の患者が死亡します。 そのため死亡率の時間的な変化を表す関数f(t)はλ(t)によって左右されます。 さらにf(t)を観測開始時から時点tまで累積つまり積分したものが死亡関数F(t)になり、1からF(t)を引いたものが生存関数S(t)になります。 したがって生存率を左右するのは実はλ(t)であり、次のようにλ(t)からS(t)を理論的に導くことができます。

(K:積分定数)
S(t) = exp{K - ∫λ(t)dt}  S(0) = exp{K - 0} = eK = 1 より K = 0
∴S(t) = exp{-∫λ(t)dt}  ln{S(t)} = -∫λ(t)dt

最も単純なものとしてハザード関数が常に一定という場合が考えられ、その場合の各種の関数は次のようになります。 そして例えばハザード関数の値が0.5の時は図11.3.1のようなグラフになります。

λ(t) = λ(定数)  S(t) = exp(-λt)  F(t) = 1 - exp(-λt)  f(t) = λ・exp(-λt)

これはポアソン(Poisson)過程と呼ばれるモデルであり、鉄砲を構えた敵に向かって軍隊が突撃する時の生存率を表す関数になるので標的モデルと呼ばれることもあります。 例えば1時間あたりの敵の鉄砲の命中率を50%とし、この命中率は時間経過によらず常に一定だとします。 この時、100名の軍隊が突撃すると1時間後には50名が死亡して生存者は50名なり、さらにそれから1時間後には25名が死亡して生存者は25名になります。

このように1時間あたりの命中率つまり瞬間死亡率は常に50%ですが、時間が経つにつれて生存者が減り、それに応じて死亡者数も減っていくので生存率の減り方は次第にゆっくりになります。 図11.3.1を見ると、その様子が何となくわかると思います。

上記の関数の相互関係と図11.3.1から、λ(t)はS(t)に対して指数的に影響する、つまり瞬間死亡率は累積生存率曲線に対して指数的に影響することがわかります。 第2節で説明したコックス・マンテルの検定で、瞬間死亡率の差を指数変換した瞬間死亡率の比つまりハザード比を指標にするのはこのためです。