玄関雑学の部屋雑学コーナー統計学入門

11.3 多変量生命表解析

(1) 多変量生命表解析

表11.1の例では、生存率に影響を与える因子として手術法だけを取り上げています。 しかし実際の研究現場では、生存率に影響を与える因子が複数存在する場合が多いでしょう。 例えば表11.8のように、治療の有無と疾患の重症度が生存率に影響を与えているような場合が考えられます。

表11.8 腫瘍患者の術後生存期間
症例番号治療重症度観察期間(月)転帰
1重症1死亡
2軽症2死亡
3重症2死亡
4軽症3死亡
5重症3死亡
6重症3死亡
7軽症4死亡
8軽症4死亡
9軽症4死亡
10症状無5死亡
11症状無5死亡
12軽症5死亡
13重症5死亡
14軽症6死亡
15軽症8死亡
16重症8死亡
17軽症9死亡
18症状無12死亡
19症状無12死亡
20軽症12死亡
21重症12死亡
22症状無13死亡
23軽症16死亡
24重症27死亡
25症状無28死亡
26症状無28死亡
27軽症31死亡
28症状無32脱落
29重症33死亡
30症状無34死亡
31症状無35脱落
32軽症36脱落
33症状無44脱落
34症状無54脱落
35軽症55死亡
36症状無56脱落
37重症3死亡
38重症4死亡
39軽症5死亡
40重症5死亡
41軽症7死亡
42重症9死亡
43重症10死亡
44重症10死亡
45重症11死亡
46軽症13死亡
47症状無14死亡
48症状無18死亡
49軽症18死亡
50重症19死亡
51重症19死亡
52軽症21死亡
53重症23死亡
54軽症25死亡
55重症26脱落
56症状無27死亡
57軽症28死亡
58軽症28脱落
59軽症30死亡
60重症32死亡
61軽症33脱落
62症状無35脱落
63重症37死亡
64軽症49死亡
65軽症52脱落
66症状無54死亡
67症状無56死亡
68症状無58脱落
69軽症59脱落
70症状無60脱落

このような場合に、複数の因子が生存率に与える影響を解析する手法として、多変量解析と生命表解析を組み合わせた「多変量生命表解析(multivariate life table analysis)」が開発されています。

(2) 生存関数とハザード関数

多変量生命表解析の説明の前に、生存率に関する基本的な概念を説明しておきましょう。 累積生存率曲線を時間の関数として「生存関数(survival function)S(t)」で表すと、その典型的なグラフは図11.4のS(t)のようになります。 この時、累積死亡率の時間的な変化を表す関数を「死亡関数(death rate function)F(t)」とすると、これは1からS(t)を引いたものになり、そのグラフは図11.4のF(t)のようになります。

さらにF(t)を時間で微分したものをf(t)とすると、これは時点tにおける死亡率を表す関数であると同時に、生存時間の分布を表す関数にもなります。 f(t)は時点tにおける全例を分母とした時の死亡率になるため、これまで説明してきた瞬間死亡率、つまり時点tにおける生存者数でその時点の死亡者数を割ったものとは違います。 そこでf(t)を時点tの生存率であるS(t)で割って瞬間死亡率にしたものを「ハザード関数(hazard function)」といい、λ(t)と表します。

図11.4 各種の関数
F(t)=1-S(t)
f(t)= d

dt
F(t)= d

dt
{1-S(t)}=- d

dt
S(t)
λ(t)= f(t)
――
S(t)
=- 1
――
S(t)
{- d

dt
S(t) }

原理的には、観測期間全体を通して患者が死亡するリスクが存在し、そのリスクの時間的な変化を表す関数がハザード関数λ(t)であると考えられます。 そしてそのリスクに晒されたために、時点tにおいてある割合の患者が死亡し、その死亡率の時間的な変化を表す関数がf(t)になります。 さらに観測開始時から時点tまでの累積死亡率を表す関数がF(t)、累積生存率を表す関数がS(t)になります。 したがって生存率を左右するのは実はハザード関数λ(t)であり、次のようにλ(t)からS(t)を理論的に導くことができます。

∫λ(t)dt=∫ 1
――
S(t)
{- d

dt
S(t) }dt=-∫ 1
――
S(t)
dS(t)=-ln{S(t)}+K  (K:積分定数)
S(t)=exp{K-∫λ(t)dt}  S(0)=exp{K-0}=eK=1 より K=0
∴S(t)=exp{-∫λ(t)dt}  ln{S(t)}=-∫λ(t)dt

最も単純な場合として、ハザード関数が常に一定という場合が考えられます。 この場合の各種の関数は次のようになり、例えばハザード関数の値が0.5の時は図11.4のようなグラフになります。

λ(t)=λ(定数)  S(t)=exp(-λt)  F(t)=1-exp(-λt)  f(t)=λ・exp(-λt)

これは、鉄砲を構えた敵に向かって軍隊が突撃する時の生存率を表す関数になるため、「標的モデル」などと呼ばれることがあります。 例えば1時間あたりの鉄砲の命中率を50%とし、この命中率は時間経過によらず常に一定だとします。 この時、100名の軍隊が突撃すると、1時間後には50名が死亡して生存者は50名なり、さらにそれから1時間後には25名が死亡して生存者は25名になります。

このように1時間あたりの命中率つまり瞬間死亡率は常に50%ですが、時間が経つとともに死亡者数が減っていくため、生存率の減り方は次第にゆっくりになります。 図11.4を見ると、その様子が何となくわかると思います。