統計学入門−第11章

11.3 多変量生命表解析

(1) 多変量生命表解析

表11.1.1では生存率に影響を与える因子として手術法だけを取り上げています。しかし実際の研究現場では生存率に影響を与える因子が複数存在する場合が多いでしょう。例えば表11.3.1のように、治療の有無と疾患の重症度が生存率に影響を与えているような場合が考えられます。

表11.3.1 腫瘍患者の術後生存期間
症例番号	治療	重症度	観察期間(月)	転帰
1	無	重症	1	死亡
2	無	軽症	2	死亡
3	無	重症	2	死亡
4	無	軽症	3	死亡
5	無	重症	3	死亡
6	無	重症	3	死亡
7	無	軽症	4	死亡
8	無	軽症	4	死亡
9	無	軽症	4	死亡
10	無	症状無	5	死亡
11	無	症状無	5	死亡
12	無	軽症	5	死亡
13	無	重症	5	死亡
14	無	軽症	6	死亡
15	無	軽症	8	死亡
16	無	重症	8	死亡
17	無	軽症	9	死亡
18	無	症状無	12	死亡
19	無	症状無	12	死亡
20	無	軽症	12	死亡
21	無	重症	12	死亡
22	無	症状無	13	死亡
23	無	軽症	16	死亡
24	無	重症	27	死亡
25	無	症状無	28	死亡
26	無	症状無	28	死亡
27	無	軽症	31	死亡
28	無	症状無	32	脱落
29	無	重症	33	死亡
30	無	症状無	34	死亡
31	無	症状無	35	脱落
32	無	軽症	36	脱落
33	無	症状無	44	脱落
34	無	症状無	54	脱落
35	無	軽症	55	死亡
36	無	症状無	56	脱落
37	有	重症	3	死亡
38	有	重症	4	死亡
39	有	軽症	5	死亡
40	有	重症	5	死亡
41	有	軽症	7	死亡
42	有	重症	9	死亡
43	有	重症	10	死亡
44	有	重症	10	死亡
45	有	重症	11	死亡
46	有	軽症	13	死亡
47	有	症状無	14	死亡
48	有	症状無	18	死亡
49	有	軽症	18	死亡
50	有	重症	19	死亡
51	有	重症	19	死亡
52	有	軽症	21	死亡
53	有	重症	23	死亡
54	有	軽症	25	死亡
55	有	重症	26	脱落
56	有	症状無	27	死亡
57	有	軽症	28	死亡
58	有	軽症	28	脱落
59	有	軽症	30	死亡
60	有	重症	32	死亡
61	有	軽症	33	脱落
62	有	症状無	35	脱落
63	有	重症	37	死亡
64	有	軽症	49	死亡
65	有	軽症	52	脱落
66	有	症状無	54	死亡
67	有	症状無	56	死亡
68	有	症状無	58	脱落
69	有	軽症	59	脱落
70	有	症状無	60	脱落

このような場合に複数の因子が生存率に与える影響を解析する手法として、多変量解析と生命表解析を組み合わせた多変量生命表解析(multivariate life table analysis)または多変量生存時間解析(multivariate survival time analysys)が開発されています。

(2) 生存関数とハザード関数

多変量生命表解析の説明の前に、生存率に関する基本的な概念を説明しておきましょう。累積生存率曲線を時間の関数として生存関数(survival function)で表すと、その典型的なグラフは図11.3.1のS(t)のようになります。この時、累積死亡率の時間的な変化を表す関数を死亡関数とすると、これは1からS(t)を引いたものになり、そのグラフは図11.3.1のF(t)のようになります。

さらにF(t)を時間で微分したものをf(t)とすると、これは時点tにおける死亡率を表す関数であると同時に、生存時間の分布を表す関数にもなります。ただしf(t)は全例を分母にした時の死亡率になるので、これまで説明してきた瞬間死亡率つまり時点tにおける死亡者数をその時点の生存者数で割ったものとは違います。そこで時点tにおける死亡者数{f(t)×全例}を、その時点の生存者数{S(t)×全例}で割って瞬間死亡率{f(t)×全例}/{S(t)×全例} = f(t)/S(t)にしたものをハザード関数(hazard function)といい、そのグラフは図11.3.1のλ(t)のようになります。

F(t) = 1 - S(t)　　

原理的には観測期間全体を通して患者が死亡する危険性つまりハザードが存在し、そのハザードの時間的な変化を表す関数がハザード関数λ(t)であると考えられます。そしてそのハザードに晒されることによって、時点tにおいてある割合の患者が死亡します。そのため死亡率の時間的な変化を表す関数f(t)はλ(t)によって左右されます。さらにf(t)を観測開始時から時点tまで累積つまり積分したものが死亡関数F(t)になり、1からF(t)を引いたものが生存関数S(t)になります。したがって生存率を左右するのは実はλ(t)であり、次のようにλ(t)からS(t)を理論的に導くことができます。

(K：積分定数)
S(t) = exp{K - ∫λ(t)dt}　　S(0) = exp{K - 0} = e^K = 1 より K = 0
∴S(t) = exp{-∫λ(t)dt}　　ln{S(t)} = -∫λ(t)dt

最も単純なものとしてハザード関数が常に一定という場合が考えられ、その場合の各種の関数は次のようになります。そして例えばハザード関数の値が0.5の時は図11.3.1のようなグラフになります。

λ(t) = λ(定数)　　S(t) = exp(-λt)　　F(t) = 1 - exp(-λt)　　f(t) = λ・exp(-λt)

これはポアソン(Poisson)過程と呼ばれるモデルであり、鉄砲を構えた敵に向かって軍隊が突撃する時の生存率を表す関数になるので標的モデルと呼ばれることもあります。例えば1時間あたりの敵の鉄砲の命中率を50％とし、この命中率は時間経過によらず常に一定だとします。この時、100名の軍隊が突撃すると1時間後には50名が死亡して生存者は50名なり、さらにそれから1時間後には25名が死亡して生存者は25名になります。

このように1時間あたりの命中率つまり瞬間死亡率は常に50％ですが、時間が経つにつれて生存者が減り、それに応じて死亡者数も減っていくので生存率の減り方は次第にゆっくりになります。図11.3.1を見ると、その様子が何となくわかると思います。

上記の関数の相互関係と図11.3.1から、λ(t)はS(t)に対して指数的に影響する、つまり瞬間死亡率は累積生存率曲線に対して指数的に影響することがわかります。第2節で説明したコックス・マンテルの検定で、瞬間死亡率の差を指数変換した瞬間死亡率の比つまりハザード比を指標にするのはこのためです。

前口上	目次	第1章	第2章	第3章	第4章	第5章	第6章	第7章	第8章	第9章	第10章
第11章	第12章	第13章	第14章	第15章	第16章	第17章	第18章	第19章	第20章	付録