玄関
>
会議室
館内案内図
第1展示室
第2展示室
第3展示室
第4展示室
特別展示室
会議室
管理室
他館への連絡通路
会議室
この会議室はパソコン通信と同様のオンライン掲示板です。 どんな話題でもかまわないので気軽にじゃんじゃん書き込んでください。
閲覧
投稿
過去ログ倉庫
[書き込み削除]
1907 番の書き込みのパスワードを入力してちょ!
1907.
Re[1906]:[1904]:[1903]:セミパラメトリックモデルとパラメトリックモデルについて
投稿者:
杉本典夫
[
URL
] 投稿日:2022/11/11 (Fri) 08:57:11
>生存時間解析の初心者さん & 北の大学院生さん
>> 比例ハザード性の仮定の利便性から医療系ではCox比例ハザードモデルが頻用されているそうです。
医学分野で生存時間解析が盛んに用いられるようになった30年ほど前は、パラメトリックモデルが主流でした。そのため僕も流行に乗り、自作のデータ解析ソフトでパラメトリックモデルをサポートしました。
でも理論が難しいことと、サポートしている統計ソフトが少ないことから、単純なCoxの比例ハザードモデルが使用されるようになった……というのが実態ですね。(^_^;)
パラメトリックモデルについては、次の本に詳しく解説されていますよ。
・「エモリー大学クラインバウム教授の生存時間解析」David Kleinbaum・Mitchel Klein著、神田英一郎・藤井朋子訳、サイエンティスト社 、2015年
https://www.amazon.co.jp/%E3%82%A8%E3%83%A2%E3%83%AA%E3%83%BC%E5%A4%A7%E5%AD%A6%E3%82%AF%E3%83%A9%E3%82%A4%E3%83%B3%E3%83%90%E3%82%A6%E3%83%A0%E6%95%99%E6%8E%88%E3%81%AE%E7%94%9F%E5%AD%98%E6%99%82%E9%96%93%E8%A7%A3%E6%9E%90-David-Kleinbaum/dp/4860790723/ref=sr_1_1?__mk_ja_JP=%E3%82%AB%E3%82%BF%E3%82%AB%E3%83%8A&crid=3VZYQUQOPRCWG&keywords=%E3%82%A8%E3%83%A2%E3%83%AA%E3%83%BC%E5%A4%A7%E5%AD%A6%E3%82%AF%E3%83%A9%E3%82%A4%E3%83%B3%E3%83%90%E3%82%A6%E3%83%A0%E6%95%99%E6%8E%88&qid=1668121609&s=books&sprefix=%E3%82%A8%E3%83%A2%E3%83%AA%E3%83%BC%E5%A4%A7%E5%AD%A6%E3%82%AF%E3%83%A9%E3%82%A4%E3%83%B3%E3%83%90%E3%82%A6%E3%83%A0%E6%95%99%E6%8E%88%2Cstripbooks%2C168&sr=1-1
>> つまり医学では、説明変数が与える影響を知るためにCOX比例ハザードモデルが使われているのであって 生存時間の推定を目的とはしていない
>> とういう認識でいいのかな?
そのとおりです。
その証拠に医学論文では、Cox比例ハザードモデルを使っているにもかからわず、生存率のグラフは単変量の累積生存率曲線を描きますよね。Cox比例ハザードモデルを使ったのなら、本来は多変量の累積生存率曲線を描かないと整合性が取れません。
生存時間解析は、元々は生命保険会社が生命表を作成して、保険料を計算するために開発した統計手法です。そのため以前は「生命表解析」と呼んでいました。そして生命表解析は、特定の時期の生存率を予測することが主目的です。そのため主としてパラメトリックモデルを用い、セミパラメトリックモデルはあまり用いません。
ちなみに多変量の累積生存率曲線とは、例えば当館の次のページの「図11.4.1 基準生存関数と理論的生存関数」のようなグラフのことです。
○玄関>雑学の部屋>雑学コーナー>統計学入門
→11.4 比例ハザードモデル
http://www.snap-tck.com/room04/c01/stat/stat11/stat1104.html
>> 一般的に医療現場で平均生存期間として使われる値は、カプランマイヤー法の生存曲線で生存率がちょうど50%になる時期の累積生存率のことです。これを専門用語では「生存期間中央値」といいます。
細かいツッコミで恐縮ですが、平均生存時間と生存期間中央値つまり50%生存時間(MST:Median Survival Time)は別物です。そしてよく誤解されていますが、Cox-Mantel検定もログランク検定も一般化ウィルコクソンの2標本検定もMSTの検定ではなく、あくまでも生存順位の検定です。
医学界でMSTが多用される理由は、平均生存時間は全例が死亡しなければ求められないのに対して、MSTは半数以上が死亡すれば求められるからですね。実は、生存時間解析は「全例が死亡する」という前提で理論を構築しています。そのため全例が死亡していない時は、解析結果は不正確になります。このことも、医学分野ではあまり知られていないと思います。
>> 検定する意味はあるのか??
>> 厳密にいえば検定するまでもなく すべての説明変数が成り立たないのでは?
そのとおりです。
比例ハザード性の検定は、ある時期の2群の生存率が0.1%異なっていても、例数が多くなれば有意になり、「比例ハザード性が成り立っていない」ということになります。
以前、100万例程度のビッグデータの解析をしたことがあります。その時、体重が0.1kgつまり100g増加しても検定結果が有意になりました。
「2つの平均値の差が有意」ということは、「2つの平均値がぴったり同じ値ではない」ということが95%以上の確率で言えるという意味であり、「2つの平均値が科学的に意味があるほど異なっている」ということが95%以上の確率で言えるという意味ではありません。そのため、はっきり言って検定は無意味です。
そこでネイマンとピアソンは、Fisher流の有意性検定を否定し、科学的な許容範囲つまり科学的に同等と考えられる範囲と、区間推定の結果(信頼区間)を比較することによって、科学的に意味のある結論を導くための統計学を提唱しました。それが、現在、主流になっているネイマン・ピアソン統計学です。
ところがFisher流の有意性検定にどっぷりと染まってしまった研究者達が、「どうしても検定がしたい!」と要望したので、仕方なく科学的な許容範囲と信頼区間を組み合わせて統計的仮説検定を開発しました。しかしネイマンとピアソンの元々の目的は検定を廃止することだったので、彼等自身は統計的仮説検定はほとんど使いませんでした。
僕はネイマン・ピアソン統計学派ではありませんが、検定廃止論者ではあります。σ(^_-)
推定と検定と科学的判断の関係については、次のページを御覧ください。
○玄関>雑学の部屋>雑学コーナー>統計学入門
→1.7 ハンディキャップ方式の検定 (1) 推定と検定の関係
http://www.snap-tck.com/room04/c01/stat/stat01/stat0107.html
※「図1.7.1 検定結果と信頼区間」とその下の表が参考になると思います。