玄関会議室

会議室

この会議室はパソコン通信と同様のオンライン掲示板です。 どんな話題でもかまわないので気軽にじゃんじゃん書き込んでください。

[書き込み削除]

1911 番の書き込みのパスワードを入力してちょ!


1911. Re[1910]:サンプルサイズについて 投稿者:杉本典夫 [URL] 投稿日:2022/11/16 (Wed) 10:18:41
>生存時間解析の初心者さん
御質問にお答えします。

>> Cox 比例ハザードモデルを扱う上での質問です.
>> 1
>> 生存データが 何によって死亡するかを調べたい時, 用いる説明変数 一つずつ
>> ログランク検定を 行い生存例,死亡例のサンプルサイズが足りているか調べて行けばよいのでしょうか?
>> 年齢といった量的データは 必要サンプル数はどう判断するべきか?
多変量解析は記述統計的手法であり、探索的な統計手法です。そのため推測統計における「必要例数」という概念そのものがありません。
検証的な研究は、試験計画時に検証すべき具体的な作業仮説を設定します。そして主として推測統計学を用い、作業仮説に基づいて、統計的仮説検定については科学的に意義のある帰無仮説と対立仮説を設定し、区間推定については科学的に意義のある絶対精度(信頼区間の半分の範囲)を設定し、それらを元にして作業仮説を検証するのに必要な例数を求めます。
それに対して探索的な研究は、検証型研究の作業仮説を設定するための情報を収集することが主目的です。そのため試験計画時には具体的な作業仮説を設定していません。したがって統計的仮説検定の帰無仮説と対立仮説を設定できず、区間推定の絶対精度も設定できず、試験の必要例数は求められません。
多変量解析は、試験計画時に具体的な作業仮説つまり解析結果を設定するのは困難です。そのため主として探索的研究に用いられます。ただし多変量解析の場合は、解析結果が信頼できるための数学的な条件――例数、線型性、等分散性等々――はあります。例数については、経験的に次のような条件を満足している必要があると言われています。
・例数≧(変数の数の2乗 または 変数の数×10)の大きい方の数値
また生存時間解析の場合は、経験的に次のような条件を満足している必要があると言われています。
・例数≧{(死亡例数の2乗)/2 または 死亡例数×5}の大きい方の数値

詳しいことは、当館の次のページをじっくりと読んでください。(^_-)
○玄関>雑学の部屋>雑学コーナー>統計学入門
→1.8 科学的研究の種類 (注1)
http://www.snap-tck.com/room04/c01/stat/stat01/stat0108.html#note01
○玄関>雑学の部屋>雑学コーナー>統計学入門
→11.6 パラメトリック生命表解析 (注4)
http://www.snap-tck.com/room04/c01/stat/stat11/stat1106.html#note04

>> 2
>> また説明変数(例として男,女)をKMプロットした際に明らかに差があるがその説明変数が 女のデータが男に比べて極端に少ない時(サンプルサイズが足りていない時) 用いるべきではないのでしょうか?
女の例数が極端に少ない時は、全体の解析と、男だけの解析の両方を実施し、両者の解析結果を比較しながら総合的に検討する「感度分析」を行うのが常套手段ですね。
1番の回答に書いたように、多変量解析は探索的な手法です。そのため探索的な解析結果と割り切り、解析結果の信頼性の低さを考慮した上で解析結果について色々と検討すれば、ある程度の情報は得られると思います。

>> 3
>> 生存時間解析 の際 死亡例と生存例 5:5が理想だと思うが 1:9でも用いて良いのでしょうか?
これは多くの人が誤解していることですね。(~_~;)
1907番の書き込みで説明したように、生存時間解析は「全例が死亡する」という前提で理論を組み立てています。そのため解析結果に影響するのは死亡例のデーだけであり、生存例や脱落例はほとんど影響しません。したがって1番の回答に書いたように、解析結果が信頼できるための必要例数は死亡例数だけに依存します。

>> 4
>> 生存時間解析の際 年齢と言った量的変数はそのまま用いてもよいのか?
>> 10代20代といったように丸めたほうが良いのでしょうか?
計量データを丸めるのはもったいないので、お勧めしません。
データは、計量データ→順序データ→分類データの順にレベルが低くなり、情報量が少なくなります。そして計量データを丸めて順序データや分類データにした場合、境界値によって結果が変わります。そのため境界値を恣意的に操作することによって結果を恣意的に操作することができるので、結果の客観性と信頼性が低くなります。
レベルの高い尺度のデータをレベルの低い尺度のデータに変換することを「尺度合わせ」といいます。原則として、統計学では尺度合わせは禁じ手であり、お勧めできません。これについては、当館の次のページをじっくりと読んでください。(^_-)
○玄関>雑学の部屋>雑学コーナー>統計学入門
→2.6 尺度合わせと外れ値 (1) 尺度合わせ
http://www.snap-tck.com/room04/c01/stat/stat02/stat0206.html