玄関会議室

会議室

この会議室はパソコン通信と同様のオンライン掲示板です。 どんな話題でもかまわないので気軽にじゃんじゃん書き込んでください。

名前
表題
e-mail
URL
パスワード(削除用、英数字で20文字以内)
内容


No.1858 - 1927 / 70 件表示


1927. Re[1926]:[1925]:因子分析 投稿者:北の大学院生 投稿日:2023/04/13 (Thu) 09:31:00 [返信] [削除]
杉本様
いつも大変お世話になっています。丁寧な回答をありがとうございます。

元データの相関行列Rなどの情報がないとうまく因子分析が行えているかわからないという結論にいたるんですね!

一般的な評価だったので、特定の疾患でうまく評価できているか自分で確かめるのが現実的だと思い、問診表なので多数のデータ収集を検討することにいたしました。

今後ともよろしくお願いいたします。

1926. Re[1925]:因子分析 投稿者:杉本典夫 [URL] 投稿日:2023/04/13 (Thu) 09:11:30 [返信] [削除]
>北の大学院生さん
> 累積寄与率が46%で3つの下位尺度に分類されていますが、あまりうまく因子分析が行われていないと感じ、
> カイザー・メイヤー・オルキンのサンプリング適切性基準や尤度比検定を利用して因子モデルによって
> 観測されたデータがうまく復元できるかどうかの検定などで確認したいのですが、
> 質問項目数、因子負荷量、因子間の相関係数、α係数からのみでうまく因子分析が行えているか確かめることはできますか。
> (共通性25%、独自性75%で乱数でデータを作り出して計算はできなさそうだと思いました。)
尤度比検定の計算には元データの相関行列Rが必要です。そのため上記の情報だけで計算するのは難しいと思います。
尤度比検定の計算式は次のページの「17.1 因子と因子分析 (注2)」に記載してあります。
http://www.snap-tck.com/room04/c01/stat/stat17/stat1701.html#note02

> 新規医療機器の測定は回帰分析でNRSと連動してうまく評価できるような結果(連動の回帰分析を勉強させていただきました)で
> 痛みの評価をNRSとは別の1次元で評価できると思いよかったです。(NRS:新規指標=1:15-20くらいでした。)
それは良かったです! 連動回帰分析は少々ややこしい手法なので、利用してくれる人が少ないんですよね。

> (*http://www.snap-tck.com/room04/c01/stat/stat17/stat1701.html#:~:text=%E8%A1%A817.1.1%E3%81%AE%E5%AF%84%E4%B8%8E%E7%8E%87%E3%81%AF%E5%90%84%E5%9B%A0%E5%AD%90%E3%81%AE%E5%9B%A0%E5%AD%90%E8%B2%A0%E8%8D%B7%E9%87%8F%E3%82%92%E5%B9%B3%E6%96%B9%E3%81%97%E3%81%A6%E5%90%88%E8%A8%88%E3%81%97%E3%81%9F%E5%80%A4%E3%81%A7%E3%81%99%E3%80%82の部分ですが合計ではなく、平均値だと思われます。)
これは、御指摘のとおり「平均」のタイプミスです! 早速、御指摘の部分を訂正しておきました。
当館にはこういうタイプミスがちょくちょくあるので(^^;)、指摘していただくと大いに助かります。
御指摘ありがとうございました。これらからも、よろしくお願いします。m(_ _)m

1925. 因子分析 投稿者:北の大学院生 投稿日:2023/04/12 (Wed) 21:27:31 [返信] [削除]
杉本様、いつも大変お世話になっています。

因子分析に関して質問です。
因子分析で因子負荷量と因子間の相関係数、α係数のみが公表された因子分析の論文があります。
そこから、ss loadingsと寄与率、独自性や共通性も計算できました。

累積寄与率が46%で3つの下位尺度に分類されていますが、あまりうまく因子分析が行われていないと感じ、カイザー・メイヤー・オルキンのサンプリング適切性基準や尤度比検定を利用して因子モデルによって観測されたデータがうまく復元できるかどうかの検定などで確認したいのですが、質問項目数、因子負荷量、因子間の相関係数、α係数からのみでうまく因子分析が行えているか確かめることはできますか。(共通性25%、独自性75%で乱数でデータを作り出して計算はできなさそうだと思いました。)

また、最近までマクギル疼痛質問表で因子分析も行えるようになりましたが、一部のデータが極端な値で、ほとんどが平均以下の値になり、さらに既存の下位尺度の分類通りにならず、質問項目を検討しないと新しくある疾患の痛みをうまく測れないことが分かりました。

新規医療機器の測定は回帰分析でNRSと連動してうまく評価できるような結果(連動の回帰分析を勉強させていただきました)で痛みの評価をNRSとは別の1次元で評価できると思いよかったです。(NRS:新規指標=1:15-20くらいでした。)

(*http://www.snap-tck.com/room04/c01/stat/stat17/stat1701.html#:~:text=%E8%A1%A817.1.1%E3%81%AE%E5%AF%84%E4%B8%8E%E7%8E%87%E3%81%AF%E5%90%84%E5%9B%A0%E5%AD%90%E3%81%AE%E5%9B%A0%E5%AD%90%E8%B2%A0%E8%8D%B7%E9%87%8F%E3%82%92%E5%B9%B3%E6%96%B9%E3%81%97%E3%81%A6%E5%90%88%E8%A8%88%E3%81%97%E3%81%9F%E5%80%A4%E3%81%A7%E3%81%99%E3%80%82の部分ですが合計ではなく、平均値だと思われます。)

今後ともよろしくお願いいたします。

1924. Re[1923]:[1922]:多重性に関して 投稿者:北の大学院生 投稿日:2023/04/12 (Wed) 21:20:26 [返信] [削除]
杉本様
いつも大変お世話になっています。丁寧な回答をありがとうございます。

“いいとこどりをして都合の良い解釈”をしないように気を付けます。

臨床研究のように多変量解析をとも思いましたが、
コントロールが1で見たいものはコントロールの何倍かしか分からないなど相対評価のものもあり、さらにそもそも生物学的に意味がある差なのかもわからないものもあり、色々と調べて基礎研究も行おうと思います。

1923. Re[1922]:多重性に関して 投稿者:杉本典夫 [URL] 投稿日:2023/04/11 (Tue) 09:28:54 [返信] [削除]
>北の大学院生さん
お久しぶりです!(^o^)/

> この時、たとえば、20個の検定ですべてが5%の有意水準で有意になった場合は1つは期待値的に偽陽性であると考えられますが、
> このような場合は実験を繰り返し、同様の結果を確認するまたは、有意水準をより厳しくするなどのことを行ったほうがよいですか。
> そもそも、複数の項目を調べた場合、Bonferroni法などで有意水準を調整する必要はありますか。
多重性のキーワードは”いいとこ取り”です。
複数の検定結果について、1つでも有意になっていれば、それを”いいとこ取り”してファミリーとしての結論――例えば「新薬はプラセボよりも有効である」という結論――を採用する時は、1つ1つの検定について多重性の調整が必要です。
つまり複数の検定が独立なら、新薬とプラセボの有効性が同じでも、検定を20回行えば1回くらいは有意になる、つまり偽陽性になる(αエラーが5%)ので、1回1回の検定の有意水準を5%/20にする必要があるわけです。
しかし複数の検定結果について、1回1回の検定結果を”いいとこ取り”せず、それぞれを独立に評価するのなら多重性の調整は必要ありません。
例えば二元配置分散分析では、要因Aと要因Bについてそれぞれ検定します。その場合、要因A(例えば薬剤の有無)と要因B(例えば性別)の検定結果は独立に評価し、それらを”いいとこ取り”してファミリーとしての結論を採用するわけではありません。そのため要因Aと要因Bの検定に多重性の調整は行いません。

御質問の色々なサイトカインの例では、複数の検定結果を”いいとこ取り”してファミリーとしての結論を採用するのなら多重性の調整が必要です。しかし複数の検定結果をそれぞれ独立に評価し、”いいとこ取り”してファミリーとしての結論を採用するわけではないのなら多重製の調整は必要ありません。
これについては、当館の次のページで紹介している「ワインとソムリエの話」と「名医と藪医者のたとえ話」がわかりやすいと思います。(^_-)
・4.1 多標本の計量値 (1)データに対応がない場合 2) 多重比較
http://www.snap-tck.com/room04/c01/stat/stat04/stat0401.html

それから多重性の調整は、原則として複数の検定が独立という前提で行います。もし複数の検定が独立ではない時は検定間の相関を考慮して多重性の調整を行う必要があり、それには非常に面倒な計算が必要です。
色々なサイトカインの場合は、それぞれが独立というわけではなく相関があると思います。そのような場合、むしろ多変量解析によって複数のサイトカインの関係を分析し、その結果を検討して総合的に評価した方が良いと思います。
例えば新薬の臨床試験では主要評価項目と副次評価項目があり、それらの間にはたいてい相関があります。そのようなデータを解析する場合、僕が薬業界で生息していた時(^^;)は、それぞれの項目について検定と区間推定を行い、その結果を総合して新薬の有効性を評価していました。
しかし薬業界から足を洗った現在は、原則として検定と区間推定は主要評価項目についてだけ行います。そして主要評価項目を目的変数にし、副次評価項目を説明変数にした重回帰分析を行い、主要評価項目に対する副次評価項目の影響を分析します。それによって主要評価項目と副次評価項目の関係と、それらに対する新薬の効果を総合的に検討することができます。
この方法は多重性の調整が必要ではなく、しかも複数の評価項目の関係を分析して総合的に評価できるので実際的だと思います。

以上、参考になれば幸いです。(^_-)

1922. 多重性に関して 投稿者:北の大学院生 投稿日:2023/04/10 (Mon) 09:04:54 [返信] [削除]
杉本様
いつも大変お世話になっています。

基礎研究でさまざまなサイトカインを測り、同時にいくつもの検定を行うことがあります。

この時、たとえば、20個の検定ですべてが5%の有意水準で有意になった場合は1つは期待値的に偽陽性であると考えられますが、このような場合は実験を繰り返し、同様の結果を確認するまたは、有意水準をより厳しくするなどのことを行ったほうがよいですか。

そもそも、複数の項目を調べた場合、Bonferroni法などで有意水準を調整する必要はありますか。(私はある程度、スクリーニングでなければ調整すべきとかんじています)

今後ともよろしくお願いいたします。

1921. Re[1920]:[1918]:測定限界の値の扱いについて 投稿者:北の大学院生 投稿日:2022/12/19 (Mon) 12:04:37 [返信] [削除]
杉本様
いつも大変お世話になっています。丁寧な回答をありがとうございます。

測定限界値と理論的な上限値の平均値を用いるのか、理論的な上限値が存在しない時は、妥協案として測定限界値よりも科学的に意義がある値だけ高い値を用いるという方法で対応しようと思います。

外れ値の処理方法を勉強をさせていただきます。
切断効果が現れてしまうかもしれませんが外れ値の集団だけでサブ解析なども考えてみます。

もっと正しいデータの扱い方をしっかりと勉強しなおします。
今後ともよろしくお願いいたします。

1920. Re[1918]:測定限界の値の扱いについて 投稿者:杉本典夫 [URL] 投稿日:2022/12/18 (Sun) 17:21:26 [返信] [削除]
>北の大学院生さん
>> 測定限界の上限を超えた場合の値はどのように処理するのが一般的なのでしょうか。
1919番の返事を書いた後で、上記の御質問の意味が「測定限界上限より上の、非常に高い値の時」という意味だと思い当たりました!

普通の検査では、実際の臨床現場で有り得る上限値または理論的な上限値よりも高い値まで測定可能な測定系を使用すると思います。疾患などでは臨床検査値が非常に高い値になることがあるので、そのような値を測定できない測定系は臨床現場では不都合だからです。そのため測定限界上限を超える値があるということは、用いた測定系が不適切と考えられます。
もしそのような測定系を使わざるを得ないとしたら、測定限界の上限を超えた場合は、測定限界値と理論的な上限値の平均値を用いるのが合理的ということになると思います。理論的な上限値が存在しない時は、妥協案として測定限界値よりも科学的に意義がある値だけ高い値を用いるという方法が考えられます。
そしてそのような値は「外れ値」になると思いますので、一般的な外れ値の処理方法に従って処理するのが妥当だと思います。外れ値の処理方法については、当館の次のページを参考にしてください。
○玄関>雑学の部屋>雑学コーナー>統計学入門
→2.6 尺度合わせと外れ値 (2)外れ値
http://www.snap-tck.com/room04/c01/stat/stat02/stat0206.html

1919. Re[1918]:測定限界の値の扱いについて 投稿者:杉本典夫 [URL] 投稿日:2022/12/18 (Sun) 09:39:15 [返信] [削除]
>北の大学院生さん
しばらく家を留守にしていて、返事が遅くなってしまってすいません。m(__;)m

>> 測定限界についてなのですが、測定限界値以下のデータは、0と測定限界値の平均値として解析に入れるのは、
>> 歯科の精密触覚機能検査講習時に理由は知らされずにそうする(下限は0.008gなので分かれば0.004gと記録となっていました)と教わっていて、
>> 実際に歯科でもそのように扱っていました。
そうですか、それは基礎実験における一般的な測定限界値以下のデータの取り扱い通りですね。理由は簡単なので、理由までしっかり教えれば完璧ですね。

>> 測定限界の上限を超えた場合の値はどのように処理するのが一般的なのでしょうか。
測定限界の上限を超えれば実際の測定値が確定するはずですから、御質問の意味がわかりかねます。
もう少し詳しい説明をお願いします。

>> 以前からご指導いただいた、多変量解析のものは論文にして公表しようと思います。さらに、新規の医療機器の導入や評価指標の確立も順調に進んでいます。
そうですか、それは良かったですね!当館が何かのお役に立てたのなら、嬉しいですよ。(^_-)

1918. 測定限界の値の扱いについて 投稿者:北の大学院生 投稿日:2022/12/14 (Wed) 12:20:24 [返信] [削除]
杉本様
いつも大変お世話になっています。
先日も丁寧な返信、誠にありがとうございました。

測定限界についてなのですが、測定限界値以下のデータは、0と測定限界値の平均値として解析に入れるのは、歯科の精密触覚機能検査講習時に理由は知らされずにそうする(下限は0.008gなので分かれば0.004gと記録となっていました)と教わっていて、実際に歯科でもそのように扱っていました。

測定限界の上限を超えた場合の値はどのように処理するのが一般的なのでしょうか。やはり、限界値より上とするしかないのでしょうか。
ご教授お願いいたします。

以前からご指導いただいた、多変量解析のものは論文にして公表しようと思います。さらに、新規の医療機器の導入や評価指標の確立も順調に進んでいます。誠にありがとうございます。
今後ともよろしくお願いいたします。

1917. Re[1916]:[1915]:標準化α係数について 投稿者:北の大学院生 投稿日:2022/11/27 (Sun) 16:17:03 [返信] [削除]
杉本様、いつも丁寧な解説をありがとうございます。

時間をかけて貴Webページから学び、社会に還元できることを還元していきたいと思います。新規医療機器の導入などは何とか研究としてできそうな気がしてきました。
判別分析やクラスター分析の学習もじっくり行います。

いつもありがとうございます。
今後ともよろしくお願いいたします。

1916. Re[1915]:標準化α係数について 投稿者:杉本典夫 [URL] 投稿日:2022/11/25 (Fri) 09:14:41 [返信] [削除]
>北の大学院生さん
>> 質問なのですが、EZRでCronbachのα信頼性係数を出したときに標準化α信頼性係数が出るのですが、
>> これは他の効果量などと同様にaに関係なくでるα信頼性係数と解釈してよいのでしょうか?
標準化α係数は、計算に用いた項目を標準化(項目のデータから平均値を引いて偏差にし、それを標準偏差で割って平均値を0に、標準偏差を1にすること)した時のα係数のことです。
ICCは項目の分散を用いて求めるので、分散の大きな項目の影響が大きくなります。そのため項目の分散の影響を同じにするために、各項目のデータを標準化して分散を1にしてからICCを求めたものが標準化ICCです。
α係数は因子分析で用いられる指標であり、因子分析では計算に入れる項目が種々様々なので標準化α係数も参考にすることがあるのです。医学分野でICCを用いる時は、同じ項目を条件を変えて複数回測定した時の一致度の指標にすることが多いと思います。このような時は項目の分散はほぼ同じなので標準化ICCはめったに用いません。

ちなみに項目が2つの時のα係数=エーベルの級内相関係数は、相関係数と分散一致係数を掛けた値になります。そのため2つの項目を標準化すると分散一致係数が1になり、エーベルの級内相関係数は相関係数と一致します。これは僕が見つけた関係であり、分散一致係数も僕が考案した指標です。これについて当館の次のページに説明してあるので、興味があったら読んでみてください。(^_-)
○玄関>雑学の部屋>雑学コーナー>統計学入門
→6.2 データの要約と多変量解析 (注1)
http://www.snap-tck.com/room04/c01/stat/stat06/stat0602.html#note01
※「図6.2.4 相関係数の幾何学的解釈」の下にエーベルの級内相関係数と分散一致係数と相関係数の関係について説明してあります。

1915. Re[1896]:[1893]:ICCの必要例数について 投稿者:北の大学院生 投稿日:2022/11/24 (Thu) 12:38:14 [返信] [削除]
杉本様、いつも大変お世話になっています。

ICCに関して、貴WEBページから学ばさせていただき、エクセルシートをICC(1,b)とICC(3,b)、信頼区間に基づいた必要例数の計算などができるようになりました。

EZRで初期パッケージで可能なCronbachのα信頼性係数しか計算できませんでしたが、エクセルシートでかなりのことができました。
ご指導をありがとうございました。

ICC(1,b)などは分散で決まってしまうので、見積もりの分散でそもそも0.6や0.7を超えないと新たな指標としては信頼性に欠けるということがよくわかりました。

質問なのですが、EZRでCronbachのα信頼性係数を出したときに標準化α信頼性係数が出るのですが、これは他の効果量などと同様にaに関係なくでるα信頼性係数と解釈してよいのでしょうか?
ご教授お願いいたします。

今後ともよろしくお願いいたします。

1914. Re[1913]:[1912]:生存時間解析の基本について 投稿者:生存時間解析の初心者 投稿日:2022/11/17 (Thu) 17:18:41 [返信] [削除]
杉本さん
度々の回答ありがとうございます
生存例数は 生存率に寄与するのであり、時間は死亡例だけが影響を与える
ということですね、

一度基礎固めから行いたいと思います。

1913. Re[1912]:生存時間解析の基本について 投稿者:杉本典夫 [URL] 投稿日:2022/11/17 (Thu) 10:21:22 [返信] [削除]
>生存時間解析の初心者さん
>> ということは死亡例が500件だとすると 生存例、死亡例合計 125000 件以上の例数が欲しい という認識で良いのでしょうか?
いいえ、死亡例が500例あるのなら、その500例の死亡例だけを解析対象にしても、生存例を合わせて125000例を解析対象にしても、解析結果の信頼性はほとんど変わらないという意味です。
kaplan-Meier法による累積生存率曲線では、累積生存率曲線の形が変化するのは死亡例が発生した時だけであり、生存例や途中脱落例は累積生存率曲線の形を変化させないことから、生存時間に影響を与えるのは死亡例だけであることがわかると思います。
そしてそもそも「生存時間解析」は、色々な変数が生存率に与える影響を分析するのではなく、生存時間に与える影響を分析するための手法です。このことは生存率関数S(t)において、ハザードλは生存時間tの係数であって「S(t)=exp(-λ・t)」と表されていて、λは共変数xの1次関数として表されていることからわかると思います。生存時間解析に関する色々な誤解は、この根本的なことをしっかりと理解していないことに起因していると思います。

これまでの質問の回答は、ほとんど当館の「第11章 生命表解析」に書いてあります。そのため、まずはこの11章を――できれば(注)まで――しっかりと読んでから、質問してください。(^_-)
○玄関>雑学の部屋>雑学コーナー>統計学入門
→第11章 生命表解析
http://www.snap-tck.com/room04/c01/stat/stat11/stat1101.html

1912. Re[1911]:[1910]:サンプルサイズについて 投稿者:生存時間解析の初心者 投稿日:2022/11/16 (Wed) 12:18:37 [返信] [削除]
杉本さん 毎度詳しい回答ありがとうございます.

科学的研究の種類 を読んで学ばさせていただきます!

COX比例ハザード 行った際に 質問2番のようなケースが回帰係数が高く算出され
評価に困っていましたが、 実際信頼区間も広く算出されているため
信頼性について 検討していきたいと思います。

>> 例数≧{(死亡例数の2乗)/2 または 死亡例数×5}の大きい方の数値

ということは死亡例が500件だとすると 生存例、死亡例合計 125000 件以上の例数が欲しい という認識で良いのでしょうか?

手持ちのデータが 生存4500 死亡500 説明変数 たくさんあるが20ぐらいに選択予定 の場合 信頼性はやはり低くなるのか?

その場合区間で区切って データ数を減らし条件を満足させる必要があるのでしょうか? 大きな期間を用いているのでもともと期間を整理しようとは思っていました。

1911. Re[1910]:サンプルサイズについて 投稿者:杉本典夫 [URL] 投稿日:2022/11/16 (Wed) 10:18:41 [返信] [削除]
>生存時間解析の初心者さん
御質問にお答えします。

>> Cox 比例ハザードモデルを扱う上での質問です.
>> 1
>> 生存データが 何によって死亡するかを調べたい時, 用いる説明変数 一つずつ
>> ログランク検定を 行い生存例,死亡例のサンプルサイズが足りているか調べて行けばよいのでしょうか?
>> 年齢といった量的データは 必要サンプル数はどう判断するべきか?
多変量解析は記述統計的手法であり、探索的な統計手法です。そのため推測統計における「必要例数」という概念そのものがありません。
検証的な研究は、試験計画時に検証すべき具体的な作業仮説を設定します。そして主として推測統計学を用い、作業仮説に基づいて、統計的仮説検定については科学的に意義のある帰無仮説と対立仮説を設定し、区間推定については科学的に意義のある絶対精度(信頼区間の半分の範囲)を設定し、それらを元にして作業仮説を検証するのに必要な例数を求めます。
それに対して探索的な研究は、検証型研究の作業仮説を設定するための情報を収集することが主目的です。そのため試験計画時には具体的な作業仮説を設定していません。したがって統計的仮説検定の帰無仮説と対立仮説を設定できず、区間推定の絶対精度も設定できず、試験の必要例数は求められません。
多変量解析は、試験計画時に具体的な作業仮説つまり解析結果を設定するのは困難です。そのため主として探索的研究に用いられます。ただし多変量解析の場合は、解析結果が信頼できるための数学的な条件――例数、線型性、等分散性等々――はあります。例数については、経験的に次のような条件を満足している必要があると言われています。
・例数≧(変数の数の2乗 または 変数の数×10)の大きい方の数値
また生存時間解析の場合は、経験的に次のような条件を満足している必要があると言われています。
・例数≧{(死亡例数の2乗)/2 または 死亡例数×5}の大きい方の数値

詳しいことは、当館の次のページをじっくりと読んでください。(^_-)
○玄関>雑学の部屋>雑学コーナー>統計学入門
→1.8 科学的研究の種類 (注1)
http://www.snap-tck.com/room04/c01/stat/stat01/stat0108.html#note01
○玄関>雑学の部屋>雑学コーナー>統計学入門
→11.6 パラメトリック生命表解析 (注4)
http://www.snap-tck.com/room04/c01/stat/stat11/stat1106.html#note04

>> 2
>> また説明変数(例として男,女)をKMプロットした際に明らかに差があるがその説明変数が 女のデータが男に比べて極端に少ない時(サンプルサイズが足りていない時) 用いるべきではないのでしょうか?
女の例数が極端に少ない時は、全体の解析と、男だけの解析の両方を実施し、両者の解析結果を比較しながら総合的に検討する「感度分析」を行うのが常套手段ですね。
1番の回答に書いたように、多変量解析は探索的な手法です。そのため探索的な解析結果と割り切り、解析結果の信頼性の低さを考慮した上で解析結果について色々と検討すれば、ある程度の情報は得られると思います。

>> 3
>> 生存時間解析 の際 死亡例と生存例 5:5が理想だと思うが 1:9でも用いて良いのでしょうか?
これは多くの人が誤解していることですね。(~_~;)
1907番の書き込みで説明したように、生存時間解析は「全例が死亡する」という前提で理論を組み立てています。そのため解析結果に影響するのは死亡例のデーだけであり、生存例や脱落例はほとんど影響しません。したがって1番の回答に書いたように、解析結果が信頼できるための必要例数は死亡例数だけに依存します。

>> 4
>> 生存時間解析の際 年齢と言った量的変数はそのまま用いてもよいのか?
>> 10代20代といったように丸めたほうが良いのでしょうか?
計量データを丸めるのはもったいないので、お勧めしません。
データは、計量データ→順序データ→分類データの順にレベルが低くなり、情報量が少なくなります。そして計量データを丸めて順序データや分類データにした場合、境界値によって結果が変わります。そのため境界値を恣意的に操作することによって結果を恣意的に操作することができるので、結果の客観性と信頼性が低くなります。
レベルの高い尺度のデータをレベルの低い尺度のデータに変換することを「尺度合わせ」といいます。原則として、統計学では尺度合わせは禁じ手であり、お勧めできません。これについては、当館の次のページをじっくりと読んでください。(^_-)
○玄関>雑学の部屋>雑学コーナー>統計学入門
→2.6 尺度合わせと外れ値 (1) 尺度合わせ
http://www.snap-tck.com/room04/c01/stat/stat02/stat0206.html

1910. サンプルサイズについて 投稿者::生存時間解析の初心者 投稿日:2022/11/15 (Tue) 20:19:22 [返信] [削除]
主にサンプル数についての質問になります.

Cox 比例ハザードモデルを扱う上での質問です.
1
生存データが 何によって死亡するかを調べたい時, 用いる説明変数 一つずつ
ログランク検定を 行い生存例,死亡例のサンプルサイズが足りているか調べて行けばよいのでしょうか?
年齢といった量的データは 必要サンプル数はどう判断するべきか?
2
また説明変数(例として男,女)をKMプロットした際に明らかに差があるがその説明変数が 女のデータが男に比べて極端に少ない時(サンプルサイズが足りていない時) 用いるべきではないのでしょうか?
3
生存時間解析 の際 死亡例と生存例 5:5が理想だと思うが 1:9でも用いて良いのでしょうか?
4
生存時間解析の際 年齢と言った量的変数はそのまま用いてもよいのか?
10代20代といったように丸めたほうが良いのでしょうか?

質問がとても多くてすみません.
ご教授いただけると幸いです




1909. Re[1907]:[1906]:[1904]:[1903]:セミパラメトリックモデルとパラメトリックモデルについて 投稿者:北の大学院生 投稿日:2022/11/14 (Mon) 11:19:58 [返信] [削除]
杉本様、詳しい解説ありがとうございます。

生存時間解析は「全例が死亡する」という前提で理論を構築しています。そのため全例が死亡していない時は、解析結果は不正確になります。
このことは、全く考えたことがなかったです。

「全例が死亡する」のを観察できるのは動物実験で重篤な感染実験くらいしか思いつきません。
やはり、現実はよい近似モデルで推定しかできないと実感しました。

生存解析は時間や費用が掛かるので、しっかりと内容を整理して活用できるようになってから将来行いたいと思います。

研究者達が、「どうしても検定がしたい!」という気持ちや、望ましい結果(p<0.05)などを期待する気持ちで科学的な意味を考えていなかったり、論理の飛躍があったりと難しいですね!

1908. Re[1907]:[1906]:[1904]:[1903]:セミパラメトリックモデルとパラメトリックモデルについて 投稿者:生存時間解析の初心者 投稿日:2022/11/11 (Fri) 14:14:41 [返信] [削除]
杉本典夫さん 詳しい解説ありがとうございます。

生存解析の取り扱い方、認識が修正できて、質問してよかったです。

厳密にはハザード性が成り立たないのに
ハザード性が成り立つ前提のモデル COX回帰モデル...

モデルとしての前提条件が満たしていないモデルを使うのは 怖くはありますね


検定を行い比例ハザードが成り立たたなかったら 説明変数に使わないでいくのが無難に感じますね
(データ数多いから比例ハザードが成り立ってないけど 使っても良いと理屈で説明するのが現在の自分だと難しそう)
 

1907. Re[1906]:[1904]:[1903]:セミパラメトリックモデルとパラメトリックモデルについて 投稿者:杉本典夫 [URL] 投稿日:2022/11/11 (Fri) 08:57:11 [返信] [削除]
>生存時間解析の初心者さん & 北の大学院生さん
>> 比例ハザード性の仮定の利便性から医療系ではCox比例ハザードモデルが頻用されているそうです。
医学分野で生存時間解析が盛んに用いられるようになった30年ほど前は、パラメトリックモデルが主流でした。そのため僕も流行に乗り、自作のデータ解析ソフトでパラメトリックモデルをサポートしました。
でも理論が難しいことと、サポートしている統計ソフトが少ないことから、単純なCoxの比例ハザードモデルが使用されるようになった……というのが実態ですね。(^_^;)

パラメトリックモデルについては、次の本に詳しく解説されていますよ。
・「エモリー大学クラインバウム教授の生存時間解析」David Kleinbaum・Mitchel Klein著、神田英一郎・藤井朋子訳、サイエンティスト社 、2015年
https://www.amazon.co.jp/%E3%82%A8%E3%83%A2%E3%83%AA%E3%83%BC%E5%A4%A7%E5%AD%A6%E3%82%AF%E3%83%A9%E3%82%A4%E3%83%B3%E3%83%90%E3%82%A6%E3%83%A0%E6%95%99%E6%8E%88%E3%81%AE%E7%94%9F%E5%AD%98%E6%99%82%E9%96%93%E8%A7%A3%E6%9E%90-David-Kleinbaum/dp/4860790723/ref=sr_1_1?__mk_ja_JP=%E3%82%AB%E3%82%BF%E3%82%AB%E3%83%8A&crid=3VZYQUQOPRCWG&keywords=%E3%82%A8%E3%83%A2%E3%83%AA%E3%83%BC%E5%A4%A7%E5%AD%A6%E3%82%AF%E3%83%A9%E3%82%A4%E3%83%B3%E3%83%90%E3%82%A6%E3%83%A0%E6%95%99%E6%8E%88&qid=1668121609&s=books&sprefix=%E3%82%A8%E3%83%A2%E3%83%AA%E3%83%BC%E5%A4%A7%E5%AD%A6%E3%82%AF%E3%83%A9%E3%82%A4%E3%83%B3%E3%83%90%E3%82%A6%E3%83%A0%E6%95%99%E6%8E%88%2Cstripbooks%2C168&sr=1-1

>> つまり医学では、説明変数が与える影響を知るためにCOX比例ハザードモデルが使われているのであって 生存時間の推定を目的とはしていない
>> とういう認識でいいのかな?
そのとおりです。
その証拠に医学論文では、Cox比例ハザードモデルを使っているにもかからわず、生存率のグラフは単変量の累積生存率曲線を描きますよね。Cox比例ハザードモデルを使ったのなら、本来は多変量の累積生存率曲線を描かないと整合性が取れません。
生存時間解析は、元々は生命保険会社が生命表を作成して、保険料を計算するために開発した統計手法です。そのため以前は「生命表解析」と呼んでいました。そして生命表解析は、特定の時期の生存率を予測することが主目的です。そのため主としてパラメトリックモデルを用い、セミパラメトリックモデルはあまり用いません。

ちなみに多変量の累積生存率曲線とは、例えば当館の次のページの「図11.4.1 基準生存関数と理論的生存関数」のようなグラフのことです。
○玄関>雑学の部屋>雑学コーナー>統計学入門
→11.4 比例ハザードモデル
http://www.snap-tck.com/room04/c01/stat/stat11/stat1104.html

>> 一般的に医療現場で平均生存期間として使われる値は、カプランマイヤー法の生存曲線で生存率がちょうど50%になる時期の累積生存率のことです。これを専門用語では「生存期間中央値」といいます。
細かいツッコミで恐縮ですが、平均生存時間と生存期間中央値つまり50%生存時間(MST:Median Survival Time)は別物です。そしてよく誤解されていますが、Cox-Mantel検定もログランク検定も一般化ウィルコクソンの2標本検定もMSTの検定ではなく、あくまでも生存順位の検定です。
医学界でMSTが多用される理由は、平均生存時間は全例が死亡しなければ求められないのに対して、MSTは半数以上が死亡すれば求められるからですね。実は、生存時間解析は「全例が死亡する」という前提で理論を構築しています。そのため全例が死亡していない時は、解析結果は不正確になります。このことも、医学分野ではあまり知られていないと思います。

>> 検定する意味はあるのか??
>> 厳密にいえば検定するまでもなく すべての説明変数が成り立たないのでは?
そのとおりです。
比例ハザード性の検定は、ある時期の2群の生存率が0.1%異なっていても、例数が多くなれば有意になり、「比例ハザード性が成り立っていない」ということになります。
以前、100万例程度のビッグデータの解析をしたことがあります。その時、体重が0.1kgつまり100g増加しても検定結果が有意になりました。
「2つの平均値の差が有意」ということは、「2つの平均値がぴったり同じ値ではない」ということが95%以上の確率で言えるという意味であり、「2つの平均値が科学的に意味があるほど異なっている」ということが95%以上の確率で言えるという意味ではありません。そのため、はっきり言って検定は無意味です。
そこでネイマンとピアソンは、Fisher流の有意性検定を否定し、科学的な許容範囲つまり科学的に同等と考えられる範囲と、区間推定の結果(信頼区間)を比較することによって、科学的に意味のある結論を導くための統計学を提唱しました。それが、現在、主流になっているネイマン・ピアソン統計学です。
ところがFisher流の有意性検定にどっぷりと染まってしまった研究者達が、「どうしても検定がしたい!」と要望したので、仕方なく科学的な許容範囲と信頼区間を組み合わせて統計的仮説検定を開発しました。しかしネイマンとピアソンの元々の目的は検定を廃止することだったので、彼等自身は統計的仮説検定はほとんど使いませんでした。
僕はネイマン・ピアソン統計学派ではありませんが、検定廃止論者ではあります。σ(^_-)

推定と検定と科学的判断の関係については、次のページを御覧ください。
○玄関>雑学の部屋>雑学コーナー>統計学入門
→1.7 ハンディキャップ方式の検定 (1) 推定と検定の関係
http://www.snap-tck.com/room04/c01/stat/stat01/stat0107.html
※「図1.7.1 検定結果と信頼区間」とその下の表が参考になると思います。

1906. Re[1904]:[1903]:多変量セミパラメトリックモデルと パラメトリックモデルについて 投稿者:生存時間解析の初心者 投稿日:2022/11/10 (Thu) 12:33:09 [返信] [削除]
>北の大学院生
生存期間中央値など 一般的に用いられる数値を調べてみようと思います!


打ち切りデータの多い部品の故障データ に 生存時間解析を当てはめようと考えていまして
参考となる 資料がないため, 現在は
多変量のパラメトリックモデル で モデル構築 
testデータで評価しようかなと考えています。

1905. COX比例ハザードモデルの ハザード性 投稿者:生存時間解析の初心者 投稿日:2022/11/10 (Thu) 12:24:07 [返信] [削除]
COX比例ハザードモデルは ハザード性が成り立つことを前提とし
比例ハザード性が成り立つかどうか  検定を行っていますが

実際は 成り立たないケースがほとんどだと思います。
その中で 検定を行って  p< 0.05だから ハザード性が成り立たないと
検定する意味はあるのか??
厳密にいえば検定するまでもなく すべての説明変数が成り立たないのでは?

1904. Re[1903]:多変量セミパラメトリックモデルと パラメトリックモデルについて 投稿者:北の大学院生 投稿日:2022/11/10 (Thu) 12:23:23 [返信] [削除]
>生存時間解析の初心者さん

一般的に医療現場で平均生存期間として使われる値は、カプランマイヤー法の生存曲線で生存率がちょうど50%になる時期の累積生存率のことです。これを専門用語では「生存期間中央値」といいます。

という説明もあるので、生存時間の目安として、“手持ちのデータで生存期間中央値”を出して、ほかの施設や研究と比較して明らかな差異がないか見るとかもいいのではないかと思いました。

差異があればデータ数なのか、施設の基準などの違いによるのか、時代によるものなのかなど様々なことを考えるきっかけとなると思います。

もしも上記の内容が間違っていたら申し訳ございません。

1903. 多変量セミパラメトリックモデルと パラメトリックモデルについて 投稿者:生存時間解析の初心者 投稿日:2022/11/10 (Thu) 11:53:08 [返信] [削除]
杉本さん、北の大学院生さん、 回答ありがとうございます!!
なんとなくですがバラバラだった知識がつながっていった気がします。

較正能(Calibration)で評価しようかなとも考えていましたが
そもそも、多変量パラメトリックモデルにしないと 生存期間の情報が使えないのですね

つまり医学では、説明変数が与える影響を知るためにCOX比例ハザードモデルが使われているのであって 生存時間の推定を目的とはしていない
とういう認識でいいのかな?


R,EZR 触ってみたいと思います!

1902. Re[1900]:[1899]:多変量セミパラメトリックモデルと パラメトリックモデルについて 投稿者:北の大学院生 投稿日:2022/11/10 (Thu) 11:04:44 [返信] [削除]
>生存時間解析の初心者さん

私は以前、Rの survivalパッケージをダウンロードしていました!

参考までに金芳堂から2022年06月 刊行された書籍にも生存期間の解析のサンプルデータ付きで実際にRで確認しながら読み進められる書籍もあります。
こちらの書籍で紹介されていたため、ダウンロードしましたが、すっかり忘れていました。

何か参考になれば幸いです。

1901. Re[1898]:[1895]:[1894]:比例ハザードモデル の評価について 投稿者:北の大学院生 投稿日:2022/11/10 (Thu) 09:53:28 [返信] [削除]
>生存時間解析の初心者さんはじめまして、北の大地で研究を始めたばかりの者です。

>> 多変量パラメトリックモデルで 生存時間で評価するためのモデルを作成しようと考えていますが, なにか R,Python で行えるパッケージはありますでしょうか?

についてですが、私はEZRを使用しています。R、EZRは、医療系でもよくつかわれているソフトなので、統計解析→生存期間の解析で
Cox比例ハザード回帰、Fine-Gray比例ハザード回帰、Logrank検定、Logrank trend検定、Gray検定などを選択できます。(Rコマンダーのバージョン 2.7-1)

比例ハザード性の仮定の利便性から医療系ではCox比例ハザードモデルが頻用されているそうです。

私自身も生存期間の解析もできるようになりたいと思っているので、お互いに学習を頑張りましょう!

1900. Re[1899]:多変量セミパラメトリックモデルと パラメトリックモデルについて 投稿者:杉本典夫 [URL] 投稿日:2022/11/10 (Thu) 08:44:11 [返信] [削除]
>生存時間解析の初心者さん
>> 多変量パラメトリックモデルで 生存時間で評価するためのモデルを作成しようと考えていますが, なにか R,Python で行えるパッケージはありますでしょうか?
RやPythonにはバグがあるので(^^;)、僕はあまり使いません。そのためパラメトリックモデルのパッケージについては、残念ながらわかりかねます。でも以前はパラメトリックモデルが主流だったので、RもPythopnもサポートしているのではないかと思います。

>> 読み進めていると 比例ハザードの仮定の検定を行っており,
>> パラメトリック・ハザード比検定ではないのか???
>> 実はパラメトリックモデルではない??と疑問に感じました
比例ハザード性を検討する手法は色々あります。パラメトリックモデルでは群ごとに色々なモデルを当てはめ、群によって最適なモデルが異なっていれば「比例ハザード性が成り立っていない」と判断するのが普通です。しかしこの方法は検定を使わないので、検定偏重&p値崇拝主義がまかり通っている医学界ではあまり使われません。
医学界では、ノンパラメトリック手法であるCox-Mantel検定の「異質性の検定」等を利用することが多いと思います。この手法をパラメトリックモデルと併用するのは矛盾ですが、検定偏重&p値崇拝主義がまかり通っている医学界は、そのような矛盾をけっこう平気で行いますね。(^^;)
これについては当館の次のページを参考にしてください。
○玄関>雑学の部屋>雑学コーナー>統計学入門
→11.2 生存率の比較方法
http://www.snap-tck.com/room04/c01/stat/stat11/stat1102.html

>> 11.6 パラメトリック生命表解析 を読み進めていくと
>> (4) パラメトリック多変量生命表解析 の部分で
>> "指数分布モデルの結果と比例ハザードモデルの結果はよく似ていることがわかると思います"
>> とありますが 時間を用いないで 順番の用いているだけの比例ハザードモデルと 似た結果が得られるのかがわからないです
この場合は観測時間が等間隔に近く、実際の時間を使った累積生存率曲線と、時間間隔を「1」にした時の累積生存率曲線が似ています。そのためパラメトリックモデルの結果と比例ハザードモデルの結果が似ているのです。観測時間が等間隔ではない時は、両者の結果は異なります。

>> セミパラメトリックモデルの "結果がデータに左右されやすくて普遍性がなく、理論的な取り扱いが困難で、実際のデータよりも先を外挿によって予測することはできません。"
>> という記述は データ量が十分にある場合は セミパラメトリックでも問題ないのでしょうか?
次の点で大いに問題があります。
1.観測時間が等間隔ではない時はパラメトリックモデルの結果とセミパラメトリックモデルの結果は食い違い、当然、パラメトリックモデルの結果の方が正確である。
2.セミパラメトリックモデルは観測時間を順位データにして分析しているので、生存率の外挿ができないだけでなく、観測期間を指定した時の生存率の内挿もできない。生存率を内挿で求められるのは、観測順序を指定した時の生存率だけである。

前の質問の回答とこの質問の回答は、1895番で紹介した「図11.6.1 指数分布モデルによる理論的生存率関数」と「図11.6.2 時間間隔を1にした時の理論的生存率関数」の説明を読めばわかると思います。再度、このあたりの説明をじっくりと読んでみてください。(^_-)
○玄関>雑学の部屋>雑学コーナー>統計学入門
→11.6 パラメトリック生命表解析
http://www.snap-tck.com/room04/c01/stat/stat11/stat1106.html

1899. 多変量セミパラメトリックモデルと パラメトリックモデルについて 投稿者:生存時間解析の初心者 投稿日:2022/11/09 (Wed) 15:03:17 [返信] [削除]
先程に続いて質問です.
11.6 パラメトリック生命表解析 を読み進めていくと
(4) パラメトリック多変量生命表解析 の部分で
"指数分布モデルの結果と比例ハザードモデルの結果はよく似ていることがわかると思います"

とありますが 時間を用いないで 順番の用いているだけの比例ハザードモデルと 似た結果が得られるのかがわからないです

同じ結果がでるなら 比例ハザードでも評価しても良いように感じます

セミパラメトリックモデルの "結果がデータに左右されやすくて普遍性がなく、理論的な取り扱いが困難で、実際のデータよりも先を外挿によって予測することはできません。"

という記述は データ量が十分にある場合は セミパラメトリックでも問題ないのでしょうか?

1898. Re[1895]:[1894]:比例ハザードモデル の評価について 投稿者:生存時間解析の初心者 投稿日:2022/11/09 (Wed) 12:54:29 [返信] [削除]
杉本さん 、わかりやすい解説ありがとうございます。
Cox比例ハザードを用いた文献やサイトが多く、生存日数で評価できるものと勘違いしそうになりました...
あくまで差を示すものなのですね

多変量パラメトリックモデルで 生存時間で評価するためのモデルを作成しようと考えていますが, なにか R,Python で行えるパッケージはありますでしょうか?
Cox回帰モデルはすぐに見つかったのですが...

Pythonのlifeline パッケージでワイブル多変量は見つけたのですが

https://lifelines.readthedocs.io/en/latest/fitters/regression/WeibullAFTFitter.html

読み進めていると 比例ハザードの仮定の検定を行っており,
パラメトリック・ハザード比検定ではないのか???
実はパラメトリックモデルではない??と疑問に感じました

何かご存知でしたらご教授いただけると幸いです


1897. Re[1896]:[1893]:ICCの必要例数について 投稿者:北の大学院生 投稿日:2022/11/09 (Wed) 12:23:00 [返信] [削除]
杉本様、いつも大変お世話になっています。
丁寧なご説明ありがとうございます。

1892番で紹介した(注1)は観測回数を求める計算式、必要例数の計算式方法(注2)をサンプルデータなどで計算して十分に理解を深めたいと思います。

日々勉強になります。
今後ともよろしくお願いいたします。

1896. Re[1893]:ICCの必要例数について 投稿者:杉本典夫 [URL] 投稿日:2022/11/09 (Wed) 11:41:00 [返信] [削除]
>北の大学院生さん
>> EZRでICC.Sample.Sizeにて
>> calculateIccPower: Function to calculate post-hoc power for ICC studies
>> calculateIccSampleSize:Function to calculate sample size required for studies where ICC is primary outcome.
>> の2つを計算しようかと考えています。
上の関数はICCの検定に基づいた検出力と必要例数を計算します。それに対して僕のサイトに書いた必要例数は、ICCの信頼区間に基づいた必要例数を計算します。そのため両者の必要例数は一致するとは限らないので注意してください。
実際問題として、ICCは検定を行うよりも、信頼区間を求めてICCの精度を評価する方が多いと思います。そのため僕のサイトでは信頼区間に基づいた必要例数の計算方法を説明しています。

なお1892番で紹介した(注1)は観測回数を求める計算式を紹介したものであり、必要例数の計算式方法(注2)で説明してあります。この計算方法は僕が考案したものなので、Rはまだサポートしていないと思います。(^_-)
○玄関>雑学の部屋>雑学コーナー>統計学入門
→5.4 級内相関係数と一致係数 (注2)
http://www.snap-tck.com/room04/c01/stat/stat05/stat0504.html#note02

1895. Re[1894]:比例ハザードモデル の評価について 投稿者:杉本典夫 [URL] 投稿日:2022/11/09 (Wed) 09:06:18 [返信] [削除]
>生存時間解析の初心者さん
初めまして、当館の館長を務めている”とものり”こと杉本と申します。当館の「統計学入門」を読んでいただき、ありがとうございます。m(_ _)m

>> 11章の4節にて C統計量の説明がありましたが、
>> セミパラメトリックの評価に用いられる C統計量は
>> あくまで 
>> モデルから予測される生存時間と実際の生存時間の順序が一致している程度を表しているのであり、
>> 導き出される生存曲線のグラフの生存日数は何も意味を成さないのでしょうか?
Kaplan-Meier法によって求めた累積生存率曲線は、生存時間を用いて計算したパラメトリックなグラフです。そのため累積生存率曲線の生存日数には意味があります。
しかし2群の生存率を比較する手法であるCox-Mantel検定や一般化ウィルコクソンの2標本検定やログランク検定やC-統計量は、生存日数データを生存順序データにしてから計算します。そのため、それに対応する累積生存率曲線はKaplan-Meier法によって求めた累積生存率曲線ではなく、時間間隔を「1」にした累積生存率曲線です。
このことはあまり知られていないので、医学分野ではKaplan-Meier法によって求めたパラメトリックな累積生存率曲線に、ノンパラメトリック手法であるCox-Mantel検定や一般化ウィルコクソンの2標本検定やログランク検定の結果とC-統計量を付記したりします。これは平均値や中央値のグラフに、順位平均値の検定手法であるノンパラメトリックな順位和検定の結果を付記するのと同様の間違いです。
Kaplan-Meier法によって求めたパラメトリックな累積生存率曲線に付記すべきなのは、本来はパラメトリック生存時間解析の結果です。

>> またできない場合
>> パラメトリックモデルだと 可能になるのでしょうか?
パラメトリックモデルは観測期間をそのまま用いて解析しているので可能です。
そのことを表すグラフを「統計学入門」の次のページで説明しているので参考にしください。(^_-)

○玄関>雑学の部屋>雑学コーナー>統計学入門
→11.6 パラメトリック生命表解析
http://www.snap-tck.com/room04/c01/stat/stat11/stat1106.html
※「図11.6.1 指数分布モデルによる理論的生存率関数」と「図11.6.2 時間間隔を1にした時の理論的生存率関数」が参考になると思います。
図11.6.1のようなグラフを描いたのなら、パラメトリック生存時間解析の結果を付記すべきであり、セミパラメトリック生存時間解析の結果は、本来は図11.6.2のようなグラフに付記すべきです。

1894. 比例ハザードモデル の評価について 投稿者:生存時間解析の初心者 投稿日:2022/11/08 (Tue) 23:54:15 [返信] [削除]
初めまして、最近生存時間解析を学んでいるものです。
統計の基礎を含めて学ばさせていただいています。

質問ですが
11章の4節にて C統計量の説明がありましたが、
セミパラメトリックの評価に用いられる C統計量は
あくまで 
モデルから予測される生存時間と実際の生存時間の順序が一致している程度を表しているのであり、
導き出される生存曲線のグラフの生存日数は何も意味を成さないのでしょうか?

例えば2郡の 生存曲線を描いた際に 2郡で曲線に差があった場合
C統計量を0.9 として
例として 累積生存確率50% で切った際の 生存日数で
AよりもBの方が 何日 生き延びやすい
または
A は 累積生存確率50% で切ると 何日ごろに 亡くなるであろう
といった
生存日数を 用いた評価は不適切でしょうか?


またできない場合
パラメトリックモデルだと 可能になるのでしょうか?

理解が乏しく冗長的な質問になってしまいましたが、

ご教授いただけると幸いです

1893. Re[1892]:[1891]:痛みの新規評価尺度の導入 投稿者:北の大学院生 投稿日:2022/11/08 (Tue) 12:29:00 [返信] [削除]
杉本様、丁寧なご回答を誠にありがとうございます。

級内相関係数に統一します。
EZRでICC.Sample.Sizeにて
calculateIccPower: Function to calculate post-hoc power for ICC studies

calculateIccSampleSize:Function to calculate sample size required for studies where ICC is primary outcome.

の2つを計算しようかと考えています。
References
Zou, G. Y. (2012). Sample size formulas for estimating intraclass correlation coefficients with
precision and assurance. Statistics in medicine, 31(29), 3972-3981.

>※必要例数と観測回数を求める計算式は(注1)に記載してあります。
http://www.snap-tck.com/room04/c01/stat/stat05/stat0504.html#note01
じっくりと読んでサンプルデータなどで使用できるように学ばさせていただきます。

このパイロット試験で信頼性とある程度の妥当性を確認出来たら、マクギル疼痛質問票を用いて評価を行いより多くの患者さん(クライアント)に記入していただき、専門家複数人で痛みを測れているか確認をしていただこうと考えています。

NRSで評価をみると評価は様々な痛みの合計点の方と平均点の方がいるため、一概にNRSが高いから痛みの強度が強いまた、NRSが低いから痛みが低いわけではないことが推察されました。

いつもいつも本当にありがとうございます。
今後ともよろしくお願いいたします。

1892. Re[1891]:痛みの新規評価尺度の導入 投稿者:杉本典夫 [URL] 投稿日:2022/11/08 (Tue) 08:39:06 [返信] [削除]
>北の大学院生さん
>> 痛みの研究で新規評価尺度としてマクギル疼痛質問票の導入を検討しています。
>> 内的整合性に関して、クロンバックのα係数
>> 信頼性として、診察はじめと終わりで2回問診表を記入してもらい級内相関係数またはケンドールの一致係数W
>> 妥当性としてNRSとピアソンの相関係数、サプリメントとして仮説を変えた場合のスペアマンの相関係数
>> 上記の3つをパイロット試験として50人程度サンプリングしその中の20人程度を信頼性のサンプリングとしようと思います。
基本的には上記の方針で良いと思います。ただしクロンバックのα係数は級内相関係数ICC(3,1)と同じものです。そのため級内相関係数に統一した方がわかりやすと思います。
それから級内相関係数や相関係数の値の信頼性を確保するための必要例数と、観測回数を求める計算式もあります。パイロット試験なら必要例数と観測回数を厳密に求める必要はないと思いますが、そのような計算式があることは知っておいた方が良いと思います。

詳しいことは、当館の次のページを御覧ください。(^_-)
○玄関>雑学の部屋>雑学コーナー>統計学入門
→5.4 級内相関係数と一致係数
http://www.snap-tck.com/room04/c01/stat/stat05/stat0504.html

※必要例数と観測回数を求める計算式は(注1)に記載してあります。
http://www.snap-tck.com/room04/c01/stat/stat05/stat0504.html#note01

1891. 痛みの新規評価尺度の導入 投稿者:北の大学院生 投稿日:2022/11/07 (Mon) 11:29:30 [返信] [削除]
杉本様、いつも大変お世話になっています。

痛みの研究で新規評価尺度としてマクギル疼痛質問票の導入を検討しています。

内的整合性に関して、クロンバックのα係数

信頼性として、診察はじめと終わりで2回問診表を記入してもらい級内相関係数またはケンドールの一致係数W

妥当性としてNRSとピアソンの相関係数、サプリメントとして仮説を変えた場合のスペアマンの相関係数

上記の3つをパイロット試験として50人程度サンプリングしその中の20人程度を信頼性のサンプリングとしようと思います。
やる内容としてもし、間違っていたり、より適切な方法がございましたら、ご教授お願いいたします。

下位尺度として、一般的に3つに分類できるのですが、それぞれの相関が強く解析などは適さないと思いできるだけシンプルな考えで解析ができるようにしたいと考えています。
よろしくお願いいたします。

1890. Re[1889]:[1888]:統計学の理解について 投稿者:上条あかね 投稿日:2022/11/07 (Mon) 10:06:13 [返信] [削除]
>近似的な統計学に、純粋数学の理論を無理やり当てはめて
奇しくもこれは私が逆に統計学における数学の用いられ方を見て抱いた印象と同じであり,今回の質問の幾つかは,統計学では(恐らくは定式化できない)諸概念と(定義のある)数学の諸概念とを対応させ利用していることについての識者のご所見を伺う為のものでした.お時間をいただきましたこと,お礼申し上げます.

1889. Re[1888]:統計学の理解について 投稿者:杉本典夫 [URL] 投稿日:2022/11/07 (Mon) 09:03:32 [返信] [削除]
>上条あかね様
統計学は純粋数学ではなく、現実の現象を数学的なモデルで近似的に分析するための実用的な応用数学または「数学応用学」です。色々な疑問点は、そのような近似的な統計学に、純粋数学の理論を無理やり当てはめて理解しようとするところにあると思います。
例えば物理学では、有名な「e=m・c2乗」という式のように、純粋数学の数式を現実的な近似式にして理論を構築することがよくあります。その理論に対して「正確な数式を使わず、近似式にしている理由がわからない!」という疑問を抱くと、物理学を理解することは難しいと思います。
それと同様に、統計学に純粋数学の概念を無理矢理当てはめて理解しようとすると、統計学を理解するのは難しいと思います。統計学の原理をしっかりと理解すれば、色々な疑問は自ずと解消すると思います。そのため、まずは数理統計学の解説書をじっくりと読むことをお勧めします。
もし数理統計学の解説書をじっくりと読んでも疑問が解消しなかったら、残念ながら思考方法が統計学には向いていないと諦めてください。(^^;)

1888. Re[1887]:[1886]:統計学の基礎について 投稿者:上条あかね 投稿日:2022/11/07 (Mon) 07:48:15 [返信] [削除]
お手数をお掛けしております.

>過去の書き込みをもう一度じっくりと読んでください。
>> と表現する.
ことがネイマン・ピアソン統計学と相容れない旨は読み取れているのですが,ご案内いただいたネイマン・ピアソン統計学における諸概念,例えば「無限個存在する集団」「無限回無作為抽出して」などの定義(定式化)が分からず難渋しております.(数学には加算無限個の確率空間の直積はありますが...)

>ネイマン・ピアソン統計学全般の誤解
>例えば「基礎統計学I 統計学入門」
入手までの間,他の点をお尋ねしたく思います.

それは中心極限定理 lim p(n)=∫ による近似,すなわち,p(n) の代わりに ∫ を用いる際の n の範囲です.一般に実数の近似には誤差(絶対誤差)e の指定が必要であり,例えば「|p(n)-∫|≦e となるためには n は~以上」といった主張となるべきところ,よく見かけるのは「偏り(分散)が小さければ n は 30 以上」といった主張であり,誤差の指定がなく,得られた値がどこまで正しいのかが分かりません.これはどういうことなのでしょうか?

※ lim p(n)=∫ の証明が |p(n)-∫|≦C×n^{d}(C は母数と確率変数のみに依存する定数,d は負の定数)といった評価を用いるものであれば論はないのですが,よく見かける積分変換の対応を用いて極限値の相等を得る方法(御サイトでもご紹介の方法)では,誤差の評価が難しいように見えます.

1887. Re[1886]:統計学の基礎について 投稿者:杉本典夫 [URL] 投稿日:2022/11/06 (Sun) 16:32:58 [返信] [削除]
>上条あかね様
>> そして,この ①,② をそれぞれ
>> 「(1) のような標本平均から信頼区間を 1 回作るとき,それが母平均を含むものである確率は p である」,
>> 「(1) のような標本平均から信頼区間を N 回作るとき,そのうち母平均を含むものの個数の期待値は N×p である」
>> と表現する.
>> というのはまずいのでしょうか?
何度も説明しているように、僕はあまりマズイとは思いません。しかしネイマン・ピアソン統計学派の人は「マズイ!」というと思いますよ。(^^;)
その理由はこれまで何度も説明しているので、過去の書き込みをもう一度じっくりと読んでください。

>>大数の法則を用いて「頻度論的な確率」を定義するということでしょうか?
>> 大数の法則(弱,強のどちらにせよ)は幾許かの条件を満たす確率空間,確率変数列についての主張であり,
>> それらの構成には既に確率測度(「確率」を像とする写像)が含まれていますので,
>> その「確率」を用いて「頻度論的な確率」を定義することになりそうですが...
これも何度も説明しているように、このあたりの誤解がネイマン・ピアソン統計学全般の誤解の元になっていると思います。
これについては数理統計学の解説書をじっくりと読まれることをお勧めします。例えば「基礎統計学I 統計学入門」(東京大学教養学部統計学教室編、東京大学出版会、1991年)等をお勧めします。そしてこの本に書かれた内容について疑問点があったら、この本の編者である松原望先生に質問してみてください。(^_-)

1886. Re[1875]:[1874]:統計量と中心極限定理について 投稿者:上条あかね 投稿日:2022/11/05 (Sat) 22:25:55 [返信] [削除]
引き続き有難う御座います.

>1875.
>成り立ちます

であるなら,1874. の (1) の設定の下で

CI(ω):=[X(ω)-c×σ/√{n},X(ω)+c×σ/√{n}] (ω∈Ω) とし,Y:Ω→{0,1} を {ω∈Ω|μ∈CI(ω)} の定義関数とすると,任意の ω∈Ω について,Y(ω)=1 ⇔ μ∈CI(ω) であり,(1) の等式 P({ω∈Ω|μ∈CI(ω)})=p により,Y は B(1,p) に従う.……①

① を (2) に適用すれば,任意の (ω_{1},...,ω_{N})∈Ω^{N} について,S_{N}(ω_{1},...,ω_{N})=#{i∈{1,...,N}|μ∈CI(ω_{i})} であり,(2-1) により,S_{N} の期待値は N×p である.……②

そして,この ①,② をそれぞれ
「(1) のような標本平均から信頼区間を 1 回作るとき,それが母平均を含むものである確率は p である」,
「(1) のような標本平均から信頼区間を N 回作るとき,そのうち母平均を含むものの個数の期待値は N×p である」
と表現する.

というのはまずいのでしょうか?

>1872.
>ネイマン・ピアソン統計学は結果の確率に基づいた統計学です。そして結果の確率は大数の法則に基づいた頻度論的な確率です。つまり試行回数を限りなく増やした時の事象の頻度の極限値を、その事象の確率と定義する考え方です。

大数の法則を用いて「頻度論的な確率」を定義するということでしょうか?大数の法則(弱,強のどちらにせよ)は幾許かの条件を満たす確率空間,確率変数列についての主張であり,それらの構成には既に確率測度(「確率」を像とする写像)が含まれていますので,その「確率」を用いて「頻度論的な確率」を定義することになりそうですが...

1885. Re[1884]:[1883]:解析について 投稿者:北の大学院生 投稿日:2022/11/02 (Wed) 14:53:15 [返信] [削除]
今回も丁寧なご回答を、誠にありがとうございます。

1に関しては、私のフィールドの教科書的にはVASが20mm以上で有意とされることが多く、分類を対称的にした方が良いと思うので、今後より良い評価方法を考えます。

2に関して
ものごとを単純に考えていました。重相関分析を行います。

3に関して
もとの分布はおそらくかなり偏っているので、50例程度集めてから重相関分析を行います。

また、色々なことを相談させていただくことがあると思います。本当にありがとうございます。今後ともよろしくお願いいたします。

1884. Re[1883]:解析について 投稿者:杉本典夫 [URL] 投稿日:2022/11/02 (Wed) 14:04:13 [返信] [削除]
>北の大学院生さん
>> (1)自覚症状のVAS の改善率が100%改善した症例を治癒群, 99〜50%まで改善した症例を改善群,49〜1 %まで改善を軽快群, 変化がない症例を不変群,
>> 悪化例を悪化群と定義するとこの分類はVAS高値にはある程度良いかと思いますが、VAS低値は誤差の範囲内であると思います。
>> この分類は妥当性はありますか?
妥当かどうかは統計学的に判断するのではなく、医学的に判断すべきです。
統計学的に見ると、改善が3段階で悪化が1段階というのは改善と悪化が非対称なのであまり好ましくありません。しかし自覚症状のVASの性質上、これは致し方ないかもしれませんね。

>> (2)マクギル疼痛質問票を用いて、22項目のグループごとに3つの合計点を求めて「下位尺度」として評価項目にしたのですが、
>> これとNRSの相関を調べるときは4つのものとの相関のため偏相関係数が良いでしょうか?
>> 相関係数とスペアマンの相関関係を出して感度分析を行ったほうが良いでしょうか?
本来、下位尺度は因子分析による因子スコアですから、因子軸を斜交回転していなければお互いに無相関になります。そのため偏相関係数も単相関係数も同じ値になります。
しかし実際には因子スコアを用いることは稀なので、お互いに無相関とは限りません。そのため重相関分析を行い、重相関係数と偏相関係数を求める必要があります。
また順位相関係数は順序尺度のデータの相関係数ですから、偏相関係数も重相関係数も存在しません。偏相関係数や重相関係数は複数の計量尺度項目の間の線形な関数関係に基づいた指標です。順序尺度のデータは順序だけは付けられるものの、計量的な四則演算はできないことが特徴です。そのため線形な関数関係に基づいた偏相関係数や重相関係数は存在しないのです。したがって単相関係数と単順位相関係数の感度分析なら可能ですが、偏相関係数や重相関係数の感度分析は不可能です。

>> (3)2に関してですが、各変量1つにつき10例程度(4つの関係なので40例以上程度)で中心極限定理が成り立つと解釈してよいでしょうか?
これは、元のデータが度正規分布にどの程度近似しているかで異なります。僕が行ったシミュレーションの結果では、元のデータが左右対称なら10例程度でも中心極限定理が成り立ちます。しかし対数正規分布のように、元のデータが極端に歪んでいると中心極限定理が成り立つためには50例以上は必要です。

1883. 解析について 投稿者:北の大学院生 投稿日:2022/11/02 (Wed) 08:43:51 [返信] [削除]
杉本様、いつも大変お世話になっています。

昨日1年分のデータ抽出が終わり、例数は314でした。はじめは400例を目指していましたが、おそらく後半年分のデータを見なければいけなく、疲れてしまったので、これで論文にしようと思います。共分散分析などを教えていただき誠にありがとうございました。

決定樹はEZRで簡単にできましたが、普遍性がなく、やはり判別分析のやり方も含めて貴Webページから学ばせていただこうと思います。

さて、アナログスケールなどに関して再び質問があります。

(1)自覚症状のVAS の改善率が100%改善した症例を治癒群, 99〜50%まで改善した症例を改善群,49〜1 %まで改善を軽快群, 変化がない症例を不変群, 悪化例を悪化群と定義するとこの分類はVAS高値にはある程度良いかと思いますが、VAS低値は誤差の範囲内であると思います。
この分類は妥当性はありますか?

(2)マクギル疼痛質問票を用いて、22項目のグループごとに3つの合計点を求めて「下位尺度」として評価項目にしたのですが、これとNRSの相関を調べるときは4つのものとの相関のため偏相関係数が良いでしょうか?
相関係数とスペアマンの相関関係を出して感度分析を行ったほうが良いでしょうか?

(3)2に関してですが、各変量1つにつき10例程度(4つの関係なので40例以上程度)で中心極限定理が成り立つと解釈してよいでしょうか?

ご教授お願いいたします。

1882. Re[1875]:[1874]:統計量と中心極限定理について 投稿者:上条あかね 投稿日:2022/11/01 (Tue) 22:51:01 [返信] [削除]
引き続き有難う御座います.

>現実のデータに理想化した数学モデルを近似的に当てはめ、確率論に従って理論解を求めて、それを現実の現象に逆近似して結果を解釈

私の一連の質問はこのサンドイッチ構造の境界の様子を知るためのものであり,まだまだ項目はあるのですが,続きは次週以降にお願いしようと思います.何卒ご了承ください.

1881. Re[1880]:[1879]:共分散分析の結果について 投稿者:北の大学院生 投稿日:2022/11/01 (Tue) 15:56:15 [返信] [削除]
杉本様、いつも丁寧なご回答を誠にありがとうございます。

判別分析はEZRで簡単に出来そうもないため、今回(おそらく最後かもしれませんが)は年齢による影響と性別の影響を主軸に論文化しようと思います。

(このデータで実際に年齢のオッズ比は1.03程度しかなく、やはりいろいろな因子が複雑に関与している中で加齢が微妙に影響していることを再確認したという意味でしかないので、)サブ的なものとして、ロジスティック回帰分析で採血データの影響も考慮したオッズ比も出そうと思います。
簡単に改善できるものが大きな影響を与えていれば簡単に改善できますが、現実は少しの影響の足し算が多いように思われます。
コンプリートデータが減ってしまうため、400人程度は集めようと思いカルテを見ています。普遍性はないですが一応の目安として、決定樹も出してみようかと考えています。

私も医学界の検定偏重&p値崇拝主義を何とかして是正したい気持ちもありますが、p値(🍑)好きな先生は多いと思います。
また、p値(🍑)好きな先生はnot significantを何の根拠もなくno significantと結論付けているものも多く、tが頻繁に脱落すると感じています。非有意=同等と考えているとも思われます。

専門家の意見は非常にありがたいです。
今後ともよろしくお願いいたします。

1880. Re[1879]:共分散分析の結果について 投稿者:杉本典夫 [URL] 投稿日:2022/11/01 (Tue) 15:15:29 [返信] [削除]
>北の大学院生さん
>> これで交互作用はなく、性別ではなく年齢がTEST結果に影響すると解釈してよいのでしょうか?
解釈して良いと思います。性別と年齢の間に交互作用はほとんど無いので、年齢で補正した性の影響は小さく、性別で補正した年齢の影響は大きいと考えられます。

>> これを示せればいくつかの論文の報告はおそらくサンプル集団で性別に偏りが生じたことで性差が影響するという結果が導かれたことを示唆できそうです。
共分散分析は意外と知られていないので、この手法を適用すべき場面で層別解析を行っている論文が多いように思います。しかも推定結果ではなく有意確率p値で結果を評価しているので、非科学的な結論を導いてしまっている論文も多いように思います。
僕は検定廃止論者なので、医学界の検定偏重&p値崇拝主義を何とかして是正したいですね。
ちなみにネイマンとピアソンは、Fisherの有意性検定を否定し、区間推定を中心にしてネイマン・ピアソン統計学を構築したのであり、彼等自身は統計的仮説検定はほとんど用いませんでした。そのため彼等の弟子の統計学者達はほとんどが検定廃止論者ですよ。(^_-)

1879. Re[1877]:[1876]:ロジスティック回帰分析について 投稿者:北の大学院生 投稿日:2022/11/01 (Tue) 13:41:31 [返信] [削除]
杉本様、いつも大変お世話になっています。

EZRで共分散分析をやってみました。
群別変数と共変数の交互作用のP値は 0.787

Anova Table (Type III tests)

Response: TEST
Sum Sq Df F value Pr(>F)
(Intercept) 0.123 1 0.6344 0.426382
factor(sex) 0.125 1 0.6470 0.421843
age 2.090 1 10.8054 0.001135 **
Residuals 56.682 293

また、年齢×性別のロジスティック回帰分析の係数はほとんど1に等しくなりました。
       オッズ比 95%信頼区間下限 95%信頼区間上限 P値
(Intercept) 0.351 0.263 0.47    1.56e-12
age*sex 1.010 0.996 1.01    2.92e-01

これで交互作用はなく、性別ではなく年齢がTEST結果に影響すると解釈してよいのでしょうか?

これを示せればいくつかの論文の報告はおそらくサンプル集団で性別に偏りが生じたことで性差が影響するという結果が導かれたことを示唆できそうです。

少しずつ勉強させていただきます。
今後ともよろしくお願いいたします。

1878. Re[1877]:[1876]:ロジスティック回帰分析について 投稿者:北の大学院生 投稿日:2022/11/01 (Tue) 10:55:46 [返信] [削除]
今回も丁寧な、ご回答を誠にありがとうございます。

(1)やはり統計学入門者には、まだまだ学習不足の内容が多いため貴Webページでじっくり学ばせていただきます。おそらく、現在の私は初歩の初歩しか解析などできていないと思っています。実際は全くできていない可能性も否定できないですが、……たくさん学ばせていただきます。

(2)(3)の変数の選択ですが本当に医学的にも意味のあるものの選択は難しいと感じます。ダミーのIDを好きに作った場合、たまたま判別能力が高いというシミュレーション結果も自分で確認したことがあるので、特に例数が少ない場合は、より慎重に行いたいと思います。

(4)境界値の設定が恣意的でどうもうまくp値をコントロールしたように感じてしまいます。連続量を2分類データにして情報を落としてしまうのは実にもったいないと思うのは、同意見です。

(5)判別分析かクラスター分析の学習をしてやってみます。
できなかったら、臨床家に好まれやすい決定樹で妥協しようかと思います。

今後も、色々と質問させていただくことが多くあると思いますが、よろしくお願い申し上げます。

1877. Re[1876]:ロジスティック回帰分析について 投稿者:杉本典夫 [URL] 投稿日:2022/11/01 (Tue) 10:25:12 [返信] [削除]
>北の大学院生さん
こんちにわ、御質問にお答えします。
>> (1)説明変数なのですが、採血のコンプリートデータがあまり多くないため解析は性別を層別したもので年齢を説明変数としたモデルで評価して、
>> おそらく性差がない疾患のため、結果は層別でほとんど一致するため、そのあとで性別を合わせて年齢だけの単変量解析を行う予定です。
>> これら3つすべての結果を公表予定です。
>> これは、一般的に行ってもよいことでしょうか?
医学分野ではしばしば行われますが、統計学的にはもっと合理的な方法があります。
多変量解析は連続量による計量的な層別解析に相当します。そのため普通は性別も「0:男 1:女」というダミー変数にして説明変数に入れます。
そして目的変数に関して性と年齢の間に交互作用――目的変数と年齢の関係(回帰係数の値)が男と女で異なる現象――があれば、性と年齢をかけ合わせた項目を交互作用項目として説明変数に入れます。この交互作用項目の偏回帰係数が0に近ければ交互作用はなく、正で絶対値が大きな値なら正の交互作用(男よりも女の方が年齢の影響が強い)があり、負で絶対値が大きな値なら負の交互作用(男よりも女の方が年齢の影響が弱い)があると考えられます。
これをもっと効率的に行う解析手法が共分散分析です。共分散分析については、当館の次のページを参考にしてください。
○玄関>雑学の部屋>雑学コーナー>統計学入門
→第8章 共分散分析
http://www.snap-tck.com/room04/c01/stat/stat08/stat0801.html

>> (2)Hosmer and Lemeshow goodness of fit (GOF) testを行う予定ですが、これはやはり、p値が小さければモデル適合が悪いと解釈して、
>> そのp値自体もばらつきはありますが、例数が同じ場合は、p値の大きさでモデルの適合を判定してよいのでしょうか。
>> または、ネイマン・ピアソン統計学のように、決めた値(5%や20%など)との大小関係だけを見るものなのでしょうか?
モデルの適合度を検討するには、Hosmer-Lemeshow検定よりもデビアンス(deviance)Dを使った方が良いと思います。
またp値は検定統計量が帰無仮説の棄却域に入っているかどうかを判定するための便宜的な値であり、値そのものには具体的なあまり意義はありません。モデルとの適合度を検討するには、検定結果よりも評価指標であるデビアンスDの値そのものを検討した方が合理的ですし、平均値の差の検定などでは平均値の差の値と、その区間推定値(95%信頼区間等)を検討した方が合理的です。
Hosmer-Lemeshow検定とデビアンスについては、次のページを参考にしてください。
→10.3 ロジスティック回帰分析の計算方法 (注2)
http://www.snap-tck.com/room04/c01/stat/stat10/stat1003.html#note02
またp値の意義と検定と推定と科学的解釈については、次のページを参考にしてください。
→1.5 有意性検定の考え方 (6)有意確率の意味
http://www.snap-tck.com/room04/c01/stat/stat01/stat0105.html
→1.7 ハンディキャップ方式の検定 (1)推定と検定の関係
http://www.snap-tck.com/room04/c01/stat/stat01/stat0107.html
※「図1.7.1 検定結果と信頼区間」とその下の表が参考になると思います。

>> (3)採血も含めるとコンプリートデータは7割くらいに減るため、10pのルールなどで理論上7個程度ならば説明変数を投入可能ですが、
>> 単純なモデルのほうが良いため、患者背景で標準化差が大きいものから投入を予定しています。
>> また、既存のリスク因子も選ぶ予定です。
>> 統計学的にはいくつくらいまで入れるとよいでしょうか?
>> 説明変数の選択が非常に難しいです。
統計学的には、多変量解析の結果の信頼性を確保するためには説明変数の数はやはり例数の1/5〜1/10程度です。
そして説明変数の選択は、統計学的な判断よりも医学的な判断に基づく方が妥当です。
参考になるかどうかわかりませんが、変数選択法のシミュレーションをした結果が次のページにありますよ。
→7.3 変数の選択 (注2)
http://www.snap-tck.com/room04/c01/stat/stat07/stat0703.html#note02

>> (4)論文でたまに見かけるのですが、例えば年齢を平均値や中央値を境に高齢と若年で分けて説明変数とすること(2値データへの変換)はp-ハッキングにあたるのでしょうか?
これは医学分野でよく行われることですが、原則としてやってはいけません。p-ハッキングの問題よりも、連続量を2分類データにして情報を落としてしまうのは実にもったいないです。また境界値の設定が恣意的になる上に、データによって変化します。それでは客観的かつ普遍的な結果は得られません。

>> (5)機械学習の決定樹は探索的で一番単純になるものを示そうと思っています。おそらく因子は2個程度になりそうです。
>> これは、探索的な研究のため結果を見て一番単純なもの(解釈しやすいもの)を選んでよいのでしょうか?
>> もちろん別のデータセットなどで検証が必要なことは十分に承知しています。
機械学習は理論的にはノンパラメトリックな多変量解析に相当します。そのため普遍性がないので、僕はおまりお勧めしません。それよりも普遍性があるパラメトリックな多変量解析をお勧めします。機械学習の決定樹よりも判別分析かクラスター分析の方が普遍性があります。
多変量解析の種類と概論については、次のページを参考にしてください。
→6.3 多変量解析の分類
http://www.snap-tck.com/room04/c01/stat/stat06/stat0603.html

以上、参考になれば幸いです。(^_-)

1876. ロジスティック回帰分析について 投稿者:北の大学院生 投稿日:2022/10/31 (Mon) 16:19:12 [返信] [削除]
杉本様、いつも大変お世話になっています。

最近、カルテからデータを抽出して、探索的なロジスティック回帰分析を行おうとしています。最終的には機械学習の決定樹によって分類も行う予定です。
全例数で400程度、大体7.5:2.5くらいに分かれる(300:100)ものに関してです。
そこで、お聞きしたいことがあります。

(1)説明変数なのですが、採血のコンプリートデータがあまり多くないため解析は性別を層別したもので年齢を説明変数としたモデルで評価して、おそらく性差がない疾患のため、結果は層別でほとんど一致するため、そのあとで性別を合わせて年齢だけの単変量解析を行う予定です。これら3つすべての結果を公表予定です。
これは、一般的に行ってもよいことでしょうか?

(2)Hosmer and Lemeshow goodness of fit (GOF) testを行う予定ですが、これはやはり、p値が小さければモデル適合が悪いと解釈して、そのp値自体もばらつきはありますが、例数が同じ場合は、p値の大きさでモデルの適合を判定してよいのでしょうか。または、ネイマン・ピアソン統計学のように、決めた値(5%や20%など)との大小関係だけを見るものなのでしょうか?

(3)採血も含めるとコンプリートデータは7割くらいに減るため、10pのルールなどで理論上7個程度ならば説明変数を投入可能ですが、単純なモデルのほうが良いため、患者背景で標準化差が大きいものから投入を予定しています。また、既存のリスク因子も選ぶ予定です。
統計学的にはいくつくらいまで入れるとよいでしょうか?
説明変数の選択が非常に難しいです。

(4)論文でたまに見かけるのですが、例えば年齢を平均値や中央値を境に高齢と若年で分けて説明変数とすること(2値データへの変換)はp-ハッキングにあたるのでしょうか?

(5)
機械学習の決定樹は探索的で一番単純になるものを示そうと思っています。おそらく因子は2個程度になりそうです。これは、探索的な研究のため結果を見て一番単純なもの(解釈しやすいもの)を選んでよいのでしょうか?
もちろん別のデータセットなどで検証が必要なことは十分に承知しています。

統計量と中心極限定理についてなどの一連の流れを割ってしまい大変申し訳ございませんが、ご教授お願いいたします。

1875. Re[1874]:統計量と中心極限定理について 投稿者:杉本典夫 [URL] 投稿日:2022/10/31 (Mon) 14:27:00 [返信] [削除]
>上条あかね様
>> (1) X が平均 μ,標準偏差 σ の正規母集団から無作為抽出した大きさ n の標本の平均,つまり,確率空間 (Ω,Σ,P) と確率変数 X:Ω→R から誘導される確率測度が N(μ,σ^2/n) のとき,
>> N(0,1) の確率密度関数の [-c,c] 上の積分を p (0<p<1) とすると,P({ω∈Ω||X(ω)-μ|≦c×σ/√{n}})=p が成り立つ.
成り立ちます。そして母集団が正規分布ではなくても、中心極限定理によって2つ目のことが成り立ちます。
中心極限定理については次のページを参考にしてください。
1.3 データの要約方法 (注7)
http://www.snap-tck.com/room04/c01/stat/stat01/stat0103.html#note07

>> (2) B(1,p) (0<p<1) に従う N 個の独立な確率変数の和を S_{N} とおくと
>> (2-1) S_{N} は B(N,p) に従い,その期待値は N×p となる.
>> (2-2) {S_{N}/N}_{N=1}^{∞} は p に概収束する.
これも二項分布の性質と中心極限定理によって成り立ちます。これについては次のページを参考にしてください。
付録1 各種の確率分布 (5) 二項分布(binominal distribution)
http://www.snap-tck.com/room04/c01/stat/stat99/stat9901.html

>> ※ 私は,ミーゼスの頻度説や経験的確率というワードを学生時代に啓蒙書で目にした程度であり,現代の確率論といえば,測度空間から構成される公理的なもので,
>> 統計には母集団,標本集団という用語はあるものの数学にはそれらの確率分布(確率変数から誘導される確率測度)しかなく,標本も同一分布に従う独立な確率変数の列のこととしか見ていませんでしたので,母集団や無作為抽出を実体のある対象と捉え,大数の法則に根ざす立場は新鮮でした.
ネイマン・ピアソン統計学で用いる頻度論的な結果の確率も、ベイズ統計学で用いる主観的な原因の確率も、どちらもコルモゴロフの確率の公理と矛盾せず、公理的確率の条件を一応は満足しています。
でも統計学は現実のデータに適用できなければ無意味なので、現実のデータに理想化した数学モデルを近似的に当てはめ、確率論に従って理論解を求めて、それを現実の現象に逆近似して結果を解釈します。この理想化した数学モデルと近似・逆近似法の違いによって色々な学派があるのです。
その意味で、統計学者はよく「統計学は応用数学ではなく数学応用学だ!」と言いますよ。(^_-)

1874. Re[1873]:[1871]:信頼区間と二項分布について 投稿者:上条あかね 投稿日:2022/10/31 (Mon) 07:29:16 [返信] [削除]
引き続き有難う御座います.

1872.,1873.を拝読して,基本事項ですが幾つか確認させていただきたく思います.

(1) X が平均 μ,標準偏差 σ の正規母集団から無作為抽出した大きさ n の標本の平均,つまり,確率空間 (Ω,Σ,P) と確率変数 X:Ω→R から誘導される確率測度が N(μ,σ^2/n) のとき,N(0,1) の確率密度関数の [-c,c] 上の積分を p (0<p<1) とすると,P({ω∈Ω||X(ω)-μ|≦c×σ/√{n}})=p が成り立つ.

(2) B(1,p) (0<p<1) に従う N 個の独立な確率変数の和を S_{N} とおくと
(2-1) S_{N} は B(N,p) に従い,その期待値は N×p となる.
(2-2) {S_{N}/N}_{N=1}^{∞} は p に概収束する.

これらは正しいでしょうか?

※ 私は,ミーゼスの頻度説や経験的確率というワードを学生時代に啓蒙書で目にした程度であり,現代の確率論といえば,測度空間から構成される公理的なもので,統計には母集団,標本集団という用語はあるものの数学にはそれらの確率分布(確率変数から誘導される確率測度)しかなく,標本も同一分布に従う独立な確率変数の列のこととしか見ていませんでしたので,母集団や無作為抽出を実体のある対象と捉え,大数の法則に根ざす立場は新鮮でした.

1873. Re[1871]:信頼区間と二項分布について 投稿者:杉本典夫 [URL] 投稿日:2022/10/30 (Sun) 11:30:43 [返信] [削除]
>上条あかね様
1872番の返事を書いてから、思い付いたことがあるので少し追加します。(^_-)
二項分布B(100,0.95)の母集団は、「0:失敗 1:成功」という2種類の分類データが0.05:0.95の割合で無限個存在する集団です。これは信頼区間を求めた時の連続量データの母集団N(μ、σ2乗)とは全く違います。そのためこの母集団から無作為抽出した100個の標本集団から95%信頼区間を求めた時、母平均が入っている信頼区間の個数はB(100,0.95)には従わないのです。
しかしこの母集団から標本集団を無限回無作為抽出して95%信頼区間を求め、その信頼区間に母平均が入っていないものは「0:失敗」とし、母平均が入っているものは「1:成功」として、無限個の信頼区間を2種類に分類します。するとそれは「0:失敗 1:成功」という2種類の分類データが0.05:0.95の割合で無限個存在する集団になります。
この2分類データの集団を母集団として、そこから100個のデータを無作為抽出すると、「0:失敗 1:成功」という2種類のデータはB(100,0.95)に従います。これは信頼区間を無限個求めた後で行う操作ですから、N(μ, σ2乗)から100個の信頼区間を求めた時とは別の事柄です。このことから信頼区間の解釈にB(100,0.95)を持ち出すのは不適切であることがわかると思います。
ネイマン・ピアソン統計学におけるB(100,0.95)の成功確率0.95も、当然、頻度的な確率です。そのためこの確率は最初の連続量の母集団N(μ, σ2乗)には当てはめられず、無限個の信頼区間を成功/失敗で2分類にした分類データの母集団に当てはめることになります。
これがネイマン・ピアソン統計学における、頻度論的な確率に基づいた信頼区間の解釈とB(100,0.95)の違いです。(^_-)

1872. Re[1871]:期待値と確率について 投稿者:杉本典夫 [URL] 投稿日:2022/10/30 (Sun) 10:20:46 [返信] [削除]
>上条あかね様
>> この「100回実施したとき、95回程度」を読む度に「"95回程度"って何?」「何回から何回までが "95回程度" なの?」となる訳です.
>> こうした表現は信頼区間に限らず連続分布の一般向けの説明に用いられているようですが,
>> 少なくとも信頼区間の話をする段階では二項分布の期待値は知っている筈なのに,何故そのように述べないのか?と...
ここが誤解の元なのでしょうね。('')(..)('')(..)
ネイマン・ピアソン統計学は結果の確率に基づいた統計学です。そして結果の確率は大数の法則に基づいた頻度論的な確率です。つまり試行回数を限りなく増やした時の事象の頻度の極限値を、その事象の確率と定義する考え方です。したがって「100回実施した時95回程度」という表現は、あくまでも抽象的な頻度論的確率を具体的にわかりすく説明するための例にすぎません。
ネイマン・ピアソン統計学では、95%信頼区間は「母平均が入っている信頼区間を得る頻度論的確率が95%である」と解釈します。これは標本集団を無作為抽出して信頼区間を求めるという操作を無限回繰り返した時の解釈ですから、100回繰り返した時は「100回中95回程度入っている」と近似的に言うしかないのです。したがって厳密に言うと成功回数はB(100,0.95)には従わず、100→∞にした時のt分布に従い、成功回数はt分布における0.05断点以内の積分値0.95つまり成功確率0.95になります。
そもそも二項分布B(n, 0.5)についてn→∞にした時の連続分布が正規分布ですから、正規分布やt分布を対象にして理論の説明をしている時に、離散分布である二項分布の話題に戻り、頻度論的な確率を期待値にして理論を解釈しようとするのは――説明のための具体的かつ近似的な例え話なら良いと思いますが――あまり適切とは言えないと思いますよ。(^_^;)

ネイマン・ピアソン統計学派がこの解釈にこだわるのは、ベイズ統計学で用いる原因の確率、つまり情報不足に基づいた主観的な確率を統計学から排除することが、ネイマン・ピアソン統計学構築の目的のひとつだったからです。
これは、科学からアリストテレス的な主観を排除し、客観的な観測事実と批判的思考法(クリティカル・シンキング)に基づいて理論を構築することによって科学を構築しようという、統計学創成期の時代の流れに合わせたものです。

ちなみに、頻度論的な統計学については次のページが参考になると思います。(^_-)
https://ja.wikipedia.org/wiki/%E9%A0%BB%E5%BA%A6%E4%B8%BB%E7%BE%A9%E7%B5%B1%E8%A8%88%E5%AD%A6

1871. Re[1870]:[1869]:信頼区間と標準誤差について 投稿者:上条あかね 投稿日:2022/10/29 (Sat) 09:33:32 [返信] [削除]
引き続き有難う御座います.

>自己矛盾
誤解を招く書き込みをお詫びします.1865.の「離散分布まで戻ってしまうと話が広がりすぎる」は「離散分布の知識は用いない」と云う意味ではなく,一連の投稿では「推定や検定の対象とする母集団分布は離散型ではなく連続型とする」と云う意味でした.

>そしてこの文脈での標準誤差の定義は後者ですね。
>「標準誤差は標本集団から見た時の母数推定値の標準偏差推定値」
つまり,(標準誤差)=√((不偏分散)/(サンプルサイズ n)) (これは確率変数)の場合,信頼区間は標本平均と標準誤差に依存するが,自由度 n-1 の t 分布の確率密度関数の区間 [-c', c'] 上の積分が 0.95 となる正数 c' を用いれば,信頼区間が母平均を含むための標本平均と標準誤差についての条件|(標本平均)-(母平均)|≦(定数 c')×(標準誤差)が定める可測集合の確率 0.95 (確率測度は((標本平均)-(母平均))/(標準誤差)と云う確率変数が誘導するもの)により,前記と同じく,100回の "サンプルから信頼区間を作る" と云う試行における "母平均を含む信頼区間が得られる" 回数は B(100,0.95) に従うのではないでしょうか?

上記は,二項分布の期待値という位置付けに拘っている訳ではなく,「母集団から標本をとりだし、その標本から母平均の95%信頼区間を求める」ことを100回実施したとき、95回程度はその区間内に母平均が入る」ことを表します,と云った説明がどのような数学の性質の糖衣表現なのか(或いは対応する数学の性質はないのか)を知りたいのです.

この「100回実施したとき、95回程度」を読む度に「"95回程度"って何?」「何回から何回までが "95回程度" なの?」となる訳です.こうした表現は信頼区間に限らず連続分布の一般向けの説明に用いられているようですが,少なくとも信頼区間の話をする段階では二項分布の期待値は知っている筈なのに,何故そのように述べないのか?と...
(私はこれが期待値と云う説明を見たことがありません)

長くなってすみません.

1870. Re[1869]:信頼区間と標準誤差について 投稿者:杉本典夫 [URL] 投稿日:2022/10/28 (Fri) 10:15:02 [返信] [削除]
>上条あかね様
>> (現実的ではありませんが)母標準偏差が既知であり,それを用いる場合には,母平均を含む信頼区間の個数は,B(100,0.95) に従うということですね.
そのように考えていただいても良いと思います。ただし1865番の書き込みで「離散分布まで戻ってしまうと話が広がりすぎるので,以降は"分散が与えられた正規母集団"についてお尋ねしたく思います.」と書かれているので、この文脈で離散分布であるB(100,0.95)を持ち込むのは自己矛盾になると思いますよ。(^_-)

>> この文脈での「標準誤差」の定義をご案内いただけますか?
標準誤差の定義については、当館の次のページを参考にしてください。
○玄関>雑学の部屋>雑学コーナー>統計学入門
→1.3 データの要約方法 (3) 標準誤差
http://www.snap-tck.com/room04/c01/stat/stat01/stat0103.html
※このページの(注2)も参考にしてください。
http://www.snap-tck.com/room04/c01/stat/stat01/stat0103.html#note06
補足ですが、純粋数学分野では「標準誤差は母集団から見た時の統計量の標準偏差」と定義する人が多く、数理統計学分野では「標準誤差は標本集団から見た時の母数推定値の標準偏差推定値」と定義する人が多いようです。この定義には歴史的な経緯が関係していて、詳しく説明すると長くなるので省略しますが、僕は「どっちの定義でもかわまない」派です。σ(^_-)
そしてこの文脈での標準誤差の定義は後者ですね。

>> その理由をご案内いただけますか?
上記のページと次のページを参考にして、自分で導いてみてください。(^_-)
○玄関>雑学の部屋>雑学コーナー>統計学入門
→付録2 中心極限定理のシミュレーション−平均値と中央値
http://www.snap-tck.com/room04/c01/stat/stat99/stat9902.html

1869. Re[1868]:[1867]:信頼区間と期待値について 投稿者:上条あかね 投稿日:2022/10/27 (Thu) 22:04:07 [返信] [削除]
引き続き有難う御座います.

>標本平均値は正規分布に従う確率変量であり、標準誤差はχ2乗分布に従う確率変数です。そのため母平均を含む信頼区間の個数は、厳密にはB(100,0.95)に従いません
(現実的ではありませんが)母標準偏差が既知であり,それを用いる場合には,母平均を含む信頼区間の個数は,B(100,0.95) に従うということですね.

>標準誤差はχ2乗分布に従う確率変数
この文脈での「標準誤差」の定義をご案内いただけますか?

>(ただし100個の信頼区間が得られた時、そのうち母平均が含まれる信頼区間の期待値は95になります)。
その理由をご案内いただけますか?

1868. Re[1867]:信頼区間と期待値について 投稿者:杉本典夫 [URL] 投稿日:2022/10/27 (Thu) 08:24:33 [返信] [削除]
>上条あかね様

>> 「標本平均値 x(ω) と固定された標準誤差から得られる母平均の 95% 信頼区間に母平均が属するような標本点 ω 全体からなる可測集合 {ω| |(標本平均)(ω)-(母平均)|≦(定数c)×(標準誤差)} の確率は,
>> c の定め方から,0.95 なので,100 個の標本平均値と固定された標準誤差から得られる母平均の 95% 信頼区間のうち母平均が属するものの個数は B(100,0.95) に従う確率変数であり,その期待値は 100×0.95=95 である」
>> という信頼区間の「性質」と言ってしまうのは不味いのでしょうか?
僕はあまりまずくないと思いますが、ネイマン・ピアソン統計学派の人達は「まずい!」と言うと思いますよ。(^_^;)
その理由は、標本平均値と標準誤差は固定された値ではなく、標本平均値は正規分布に従う確率変量であり、標準誤差はχ2乗分布に従う確率変数です。そのため母平均を含む信頼区間の個数は、厳密にはB(100,0.95)に従いません(ただし100個の信頼区間が得られた時、そのうち母平均が含まれる信頼区間の期待値は95になります)。
これは統計学の草創期にゴセット(Student)によって発見されたことであり、標本平均値と標準誤差を組み合わせて検定統計量や信頼限界(信頼区間の下限と上限)を求めると、それは正規分布ではなくt分布に従います。そのため信頼区間の計算にt分布の5%断点の値(定数c)を使うのです。
そして標本平均値と標準誤差が確率変数であることから、信頼区間に母平均が含まれる確率という解釈ではなく、母平均を含む信頼区間を得る確率という解釈になるわけです。
それに対してベイズ統計学派の人達は、結果の確率ではなく原因の確率を使って「信用区間に母平均が含まれる確率は95%である」と解釈します。
僕はベイズ統計学派ではありませんが、信頼区間に関してはベイズ統計学派の人達の解釈の方が実用的だと思ってますよ。(^_-)

1867. Re[1866]:[1865]:信頼区間の解釈について 投稿者:上条あかね 投稿日:2022/10/26 (Wed) 10:14:58 [返信] [削除]
引き続き有難う御座います.

>ただし信頼区間の解釈については、ネイマン・ピアソン統計学では結果の確率を使って「母平均が入っている信頼区間を得る確率が95%である」と解釈するのに対して、ベイズ統計学では原因の確率を使って「信用区間の間に母平均が95%の確率で入っている」と解釈します。

この話題では「解釈(interpretation)」という表現,また,(ネイマン・ピアソン統計学での)95% 信頼区間の「95」の説明として「 95% 信頼区間を 100 回作ると,そのうちおよそ 95 回は母平均が属するものが得られる」という説明をよく見かけます.

これを反復試行における成功回数の期待値を用いて

「標本平均値 x(ω) と固定された標準誤差から得られる母平均の 95% 信頼区間に母平均が属するような標本点 ω 全体からなる可測集合 {ω| |(標本平均)(ω)-(母平均)|≦(定数c)×(標準誤差)} の確率は,c の定め方から,0.95 なので,100 個の標本平均値と固定された標準誤差から得られる母平均の 95% 信頼区間のうち母平均が属するものの個数は B(100,0.95) に従う確率変数であり,その期待値は 100×0.95=95 である」

という信頼区間の「性質」と言ってしまうのは不味いのでしょうか?

1866. Re[1865]:信頼区間の解釈について 投稿者:杉本りお [URL] 投稿日:2022/10/26 (Wed) 08:52:53 [返信] [削除]
>上条あかね様

>> 単純に集合 {μ| |(標本平均値)-μ|≦(定数c)×(標準誤差)} を標本平均値,標準誤差から得られる母平均の 95% 信頼区間と定義するのは不都合なのでしょうか?
別に不都合はないので、現在は上記の区間を母平均の95%信頼区間の定義にしています。
ただし信頼区間の解釈については、ネイマン・ピアソン統計学では結果の確率を使って「母平均が入っている信頼区間を得る確率が95%である」と解釈するのに対して、ベイズ統計学では原因の確率を使って「信用区間の間に母平均が95%の確率で入っている」と解釈します。
これは近代統計学の草創期から両学派の間で論争になっていることでして、その論争の禍根が今でも残っているので、信頼区間の解釈となると両学派とも変に意固地になるのですよ。(^_^;)
そもそもネイマン・ピアソン統計学は、統計学から主観的な「原因の確率」を排除し、客観的かつ頻度的な「結果の確率」を基礎にして統計学を構築することを目的のひとつとして発展しました。そのため信頼区間の解釈についても、結果の確率を使って「母平均が入っている信頼区間を得る確率が95%である」と解釈するわけです。
僕はどちらの学派でもないので、厳密な解釈にはあまりこだわらず、研究者には「母平均が95%の確率で入っている区間」と単純に説明してますよ。(^_-)

ネイマン・ピアソン統計学とベイズ統計学の違いについては、当館の次のページを参考にしてください。
○玄関>雑学の部屋>雑学コーナー>統計学入門
→付録6 ベイズ統計学
http://www.snap-tck.com/room04/c01/stat/stat99/stat9906.html

1865. Re[1864]:[1863]:推測統計について 投稿者:上条あかね 投稿日:2022/10/26 (Wed) 00:13:44 [返信] [削除]
丁寧なご回答有難う御座います.私はこの方面には全くの素人ですが,推測統計の諸概念の数学としての位置付けに関心を持っております.宜しくご指導お願い致します.

まず,先の投稿での仮説の位置付けは「正規母集団の母平均μの信頼区間 CI を用いれば,仮説 H(μ) に対する棄却・保留・採択の評価は,集合 CI と {μ|H(μ)} との関係から得られるので,検定の作業は不要ではないのか?」という意図のものでした.

>特に検定統計量が離散分布する時は、検定の棄却域と区間推定の信頼区間が食い違うことがあります。
離散分布まで戻ってしまうと話が広がりすぎるので,以降は"分散が与えられた正規母集団"についてお尋ねしたく思います.

>○玄関>雑学の部屋>雑学コーナー>統計学入門
>→1.4 推定 (2) 信頼区間の解釈
ご案内有難う御座います.

>ただし厳密にいうと95%信頼区間の意味するところは次のようなものです。
に続く 2 つの「 」の内部,および,Neyman-Pearson 釣り大会での釣師(fisher!)のお話では,母平均の信頼区間を
>もし母平均(母数)が標本平均値(点推定値)と同じ値だった
場合の標本平均値たちが属する区間と述べておられますが,単純に集合 {μ| |(標本平均値)-μ|≦(定数c)×(標準誤差)} を標本平均値,標準誤差から得られる母平均の 95% 信頼区間と定義するのは不都合なのでしょうか?(ただし,定数 c は標準正規分布の確率密度関数の区間[-c,c]上の積分が 0.95 となる正数)

1864. Re[1863]:推測統計について 投稿者:杉本典夫 [URL] 投稿日:2022/10/25 (Tue) 09:18:04 [返信] [削除]
>上条あかね様
初めまして、当館の館長を務めている”とものり”こと杉本申します。当館の「統計学入門」を読んでいただき、ありがとうございます。m(_ _)m

>> ・仮説検定における仮説(母数についての条件)を次のように位置付けてよいでしょうか?
>> 「仮説検定では,
>> 信頼区間との交わりが空である集合を定める条件を棄却される仮説,
>> 信頼区間との交わりが空でない集合を定める条件を保留される仮説,
>> 信頼区間の拡大集合(信頼区間を部分集合とする集合)を定める条件を採択される仮説とよぶ.」
必ずしも、上記のように位置付けて良いとは限りません。
検定は定性試験に相当し、推定は定量試験に相当します。そのため、例えばpH計の測定結果とリトマス試験紙の測定結果を厳密に対応させることができないのと同様に、検定の仮説と信頼区間を厳密に位置付けることはできませんし、あまり意味のあることではないと思います。
特に検定統計量が離散分布する時は、検定の棄却域と区間推定の信頼区間が食い違うことがあります。
これについては、当館の次のページをじっくりと読んでみてください。(^_-)
○玄関>雑学の部屋>雑学コーナー>統計学入門
→3.2 1標本の計数値 (2) 名義尺度(分類データ) (注2)
http://www.snap-tck.com/room04/c01/stat/stat03/stat0302_2.html#note02
※表3.2.6〜表3.2.9と図3.2.13〜図3.2.18が参考になると思います。

それから僕は検定廃止論者σ(^^;)なので、検定と区間推定の関係をあれこれ考えるよりも、区間推定の意味をより深く検討する方が有意義だと思っています。
区間推定の意味については、当館の次のページを参考にしてください。
○玄関>雑学の部屋>雑学コーナー>統計学入門
→1.4 推定 (2) 信頼区間の解釈
http://www.snap-tck.com/room04/c01/stat/stat01/stat0104.html
※図1.4.4が参考になると思います。

1863. 推測統計について 投稿者:上条あかね 投稿日:2022/10/22 (Sat) 07:19:14 [返信] [削除]
初めまして.推測統計の基本事項について質問させて頂きます.

・仮説検定における仮説(母数についての条件)を次のように位置付けてよいでしょうか?

「仮説検定では,
信頼区間との交わりが空である集合を定める条件を棄却される仮説,
信頼区間との交わりが空でない集合を定める条件を保留される仮説,
信頼区間の拡大集合(信頼区間を部分集合とする集合)を定める条件を採択される仮説とよぶ.」

1862. Re[1861]:[1860]:順序尺度の相関関係 投稿者:北の大学院生 投稿日:2022/10/19 (Wed) 14:52:00 [返信] [削除]
今回も丁寧な、ご回答を誠にありがとうございます。

人間が自分の感覚を評価する段階と統計的に望ましいことで乖離が起きていて、現在私もかかわっている痛みの研究は主観評価なので、とても難しいです。

NRSのほかにマクギル疼痛質問票を用いて、4段階評価の質問を22個調べて、それらの合計点を評価項目にしたり、グループごとに合計点を求めて「下位尺度」として評価項目にしたりして、いろいろと妥当性を検討しています。

私の分野では、VAS、NRSが一般的で、まだマクギル疼痛質問票は使われていないため、近年いわれている多次元のものを一次元にしての評価の限界を補おうとしています。

また、色々と質問させていただくことがあると思いますが、今後ともよろしくお願いいたします。

1861. Re[1860]:順序尺度の相関関係 投稿者:杉本典夫 [URL] 投稿日:2022/10/19 (Wed) 14:29:11 [返信] [削除]
>北の大学院生さん

こんにちわ、先日は興味深い論文を紹介していただき、ありがとうございました。
御質問にお答えします。

1.そもそもスケールとして問題があり比較妥当性がありますか?
これは医学分野でよくあるスケールですから、ある程度は比較妥当性があると思います。

2.計量尺度との場合、(ピアソンの)相関係数またはスペアマンの順位相関係数または相関比のいずれが妥当ですか?
相手が計量尺度なら普通の相関係数と順位相関係数の両方を求め、両者を比較しながら妥当性を検討すると良いと思います。
これは感度分析の一種になります。

3.順序尺度の場合、スペアマンの順位相関係数または順位相関比のいずれが妥当ですか?
相手が順序尺度なら順位相関係数ですね。

4.名義尺度の場合、相関比または順位相関比またはクラメールの連関係数のいずれが妥当ですか?
相手が名義尺度なら相関比と順位相関比の両方を求め、両者を比較しながら妥当性を検討すると良いと思います。

昔、リューマチの臨床試験のお手伝いをした時、VASとFPSの妥当性を色々と検討をしたことがありますよ。
その結果では、人間が自分の感覚を評価する時はだいたい3〜5段階で評価することが多く、7段階以上にしたり、アナログスケールにしたりすると、再現性が悪くなる傾向がありました。
それに対して統計学的には、順序尺度を計量尺度扱いするためには7段階以上が望ましいとされています。
そこで色々な心理尺度検査では3〜5段階評価の質問を複数個調べて、それらの合計点を評価項目にしたり、因子分析を用いて関連性の強い質問をグループにし、グループごとに合計点を求めて「下位尺度」として評価項目にしたりしています。
僕の経験では、1つの項目を多段階で評価するよりも、複数の項目を3〜5段階で評価し、それらを合計して評価する方が妥当性が高い印象がありますね。
以上、何かの参考になれば幸いです。(^_-)

1860. 順序尺度の相関関係 投稿者:北の大学院生 投稿日:2022/10/19 (Wed) 13:20:38 [返信] [削除]
いつも大変お世話になっています。先日は丁寧なメールを誠にありがとうございました。

さて、順序尺度との相関関係に関してお尋ねしたいのですが、 NRS(Numerical Rating Scale)に関してです。
これは、ある事柄に関して当てはまり度合いなどで、0~10までの数字で主観的に評価するものです。小数点も含めると11段階以上で評価しています。症例一つ一つ、さらに同じ症例でも毎回、スケールの大きさと間隔がランダムであるものです。

そこで、ほかの評価と相関関係を調べたいのですが、
1.そもそもスケールとして問題があり比較妥当性がありますか?
以下は比較妥当性があるとして関係の相手が

2.計量尺度との場合、(ピアソンの)相関係数またはスペアマンの順位相関係数または相関比のいずれが妥当ですか?

3.順序尺度の場合、スペアマンの順位相関係数または順位相関比のいずれが妥当ですか?

4.名義尺度の場合、相関比または順位相関比またはクラメールの連関係数のいずれが妥当ですか?

ご教授お願いいたします。

1859. Re[1858]:[1857]:不偏分散の区間推定 投稿者:キッシー 投稿日:2022/09/20 (Tue) 16:43:42 [返信] [削除]
いつも丁寧な説明ありがとうございます。
感謝しております
まだまだ勉強不足でした。
今後も宜しくお願いします。

1858. Re[1857]:不偏分散の区間推定 投稿者:杉本典夫 [URL] 投稿日:2022/09/20 (Tue) 09:21:07 [返信] [削除]
>キッシーさん

お久しぶりです!(^o^)/

> α=1にすると
> σL^2=σH^2≈107.88となりますが
> どういう意味になるのでしょうか?
> 点推定V=100と一致すると思っていました
α=1つまり0%信頼区間にすると、分散の区間推定値は不偏分散には一致しません。
その理由は母分散の一致推定量(n→∞の時に母数に一致する推定量)は標本分散(平方和をnで割った値)であり、不偏分散は不偏推定量(期待値が母数に一致する推定量)だからです。そして普通は一致性よりも不偏性と回帰分析における残差分散との整合性を優先して、母分散の推定値として不偏分散を用いているのです。
そしてχ2乗分布は不偏分散に関する分布ですから、χ2乗分布を利用した区間推定値は不偏性はあるものの一致性は少し悪くなります。
さらに不偏分散の平方根は母標準偏差の一致推定量でもなく、不偏推定量でもありません。しかし標準偏差=分散の平方根という関係を優先して、母標準偏差の点推定値として不偏分散の平方根を用いるのが普通です。
これに対して標本平均値は母平均の一致推定量であると同時に不偏推定量でもあるので、0%信頼区間にすると区間推定値が点推定値に一致します。

このあたりのことについては、当館の次のページを参照してください。(^_-)
○玄関>雑学の部屋>雑学コーナー>統計学入門
→1.4 推定 (注4)
http://www.snap-tck.com/room04/c01/stat/stat01/stat0104.html#note04