玄関会議室

会議室

この会議室はパソコン通信と同様のオンライン掲示板です。 どんな話題でもかまわないので気軽にじゃんじゃん書き込んでください。

[書き込み削除]

1961 番の書き込みのパスワードを入力してちょ!


1961. Re[1960]:[1959]:対応分析、別名コレスポンディング分析の同時布置の解釈 投稿者:おそるおそる 投稿日:2023/09/06 (Wed) 00:02:29
杉本先生 こんばんわ。ご返信ほんとうにありがとうございます。
+++
この場合、テキスト中に現れる特定の語句を「ある疾患における特定の症状」に相当すると考えてください。そして多くの患者について、複数の症状の有無を調べて「0:無 1:有」で表します。
このデータを主成分分析すると、どの患者でも同時に発現する複数の症状は相関が高いので、それらをまとめて1つの主成分になります。しかし特定の患者だけに発現する特殊な症状は他の症状と独立しているので、その症状だけで1つの主成分になります。
このような場合、主成分を座標軸にして、各症状と主成分の相関係数である主成分負荷量をプロットすると、お互いに相関が高い症状のプロットはまとまり、他の症状と独立した症状のプロットはポツンと離れてプロットされます。
そして独立した症状に対応する主成分軸上では、他の症状と独立した症状のプロットは原点から離れてポツンとプロットされ、他の症状のブロットは原点付近にまとまります。これが上記の「結果の中で原点からの距離が離れている語ほど「特徴的な語」である」という記述に対応します。
つまりその症状が発現した患者は他の患者と比較して特殊な患者であり、その疾患の特殊な病態を表す患者と言えます。
これと同様に、テキストマイニングの場合、原点から離れてプロットされた語句は、一般的な被験者の文章とは異なる特定の被験者の文章を表す語句と考えられます。
+++
この部分のコメントで、頭の中に2次元のクロス表がふわっと浮かび、図を描き起こしてみると、なるほどと目からうろこが落ちた、ストンと腑に落ちるという体験(もしかしてアハ体験?)でした。すぐにお礼の返信をするべきでしたが、分析に没頭してしまい御礼が遅れ大変失礼しました。今後とも、どうかよろしくお願いしたく存じます。
取り急ぎ御礼のみ失礼仕ります。