玄関会議室

会議室

この会議室はパソコン通信と同様のオンライン掲示板です。 どんな話題でもかまわないので気軽にじゃんじゃん書き込んでください。

[書き込み削除]

1960 番の書き込みのパスワードを入力してちょ!


1960. Re[1959]:対応分析、別名コレスポンディング分析の同時布置の解釈 投稿者:杉本典夫 [URL] 投稿日:2023/09/05 (Tue) 10:14:36
>おそるおそるさん
お久しぶりですね!(^o^)/

> このアプリの中で、対応分析、別名コレスポンディング分析と呼称されている方法があり、原理は数量化理論Ⅲ類とのこと。
ご指摘のように、対応分析は林先生の数量化理論III類と同じ手法であり、分類データを用いた主成分分析に相当します。
林先生の数量化理論は欧米ではあまり有名ではないので、林先生より後に同じ手法が欧米で開発され、それが日本に逆輸入されて、そちらの手法の方が有名になるという皮肉な現象が起きています。(^_^;)

> この手法を用いた、似たような目的の論文や、このアプリを開発した方の文献などに、結果の中で原点からの距離が離れている語ほど「特徴的な語」であるという記述がよく見られます。
> アプリ内のパラメータ設定で「原点からの距離が離れた語のみ○個まで」表示という設定も可能です。
> 原点周辺に現れる語よりも、遠い距離に現れた語が特徴的という表現から、
> 例えば当方が、「原点からの距離が離れた語のみ6個を抽出したところ、A、B、C、D、E、Fであった。このことから、、、、のように考えられる。」とゆうような、文面で表現するとして、
> 外部変数の方向に原点から遠い語が意味がある(特徴的で)、近い語とどう違う意味(特徴的ではない)を持つのかがどうも理解できないのです。
この場合、テキスト中に現れる特定の語句を「ある疾患における特定の症状」に相当すると考えてください。そして多くの患者について、複数の症状の有無を調べて「0:無 1:有」で表します。
このデータを主成分分析すると、どの患者でも同時に発現する複数の症状は相関が高いので、それらをまとめて1つの主成分になります。しかし特定の患者だけに発現する特殊な症状は他の症状と独立しているので、その症状だけで1つの主成分になります。
このような場合、主成分を座標軸にして、各症状と主成分の相関係数である主成分負荷量をプロットすると、お互いに相関が高い症状のプロットはまとまり、他の症状と独立した症状のプロットはポツンと離れてプロットされます。
そして独立した症状に対応する主成分軸上では、他の症状と独立した症状のプロットは原点から離れてポツンとプロットされ、他の症状のブロットは原点付近にまとまります。これが上記の「結果の中で原点からの距離が離れている語ほど「特徴的な語」である」という記述に対応します。
つまりその症状が発現した患者は他の患者と比較して特殊な患者であり、その疾患の特殊な病態を表す患者と言えます。
これと同様に、テキストマイニングの場合、原点から離れてプロットされた語句は、一般的な被験者の文章とは異なる特定の被験者の文章を表す語句と考えられます。

自由記述のテキストに対して対応分析を行ってこのような結果になった場合、次の段階ではそれらの語句をキーワードにした質問項目を含むアンケートを作成します。その場合、アンケートの回答をリッカート尺度にして、アンケートデータに因子分析を適用できるようにします。
そして少数の被験者に対して試験的にアンケートを実施し、そのデータに因子分析を適用して因子を抽出し、下位尺度候補を探索します。そのようなアンケートを色々と試して質問項目をブラッシュアップし、最終的に心理尺度を開発します。
そのような心理尺度が開発できれば、被験者の背景因子項目と下位尺度の関係を相関分析や回帰分析で解析し、色々なことが検討できると思います。これがQOL等の心理尺度開発の一般的な手順ですね。

以上、参考になれば幸いです。