玄関会議室

会議室

この会議室はパソコン通信と同様のオンライン掲示板です。 どんな話題でもかまわないので気軽にじゃんじゃん書き込んでください。

[書き込み削除]

1966 番の書き込みのパスワードを入力してちょ!


1966. Re[1965]:相関分析と回帰分析の区間推定について 投稿者:杉本典夫 [URL] 投稿日:2023/11/14 (Tue) 17:59:37
>キッシーさん
こんにちわ!(^o^)/

> しかし、(A)と(B)は背反するのですが
> どのように理解すれば良いのでしょうか?
(A)は相関分析における信頼楕円・許容楕円・予測楕円であり、(B)は回帰分析における信頼限界・許容限界・予測限界です。

相関分析は2つの項目の間に「項目1←→項目2」というような、お互いに影響を与え合っている相互関連性つまり相関性がある時に、その相互関連性の様子を相関係数を指標にして近似的に分析するための手法です。
そのため2つの項目はどちらも確率変数(確率的な誤差がある変数)であり、通常は近似的に2次元正規分布をするという前提で分析します。そしてその2次元正規分布を利用して、2次元空間において、2つの項目の母重心が95%の確率で含まれる範囲を信頼楕円として表し、データプロットの95%が含まれる範囲を予測楕円として表します。

それに対して回帰分析は2つの項目の間に「項目1(原因)→項目2(結果)」というような、項目1が原因で項目2がその結果という因果関係がある時に、その因果関係の様子を数学的な関数――通常は1次関数つまり回帰直線――で近似して分析するための手法です。
そのため原因項目は研究者が任意の値を指定する誤差のない変数、結果項目は誤差がある確率変数であり、通常はその誤差が回帰直線の上下に近似的に正規分布するという前提で分析します。そしてその誤差つまり回帰誤差の正規分布を利用して、母回帰直線が95%の確率で含まれる範囲を回帰直線の上下に信頼限界として表し、データプロットの95%が含まれる範囲を回帰直線の上下に予測限界として表します。
回帰誤差は結果項目つまり目的変数だけにあり、原因項目つまり説明変数の平均値付近が最も小さく、平均値から離れるほど大きくなります。そのため信頼限界と予測限界は説明変数の平均値の付近が最も狭く、平均値から離れるほど広くなります。

これらのことから、(A)と(B)は前提条件が異なるので背反するのは当然であることがわかると思います。
この相関分析と回帰分析の違いを十分に理解している人は、研究者はもちろん、「統計学専門家」を自称している人の中でもあまり多くありません。そのため論文や統計学の解説書などで、データの散布図に回帰直線と相関係数を同時に記載してしまうという自己矛盾を平気でやっている人がけっこういます。(^_^;)
詳しい説明は、当館の次のページをじっくりと読んでみてください。(^_-)

○玄関>雑学の部屋>雑学コーナー>統計学入門
→5.5 各種手法の相互関係
http://www.snap-tck.com/room04/c01/stat/stat05/stat0505.html