玄関会議室

会議室

この会議室はパソコン通信と同様のオンライン掲示板です。 どんな話題でもかまわないので気軽にじゃんじゃん書き込んでください。

[書き込み削除]

1944 番の書き込みのパスワードを入力してちょ!


1944. Re[1943]:細菌叢解析 投稿者:杉本典夫 [URL] 投稿日:2023/07/20 (Thu) 08:57:34
>北の大学院生さん
こんにちわ! 大変興味深い続報を知らせていただき、ありがとうございます。m(_ _)m

> 色々と試行錯誤したところ、やはりBacteroidetesで割るとすべて%の呪縛から解放されて、因子分析や主成分分析が可能となりました(p ˶ˆ꒳ˆ˵)。
これは大いに有望そうですね!

> この検定についてもう少し勉強して、Bacteroidetesで割る解析の論文を書いて浸透させようと思います。
> 中央値や幾何平均が算術平均よりもよい値になるので普通にパラメトリックの方法は難しいですが、色々な可能性が見えてきました。
中央値は中心極限手定理が部分的にしか成り立たないので、中央値そのものを検定する「中央値の検定」という手法はありません。
また幾何平均は対数変換した時の算術平均に相当します。そのため幾何平均が良い値になるようなら、データを対数変換してから算術平均を求め、それに対して一般的な平均値の検定と区間推定を適用するのが良いと思います。
それからよく誤解されていることですが、元のデータがどんな分布をしていても、中心極限定理によって平均値や順位平均値や出現率等の十分統計量は近似的に正規分布します(ただし中央値は十分統計量ではないので除く)。
そして平均値の検定(t検定)や順位平均値の検定(順位和検定)や出現率の検定(χ2乗検定)は、元のデータではなく統計量が近似的に正規分布する性質を利用した手法です。そのため元のデータがどんな分布をしていても、平均値の検定(t検定)や順位平均値の検定(順位和検定)や出現率の検定(χ2乗検定)は適用できます。
したがってパラメトリック手法とノンバラメトリック手法は、元のデータが正規分布かどうかで使い分けるのではなく、評価指標として平均値のようなパラメトリックな統計量が適しているのか、それとも順位平均値のようなノンパラメトリックな統計量が適しているかで使い分けるべきです。
ちなみに、元のデータが近似的に正規分布しているかどうかを検定する「正規性の検定」という手法がありますよね。これらの手法は、元のデータが正規分布していることを前提にしたパラメトリックな検定手法です。したがって、もし元のデータが正規分布していないので平均値の検定(t検定)が使えないのなら、正規性の検定も元のデータが正規分布していない時は使えないことになります。そのため正規性の検定結果が有意になった時は、「元のデータが正規分布していない」と解釈するのではなく、「検定結果が信用できない」と解釈しなければならないことになります。
正規性の検定には、このような「クレタ人のパラドックス(^_-)」と似た矛盾があります。この矛盾に最初に気付いたのはネイマンとピアソンでした。そしてこの矛盾を解消すべく色々と検討し、中心極限定理に基づいた現在のネイマン・ピアソン統計学を確立したのです。このことは、数理統計学分野以外では意外と知られていないようです。
正規性の検定の矛盾については、当館の次のページの(注3)を御覧ください。(^_-)
○玄関>雑学の部屋>雑学コーナー>統計学入門
→2.3 パラメトリック手法とノンパラメトリック手法 (注3)
http://www.snap-tck.com/room04/c01/stat/stat02/stat0203.html#note03

> ほとんどの人でBacteroidetesの絶対数が同じことを証明したくなりました。
> この検定の元論文やBacteroidetesのどの属なのかも今後調べようと思います。
これは僕も非常に興味がありますね。今後の進展に大いに期待しています!