玄関会議室

会議室

この会議室はパソコン通信と同様のオンライン掲示板です。 どんな話題でもかまわないので気軽にじゃんじゃん書き込んでください。

[書き込み削除]

1933 番の書き込みのパスワードを入力してちょ!


1933. Re[1932]:Bray-Curtis 距離とβ多様性 投稿者:杉本典夫 [URL] 投稿日:2023/06/22 (Thu) 10:08:33
>北の大学院生さん
> 門レベルで主成分分析を行ってみました。
> cor=Fで行うとCompが2までで寄与率85%でComp1は主要2門、comp2は次に多い3門と主要2門のLoadingsとなり、結果としては分かりやすい内容でした。
僕は、まず5門別に菌の測定値を用いて因子分析と主成分分析を行い、それによって抽出された因子と主成分を用いてさらに因子分析と主成分分析を行うという2段階の解析を行いました。
そして統合した因子スコアと主成分スコアについて、臨床症状およびバイオマーカーとの単・重回帰分析と単・重相関分析を行いました。
結果は、ほとんど全ての因子と主成分は臨床症状およびバイオマーカーとの関連性が認められずネガティブでした。

> Bray-Curtis 距離を使用するには、分母?条件をそろえる必要があるということであっていますでしょうか。
僕はα多様性とβ多様性をあまり評価していないので、これらの指標を用いた解析は行いませんでした。(^_^;)
理由は簡単で、これらの指標は菌種間の相関を考慮していないので、統計学的にはあまり合理的な指標ではないからです。
α多様性の指標は、各菌種はお互いに独立である(つまり無相関)という暗黙の前提をおいた因子スコアまたは主成分スコアに対応します。
そしてβ多様性の指標は、各菌種はお互いに独立であるという暗黙の前提をおいた多次元尺度構成法(測定項目間の相関の代わりに個体間の距離または類似性を用いた主成分分析)やクラスター分析で用いる距離または類似度に対応します。
これらの指標を考案した人は、因子分析や多次元尺度構成法という、このようなデータを解析するために開発された従来の統計手法の原理をあまり理解していないのではないかと思います。
当館では多次尺度構成法(MDS:Multi Dimensional Scaling)について詳しくは説明していませんが、クラスター分析の最後で少し説明しているので参考にしてください。
○20.3 各種のクラスター分析結果
http://www.snap-tck.com/room04/c01/stat/stat20/stat2003.html
※このページの最後でMDSについて少し説明しています。(^_-)

僕は、細菌叢データはQOL等に用いられる尺度開発用アンケートデータと似たようなものと考えています。
そのため多数の細菌叢データを少数の因子によって科学的に解釈すると同時に、各個体の因子スコアをQOLで用いられる下位尺度に相当する指標として用いて、色々な臨床症状やバイオマーカーとの関連性を検討したいと思っています。
以前、腎疾患患者のm-RNAデータを解析した時、因子分析を用いて尺度開発のような解析を行い、腎疾患のバイオマーカーに相当する指標を考案したことがあります。またDNAのSNPsデータに因子分析を適用して、色々な疾患のリスクを表す指標を開発したこともあります。
そのため細菌叢データについても、これらと同様のアプローチをしたわけです。
しかし細菌叢データは、御指摘のように検査原理から考えて相対的な割合しか測定できません。
そのため、これは白血球分画データと似たような性質のデータと考えられます。白血分画データの場合は、白血球数を全体のレベルを表すデータとして利用すれば、レベルとパターンを表す因子または主成分を抽出することができます。
しかし細菌叢データの場合、白血球数のように全体のレベルを表すデータが測定しにくいらしく、菌叢解析を行った研究施設に相談しましたが、残念ながらそのようなデータは得られませんでした。
これらの事情を考慮すると、細菌叢データについてQOL等のような尺度開発を行って臨床症状やバイオマーカーとの関連性を検討するのは、現段階ではまだまだ難しいような気がします。