玄関会議室

会議室

この会議室はパソコン通信と同様のオンライン掲示板です。 どんな話題でもかまわないので気軽にじゃんじゃん書き込んでください。

[書き込み削除]

1936 番の書き込みのパスワードを入力してちょ!


1936. Re[1935]:細菌叢解析 投稿者:杉本典夫 [URL] 投稿日:2023/07/18 (Tue) 20:40:37
>北の大学院生さん
こんにちわ! 細菌叢解析について色々と興味深い結果を教えていただき、ありがとうございます。m(_ _)m

> 世界的にメジャーな2門で ratio of Firmicutes/Bacteroidetesのなにかとの順位相関の解析が流行っているみたいでした。
> ほとんどの人でこの2門は観測されているからだと推察されます。特にBMIが多かったです。
> そこで、F/Bと何かの属性で(順位)相関比やLN(F/B)で相関比を求めることを考えたのですが、これらは一応意味があることでしょうか。
ある程度は意味があると思います。BMIとの関連性を検討するのは当然でしょうね。
細菌叢のデータはバラツキが非常に大きく、外れ値も多いので、F/Bはさらにバラツキが大きくなるはずです。そのため普通の相関係数を求めると相関係数の絶対値が小さくなってしまうので、苦肉の策で順位相関係数を求めているのだと思います。
細菌は細胞分裂で倍々に増えるので、対数変換してから普通の相関係数を求めるのもひとつの方法だと思います。ただし順位相関係数は対数変換してから求めても値は変わらないので、対数変換するのなら順位相関係数は無意味です。
因子スコアや主成分スコアは元のデータのバラツキを小さくする効果があるので、因子スコアや主成分スコアは普通の相関係数が求めやすいです。僕が行った解析では、臨床症状と因子スコアの相関係数が最大で0.5程度ありました。でもその因子スコアが医学的にうまく解釈できなかったので、今のところペンディング状態です。

> 6地域と順位相関比は0.21(0.17~0.27)、Kruskal-Wallis chi-squared = 70.859, df = 5, p-value = 6.788e-14(p ˶ˆ꒳ˆ˵)、N = 1515(48,175,190,329,386,387)で、
> 相関比は0.19、サンプルサイズが小さいところもありますが、この分析が正しければ、それなりに地域差があるような感じでした。
例数が多いので検定結果は有意になりますが、相関比が0.19ですと、むしろ「地域差は小さい」と解釈した方が良いと思います。相関比が0.3〜0.4以上あれば「地域差がある」と考えても良いと思います。

> また、便中からサンプリングした場合、便の重量と便1gあたりの細菌数で便の特定の細菌のから分母は推定できるみたいですが、まだ、生体内の菌の分母は分からないみたいです。
> 便と腸の細菌数の桁数が違うので、これでは、生体ではなく便の解析で臨床家には意味がないので更なる技術革新を待っているところです。
> 10,000リードあたりのOTUに関してもサンプル中の(準)母集団からランダムサンプリングを繰り返して得られたもので組成を正しく反映しているみたいでした。
> やはり、細菌叢解析は組成や比で何菌が多いとどうだみたいなことしか生体内の菌叢を反映していないような気がします。
これは全く同感ですね。僕も今後の技術革新を期待しています。

> https://microbiome.nibiohn.go.jp/jmd-publicのサイトからOTUやBDHQなどの情報を抽出して主成分分析を行っていますが、
> 特定の食品のカロリー摂取と細菌の関連などは様々な食品摂取によってそもそも出すのが困難でいい関係性を見出すのが今のところできませんでした。
> 主成分分析によりgreen teaのカロリー摂取量で3グループにきれいに分けられました。
> (biplotでコーヒーとビールが似たベクトルでこれでも分類できそうでした)
green teaのカロリー摂取量で主成分スコアのプロットが3グループに分けられるのなら、green teaのカロリー摂取量を目的変数にし、主成分スコアを説明変数にした重回帰分析で良い結果が得られると思います。主成分スコアはお互いに無相関ですから、重回帰分析結果の解釈は簡単だと思います。
またコーヒーとビールは相関が高いことが多いので、主成分負荷量が似た値になりがちです。そのためbiplotを描くと主成分負荷量ベクトルが似たものになりがちです。
ちなみにbiplotは見にくいので、僕はあまり使いません。(^_^;) そのため当館の「統計学入門」では、主成分スコアの散布図と主成分負荷量のプロットを別々に描いています。そして主成分分析の結果を検討する時は、それらのグラフを並べて見比べるようにしています。

> おもしろいことに独自に開発されたβ多様性解析でUniFrac距離の解析ですべて原点に集約されて何もできなくなりました!
全ての菌を独立という前提で求めるβ多様性の性質から考えて、大いに有り得ることだと思いますよ。

> 合理的な解釈ができる結果を得るのは難しいですが、考え続けようと思います。
教えていただいた解析結果は、大いに参考になりました。さらなる進展に期待しています。
今後ともよろしくお願いします。m(_ _)m