玄関雑学の部屋雑学コーナー遺伝子検査と診断率

9.多段抽出法

さて、大阪市立大学の抗体検査結果では陽性率が約1%でした。 しかしこの検査の感度と特異度が正確にはわかっていないので、この結果から検査対象集団の感染率を推測することはできません。 でも普通の人は、この結果を見て、

「日本人全体の1%程度の人(約127万人)はCOVID-19に感染した可能性がある!」

と思ってしまうかもしれせん。

OCU外来受診者
※上図は大阪私立大学の「新抗体価測定システムが高い精度で陽性を判定! ~疫学調査により、大阪では1%程度が抗体を保持~」から引用させていただきました。

ところがどっこい、それは大きな間違いです。 「感染率と陽性率は異なる」ということは別にしても、次のような理由で大きな間違いです。

  1. 検査対象集団が日本人全体を代表していない!
  2. 検査対象集団の例数(312例)が少なすぎる!

1番については、検査対象集団が「大阪市立大学附属病院をCOVID-19関係以外で受診した患者の中から312名を無作為抽出した集団」なので、ものすごく特殊な集団です。 日本人全員が大阪市立大学附属病院をCOVID-19関係以外で受診したのならともかく、そうでなければこの集団で日本人全体を代表させるのは到底不可能です。

このような疫学調査の場合、通常は多段抽出法という無作為抽出法を用いて日本人全体を代表するような検査対象集団を抽出します。 この方法は感染率に強く影響する因子によって日本人全体をいくつかの層(ブロック)に分け、その層ごとに被験者を無作為抽出する手法です。

通常、層別因子としては都道府県、性別、年齢等を用います。 COVID-19の場合は、それ以外に3密環境かどうかも感染率に大きく影響します。 そのため理想的には日本人全体を都道府県47層×性別2層×10歳刻み年齢10層×3密の有無2層=1880層に分け、各層から無作為に被験者を抽出して検査対象集団にします。 そして抽出する例数として各層ごとに少なくとも100例以上は必要なので、検査対象集団は最低でも18.8万人必要ということになります。

2番については、例えば検査対象集団が1例だとすると陽性率は0%と100%の2種類しか有り得ません。 そのためたった1例の検査結果に基づいて「日本人の感染率は0%だ!」と結論したり、「日本人の感染率は100%だ!」と結論したりする人はいないでしょう。 現在(2020年5月上旬)の日本の累積PCR陽性率は16500人/12700万人=0.0001299213(約0.01%)です。 そのため陽性率0.01%という値が正しいかどうかをチェックするには、少なくとも検査対象集団の例数は1/0.0001=1万例以上必要です。

しかし、もし陽性率0.01%が正しいとすれば、1万例を検査しても陽性者はたった1例しか発生しません。 これでは「0.01%」という値の信頼性はものすごく低くなってしまいます。 そこで陽性者が少なくとも20例以上発生するように(統計学では誤差を5%=1/20程度にする習慣があるため)、検査対象集団は20万例以上にする必要があります。

厳密には、陽性率の95%信頼区間を利用して検査対象集団の必要例数を理論的に求めます。 信頼区間の区間幅の半分の値のことを絶対精度といい、陽性率の精度(誤差)を表します。 下のグラフのように、信頼区間と絶対精度は例数の平方根に反比例して小さくなります。 この原理を利用して検査対象集団の例数を理論的に求めることができます。

図10.1 コイン投げの90%信頼区間

通常、絶対精度はチェックする陽性率の10分の1程度にします。 そのため陽性率を0.01%(0.0001)とすとる、絶対精度は0.001%(0.00001)にします。 そして陽性率0.01%で、絶対精度を0.001%以下にするためには、検査対象集団の例数は約500万例以上必要です。 この「500万例」という例数は、現実的には実施不可能に近い数字です。

そこで陽性率が非常に小さいので、絶対精度を陽性率の半分の0.005%にすると、検査対象集団の例数は約20万例になります。 この20万例という例数は、多段抽出法によって日本人全体を代表させるのに必要な最低例数である18.8万例に近い値です。 このことから日本全体の陽性率や感染率を厳密に調べるためには、検査対象集団として約20万例以上の例数が必要になることがわかると思います。

今後、日本人全体の感染率を調べるために、厚労省を始めとして色々な研究機関が抗体検査や抗原検査を実施すると思います。 その際、次の3つの条件を満足する検査結果だけが信頼できます。

  1. 検査法の正確な感度と特異度が判明している。
  2. 検査対象集団が多段抽出法によって無作為抽出されている。
  3. 検査対象集団の例数が20万例以上ある。

これらの条件を満足していない検査結果は、本格的な試験を実施するための予備試験か、単なる参考程度です。 マスコミの煽り記事やSNSの早とちり情報に乘せられ、信頼性の低い数字を鵜呑みしてカラ騒ぎするのは賢明ではありません。(^_-)