2021年3月の記事一覧

PCR検査の統計(谷)

検査陽性者数
日本国内(2021.03.23)

 

東京都(2021.03.17)

 

検体採集日と,判定確定日や発症日は医師判定までのタイムラグを含む.
検査数はPCRだけでなく抗原検査も含む.
*ジョンズ・ホプキンス大学,東京都,厚労省のデータを用いました.

・検査陽性率=陽性者数/検査数 はどのくらい?
上のデータより,国内では4.9%,東京都では6.5%と推定するのが適当であろう.

1.サンプリングの偏りが変化している
PCR検査を受診できるグループは限定されている.初期は,無症状者は検査対象外でした.その後,クラスター対策で局所的な検査対象になり,現在の対象者の限定は明確でないが,無症状者が増えているようだ.
状況に応じて対象カテゴリを広げるのは当然で,感染抑止のために無症状の有病者を把握することは必要である.感染疑いの濃いグループをサンプリングするので偏りがあるわけですが,この基準自体も変化している.
このように,統計のプラットホームが変化しているから,変化を時系列に並べて,単純に発生率の変化と解釈することはできません.

2.統計量の定義
日本疫学会の定義によると,集団の有病率とは,その時点で,疾病を有している人の集団人口にたいする割合.集団の疾病発生率(罹患率)とは,一定期間に発生した疾病者のその集団で疾病感受性のある人口にたいする割合です.
有病率(t)=疾病を有する人数(t)/集団人数(t)
発生率(t)=新規陽性者(t)/集団内の感受性のある人数(t)

 

毎日,発表される新規陽性者の数は,発生率に近い概念ですが,集団内の感受性のある人数が未知なので,発生率とは正確には同じではありません.
PCR検査陽性率=新規陽性者/検査数で定義しますが,これも,サンプル集合の偏りと変化のために,単純比較はできません.そのため,累積数の比でこれを定義することにしました.

本来,有病率や罹患率などの統計量の時系列での変化を論じるには,ランダム・サンプリングの検査であるのが原則です.
ランダム・サンプリングで行われた調査としては,厚労省が抗体検査を行ったことがありますが,東京都で陽性率が0.1%程度だったと思います(2020.6).現時点での陽性率(多分増加している)が知りたいです.
東京都の人口は約1,400万人,これまでの感染者累積11.7万人を用い,0.84%が抗体保有者率が見積もれます.

現時点の感染者=感染者累積ー回復者累計ー死亡者累計ですから,これを仮の有病者(t)と定義します.有病者(t)と新規陽性者(t)は同義語ではありませんが,比例すべきと予想します.しかし,推測される有病者数に対して,現在のPCR検査数で拾い上げられる陽性者は圧倒的に少ない.
PCR検査数の増加が必要な所以です.特に,無症状の有病者はPCR検査のサンプル集合から除外されているのも問題です.

いくつかの定義を明確にしたい
PCR検査陽性者は有病者と同じか?
有病者から無症状者が除外されるのは良くないだろう.どの時点で患者(罹患者)と呼ぶのか?

今後考慮すべき問題
無症状者も感染に寄与すること,PCR検査で陰性となる変異株の出現などあり,これらのパラメータをどう定義するか?実効再生産数には反映される.
感染拡大の結果やワクチン接種による持続的な抗体形成により,感受性のある人口を減少させます.

0

PCR検査から有病率推定(谷)

陽性率を,p(+)=累積陽性者数/累積PCR検査数と定義すると,東京都の2021.3.17までのデータや厚労省の公表データを用いて,陽性率は,東京都で約6.5%(全国で4.9%,厚労省)になります.しかし,PCR検査の感度と特異度の情報(酒井健司,朝日デジタルなど)を入れてベイズ推定し,陽性的中率p(罹患|+)や偽陰性率p(罹患|-)を求めました.

ランダム・サンプリングのデータがないので,罹患率(有病率)も陽性率に等しいと仮定せざるを得ませんでした.
注)日本疫学会の定義によりますと,有病率と罹患率は異なります.

有病率=ある時点における疾病を有する者の数/調査対象全数
罹患率=ある時点における発生新規患者数/感染感受性のある人数

罹患率は,集団内の感染感受性のある人数に対して定義されるので,2つの定義で分母が異なります.さらに,有病率でいう「ある期間で疾病を有する者の数」は,罹患率でいう「新規感染者の数」とは異なるわけですが,タイムラグを考慮すれば,どちらも同様な傾向と近似ができそうです.

ここでは,有病率と罹患率を同義語として扱いました.毎日発表される,新規感染者数は,罹患率とは異なりますがよく似た指標であります.

 

 

東京都の2021.3.17までの陽性者累計116,293人,検査実施累計1,779,950人を用い,現在の陽性率はx=6.5%程度(全国ではx=4.9%)程度と推定します.
ランダム・サンプリングではないし,データが不足しているので,罹患率(有病率)も陽性率に等しいと仮定します.

(注)ここで対象となるサンプル集合は,PCR検査を受診できる限定されたグループですので,ランダム・サンプリングではなく偏っており(発症条件が課さたグループ),その陽性率は一般集合より若干高値でしょう.また,サンプリング条件が感染状況とともに変化しているので,単純な時間変化の比較はできません.
================================
■条件付き確率についての「ベイズの定理」とは次のように説明できます.
p(Y|X)p(X)=p(X∩Y)=p(X|Y)p(Y)
記号の意味は例えば以下の様です.
p(X) Xが起こる確率
p(Y|X) Xが起こった後でYが起こる確率
p(X∩Y) XかつYが起こる確率
ベイズの定理は,X(原因)が起きた後でY(結果)が起きる確率p(Y|X)と,XとYを入れ替えた確率p(X|Y)を結び付ける定理です.
===============================
■PCR検査の精度
新型コロナ検査、どれくらい正確? 感度と特異度の意味(酒井健司,朝日デジタル)などにより,次のように仮定します.
PCR検査の感度とは,罹患者がPCR検査で陽性(+)と正しく的中する確率のことで,あまり大きくなく0.7程度といわれます.真の罹患者でもPCR検査が陰性(-)(偽陰性)となる(罹患者を取りこぼす)確率が0.3程度あるそうです.
PCR検査の特異度とは,非罹患者を正しく陰性(ー)と判定する確率のことで0.99程度です.非罹患者を陽性(+)(偽陽性)と判定するのは稀で0.01程度の確率ですが,非罹患者の割合が多い集団(罹患(有病)率が小さい集団)では,無視できない偽陽性数になります.

 

■これらの仮定の下で,以下の2つを推定しましょう.
ただし,ベイズの定理を使います.
罹患(有病)率をp(罹患)≡x,非罹患(非有病)率を1-xとします.
(1)PCR検査で陽性と判定されたとき,罹患者である確率を求めなさい.

 

青線グラフ

つまり,PCRの結果が陽性のときでも,その的中率はp(罹患|+)=83%(x=6.5%附近)程度です.
罹患していても,検査感度のため,検査の結果が陽性にならない偽陰性が30%あり,罹患者をとりこぼしている.
一方,検査の特異度が高いので,偽陽性率は0.1%と小さいにも関わらす,非罹患者の割合(1-x)が多い集団では,陽性判定中に占める偽陽性の数も無視できない.これらの原因のため的中率が低下します.
(2)罹患(有病率)を推定しなさい.
(陰性)判定されたものの中に見逃された罹患者のいる確率p(罹患|-)は,

 

赤線グラフ

陰性と判定されたものの中に見逃された患者である可能性は,p(罹患|-)=2%(x=6,5%の付近)ほどある.
従って,全人口のなかで推定される罹患(有病)率は,
p(罹患)=x・p(罹患|+)+(1-x)・p(罹患|-)

第1項:第2項=真陽性:偽陽性=5.40:1.87
x=6.5%のときには,陽性中に占める偽陽性の数は25%程度である.

 

 

0