この前の説明が分かりにくかったみたいなので、もうちょっとわかりやすく書いてみます。
まず用語の説明をしていきます。
| 用語 | 説明 |
|---|---|
| 感度 | 異常がある人のうち、検査陽性の割合 |
| 特異度 | 異常がない人のうち、検査陰性の割合 |
| 検査前確率 / 事前確率 | 検査をする集団の異常のある割合(見込み) |
| 検査後確率 / 事後確率 | 検査後の検査適中率 |
感度と特異度は検査自体の特性です。どちらも高い方が検査としてはもちろん良いのですが、基本的にどちらも高くするのは難しいです。感度を高めるためにちょっとした数値の異常でも陽性にしてしまえば、当然異常じゃないのも拾ってくる率が高くなります。なので、検査目的に合わせてどこをカットオフにするのかを検討する必要があります。
今回は市販のキットを買ってくるというのが前提なので、ここについてはこれ以上述べません。ここでは、かなり理想的なXウイルス検査キットを買って来たことにしましょう。仮に感度99%、特異度98%としておきます(そんなものが売っているのかはともかく)。正直ちょっとあり得ないぐらいの検査キットですが、今回の話のためには極端な例の方がいいかなと思いまして。
さて、この検査キットを使った時、検査陽性だったらほぼ確実に異常と思うではないですか。何しろ99%ですからね。だけど、それは場合によるという話をしていきます。
有病率高そうなA農場
まずは、A農場に登場してもらいます。A農場は特殊で、疾患にかかってしまったっぽい株だけを集めている農場です。なんかXウイルス感染してそうな怪しげな雰囲気なんだけど捨てられない!しかも隔離する場所もない!という人からの株を代理で預かってくれるという農場です。怪しげな雰囲気なのは本当にXウイルスのせいなのか、この猛暑で調子が悪いだけなのかは、もちろん分からないのですが、色々話を総合していくと80%がXウイルス罹患株と思われたとしましょう。さて、このA農場で検査をしていきましょう。
| Xウイルス感染あり | Xウイルス感染なし | |
| 検査キット陽性 | a | c |
| 検査キット陰性 | b | d |
この表を埋めていくのですが、A農場には10000株あるとします。80%がXウイルス感染ありなのでa + b = 8000で、c + d = 2000になります。
感度99%であれば、a + bの99%がaになるはずなので、aは8000 x 0.99 = 7920。bは差し引きでもいいし、1%で計算でもいいですが、とにかく80。
特異度98%であれば、c + dの98%がdになるはずなので、dは200 x 0.98 = 1960。同様に計算して、cは40。
| Xウイルス感染あり | Xウイルス感染なし | |
| 検査キット陽性 | 7920 | 40 |
| 検査キット陰性 | 80 | 1960 |
ここまではよいですよね。考察は後回しにして、今度はB農場に登場してもらいましょう。
有病率低そうなB農場
B農場はウイルス感染に厳しい農場です。どこの誰とも分からないオークションサイト経由で株を手に入れることはありませんし、蘭を並べている一段のラックの下には排水溝が引かれており、廃液が他にかかることはありません。感染株は2%ぐらいではないかと見込んでおきましょう。このB農場でも検査をしていきましょう。
| Xウイルス感染あり | Xウイルス感染なし | |
| 検査キット陽性 | a | c |
| 検査キット陰性 | b | d |
今回も農場にある株は10000株とします。2%がウイルス感染ありなので、a + b = 200, c + d = 9800になります。
感度99%であれば、a + bの99%がaになるはずなので、aは200 x 0.99 = 198。bは差し引きでもいいし、1%で計算でもいいですが、2。
特異度98%であれば、c + dの98%がdになるはずなので、dは9800 x 0.98 = 9604。同様に計算して、cは196。
| Xウイルス感染あり | Xウイルス感染なし | |
| 検査キット陽性 | 198 | 196 |
| 検査キット陰性 | 2 | 9604 |
さて、二つの農場の検査結果が出ました。この結果を踏まえて、考察していきましょう。
検査後確率
まず各農場の結果をもう一度。
| A農場 | Xウイルス感染あり | Xウイルス感染なし |
| 検査キット陽性 | 7920 | 40 |
| 検査キット陰性 | 80 | 1960 |
| B農場 | Xウイルス感染あり | Xウイルス感染なし |
| 検査キット陽性 | 198 | 196 |
| 検査キット陰性 | 2 | 9604 |
これを踏まえて検査後確率を計算していきます。
A農場の陽性反応の適中率は、検査陽性になったのが7290 + 40 = 7330。そのうち真の陽性が7290なのですから、7290 / 7330 = 0.9945…なので、99%になります。つまり、検査が陽性であればほぼ確実に感染株です。
続いてB農場の陽性反応の適中率を計算してみます。検査陽性になったのが、198 + 196 = 394。そのうち真の陽性が198なのですから、198 / 394 = 0.5025…なので、50%になります。おや、同じキットを使っているのに、B農場では検査が陽性であっても半分しか合っていません…。
ということで、同じ検査キットを使っても、検査する集団が異なれば検査結果の信頼性は大きく変わってくるんですよね。だから、何でもかんでも検査すれば良い訳ではありません。B農場では検査陽性のうち半数は非感染株で、不必要な株を廃棄する羽目になります。
一応、最後に陰性反応の適中率も計算していきましょう。A農場の陰性反応の適中率は1960 / 2040 → 96%で、B農場の陰性反応の適中率は99.9%です。B農場の方が良いですね。ま、これも色々検査前確率や感度・特異度のパラメータをいじると大きく変化しますが、今回はそこが主眼ではないので多くは語りません。
まとめ
・感度と特異度の両方上げるのは無理です
・感度と特異度の両方が100%の検査はあり得ません
・検査結果は感度と特異度だけでは決まらず、検査前確率に大きく影響を受けます
・検査の目的を考えて、適切な評価をしましょう
