新着記事

本・映画・雑記

【確率論】検査は本当に有効?なぜ何回も検査を行うの?Bayesの定理で数学的に考察してみた

2020年6月27日

広告

困っている人
困っている人

巷では,新型肺炎にまつわる検査に関して情報が錯綜していて混乱します.

そもそも,なぜ政府は国民全員に感染状況の検査をしないの?

全員検査に,反対する人もいるようで反対意見の論点がよくわかりません.

感染中の入院患者は3回陰性反応がでないと退院できないとも聞きました.なぜ何回も検査を繰り返す必要があるのでしょう?

Konyan
Konyan

こんにちは,Konyanです.

大きな母数集団の中で発生した事象に対する,検査結果の信頼性に関しては統計学が非常に有効です.

人は理性的であるようでいて,確率になると感情や直感に頼ってしまい間違った結論を出してしまいます.

困っている人
困っている人

医学でなくて,統計学(数学)で分かるのですか?

Konyan
Konyan

数学は,抽象的な理論と思われがちですが,抽象的な理論が具体的な事象に役立ち,また具体的な事象から抽象的な理論が構築できます.

本記事では,Bayesの定理という,与えられた条件下で起こった事象の確率を求める数学の定理を用いて解説します.

本記事で解説する内容は,感染病に対する検査の信頼性を,数学を用いて考察しています.
私は,医療に関する知識はなく,あくまで数学的にmodel化された事象として扱います.
現実の医療に関する情報は,専門家が発信されている情報源を参考してください.

Bayesの定理とは

犯人は何色?直感に反する確率

多くの人が直感が間違った結論を導いてしまう確率問題を紹介します.

ある街では,の2種類の色の車しか走っていない.
台数比率では,は80%,青の車は20%である.ある日,街中で一台の車が当て逃げ事故を起こした.目撃者一名は,車の色は「であった」という証言だ.
目撃者が車の色を正しく認識している可能性は90%である.(残り10%の確率で車の色を誤認するとする.)当て逃げ事故を起こした車が,目撃談通り色の車である確率はいくつでしょう?

 

斜に構える人
よくある
間違った答え

目撃者が「の車」を見ていて,

目撃者が正しく証言している確率が90%なのだから,

青色の車が当て逃げをした確率は90%だな.

Konyan
Konyan

答えは69%です.

言い換えると,目撃証言で「色」とありましたが,

31%の確率で「の車」が当て逃げをしたことになります.

目撃者一人の証言に頼りすぎると,間違える確率がこんなに高いんです!

もしも目撃者がいなければ(条件がなければ),「当て逃げをした車の色が白色であることは,20%である」と分かります.

面白いことは,目撃者という追加条件を加えることで,結果の確率が変化することです.

全部で4通りの場合それぞれ確率を計算しました.

  • 目撃談が,その通りの車が当て逃げをした確率 69%
  • 目撃談が,実際はの車が当て逃げをした確率 31%
  • 目撃談が,その通りの車が当て逃げをした確率 97%
  • 目撃談が,実際はの車が当て逃げをした確率 3%

観察されることは,母数が少数(車)に対する目撃者の証言が事実と解離する確率が高くなっています.

感染検査に問題文を読み替える

問題に出てくる,言葉を次のように読み変えていただけると,感染病検査に対する世間の錯覚が浮かび上がってきます.

車→人

→未感染者

→感染者

当て逃げ→感染

目撃者→感染検査

社会全体で感染者が少ない場合,検査結果で陽性となったとしても,「偽陽性」「偽陰性」の確率が問題になってきます.

問題文の設定に従うと,任意の車(被験者)が目撃者(検査)によって

  • 赤(未感染者)と判定される確率は,74%
  • 青(感染者)と判定される確率は,26%

お気づきだと思いますが,青(感染者)と判定される確率26%が,実際の青(感染者)の割合20%を超えています.

条件付き確率

ある事象が起きたこと条件下で,別の事象が起きる確率(条件付き確率)を教えてくれる定理こそが,Bayesの定理です.

既知のhintから推測して,既に起きた事象,これから起きる事象の確率を教えてくれます.

条件付き確率は,しばしば私たちの直感と反する結果を導きます.

別の言い方をすると,「なんとなく正しそう」という確率に対する感覚は一度疑ってかかった方が良いかもしれません.

Bayesの定理

数式を用いてBayesの定理を定式化してみます.

記号を導入します.

\(A, B\): 事象

\(P(X)\): 事象Xが起きる確率

\(P(B|A)\): 事象Aが起きた条件のもとで事象Bが起きる確率

このとき,条件付き確率\(P(B|A)\)は次の関係式を満たします.

$$P(B|A) \cdot P(A) = P(A \cap B)$$

特に,\(P(A)\neq0\)の場合は,よく知られた公式になります.

$$P(B|A) = \frac{P(A \cap B)}{P(A)}$$

日本語で表すと,事象\(A\)が発生した場合の事象\(B\)の起きる条件付き確率\(P(B|A)\)は,「事象が\(A\)起こるうち,事象\(B\)も同時に起きる事象はどのくらいか」を表しています.

おすすめのBays定理解説動画

『予備校のノリで学ぶ「大学の数学・物理」』channelより,Bayesの定理の解説動画を紹介します.

私は,個人的に黒板で解説してくれてるstyleが好きです.
黒板を書く速さがちょうど思考をまとめる時間に同期します.

Bayesの定理による確率計算方法

ここからは,当て逃げ犯の車の色問題をBayesの定理を用いて解いていきます.

発展的に,もし目撃者が複数人いたら,車の色の特定にどれだけ信頼性が増すか考察しています.

類推として,検査を複数回行うことで,感染症の確証を高める根拠になります.

目撃者一人の場合

次の章で一般化した議論をするために,記号をいくつか導入します.

少し記号で見えず楽なるかもしれませんが,適宜記号を具体的な数字に置き換えて計算をしていただけると実感が湧いてくると思います.

\(p_{r}= 0.8\): 車の色がである確率
\(p_{b}= 0.2\): 車の色がである確率
\(p_{t}=0.9\): 目撃者の証言が正しい確率
\(p_{f}=0.1\): 目撃者の証言が間違っている確率

Bayesの定理を使うと,

$$
\begin{eqnarray}
P(\text{車色 = 青}|\text{目撃証言 = 青})  &=& \frac{P(\text{車色 = 青} \cap \text{目撃証言 = 青})}{P(\text{目撃証言 = 青})} \\&=& \frac{p_{b} \cdot p_{t}}{p_{b} \cdot p_{t} + p_{r} \cdot p_{f}} = 0.69
\end{eqnarray}
$$
ここで,分母の計算ですが,
$$P(\text{目撃証言 = 青}) = P(\text{車色 = 青} \cap \text{目撃証言 = 青})+P(\text{車色 = 青} \cap \text{目撃証言 = 赤})$$
を用いました.

目撃者複数人の場合

問題の設定を一般化して,\(N\)名の目撃者が独立に同じ色を証言した場合の確率を考えてみます.

ある街では,の2種類の色の車しか走っていない.
台数比率では,は80%,青の車は20%である.ある日,街中で一台の車が当て逃げ事故を起こした.目撃者\(N\)名は独立に,車の色は「であった」という証言した.
目撃者が車の色を正しく認識している可能性は90%である.(残り10%の確率で車の色を誤認するとする.)当て逃げ事故を起こした車が,目撃談通り色の車である確率はいくつでしょう?

重要な仮定は,複数人の人が独立に証言をしたということです.

一人目撃者が,他の目撃者の意見に影響されている場合は考えません.

$$
\begin{eqnarray}
P(\text{車色 = 青}| N\text{人目撃証言 = 青})  &=& \frac{P(\text{車色 = 青} \cap \bigcap_{i=1}^{N}\{i\text{番目撃証言 = 青}\})}{P(N\text{目撃証言 = 青})} \\&=& \frac{p_{b} \cdot p_{t}^{N}}{p_{b} \cdot p_{t}^{N} + p_{r} \cdot p_{f}^{N}}
\end{eqnarray}
$$

目撃証言の信憑性は50%を超えている,つまり\(p_{t}>p_{f}\)ですので,十分大きい目撃証言を得られると,当て逃げ犯の車の色が青である確率が指数関数的に1(100%)に収束します.

例えば,\(N=2\)の場合,

$$
\begin{eqnarray}
P(\text{車色 = 青}| 2\text{人目撃証言 = 青})  =  \frac{p_{b} \cdot p_{t}^{2}}{p_{b} \cdot p_{t}^{2} + p_{r} \cdot p_{f}^{2}} = 0.95
\end{eqnarray}
$$

1人の目撃証言だと,犯人の車の色も青である確率は69%でした.

目撃者を2人に増やすことで,犯人の車の色も青である確率は大きく改善して95%となりました.

一人ひとりの証言者の信憑性を高めることはできませんが,独立な条件を重ね合わせることで比較的に信憑性を指数的に高めることができます.

正しくこの考え方が,感染検査の複数回検査にあるのです.(一回の検査信頼性は,決して高くないことの裏返しです.)

まとめ

条件付き確率,Bayesの定理の考え方の初歩を解説しました.

  • 母数が小さい対象に対する検査では,誤判断が確率的に発生してしまう(誤判断数も比例的に増えます)
  • 検査精度それ自体を改善できなくても,検査を繰り返すことで,高い確率で正しい判断ができる

この記事では解説しませんでしたが,他には調査対象を絞ることも有効です.

例えば,街全体では青い車は20%だが,事件の発生した地区では,青い車の率は60%であると,証言の信頼性が向上します.

感染病対策でいうと,人口あたりの感染者の数は少ないため,全数検査では偽診断の確率が少なくありませんが,既に感染症の傾向に絞ることで検査の精度が上がります.

私も新聞で見聞きする情報も,確率の考え方をすることで抽象的に俯瞰して感染対策の意味を読み解くことができます.

  • この記事を書いた人

こにゃん

【経歴】▶︎理系学問を専攻 ▶︎日本にて企業就職 ▶︎入社3年目マレーシア駐在 ●マレーシア駐在員 30代 ●英語 TOEIC 950点,中国語 HSK 5級(中国語の方が得意かも?) ●旅行好き,一番心に残っている旅は新疆(ウイグル) ●資産形成中 ■000万円,1億円資産ができたら経済的自由の道へ マレーシアお役立ち情報を発信しているので,Twitterもフォローしてね.

-本・映画・雑記
-

© 2021 コニャンのマレーシア赴任生活 Powered by AFFINGER5