베이즈 정리

상위 항목: 통계학, 확률론, 수학 관련 정보

1 개요

베이즈 정리는 1740년대의 영국의 목사인 토머스 베이즈(Thomas Bayes)가 만들었다. 베이즈 정리는 이전의 경험과 현재의 증거를 토대로 어떤 사건의 확률을 추론하는 알고리즘이다. 예를 들면 전세계 인구 중 1%정도의 사람들이 어떤 병 I를 앓는다고 알려져 있는데, 병 I를 앓고 있는지를 판정하는 정확도가 90% 검사기가 있고, 어떤 사람이 이 검사기로 검사를 시행해서 양성판정이 나왔다면, 이 사람이 병 I를 앓고 있는 것일 확률은 얼마냐는 것이다. 베이즈 정리에 따르면, 이 확률은 약 8%이다. [1]

2 베이즈 정리

사건 A가 있고 사건 B가 있을 때 사건 B가 일어난 것을 전제로 한 사건 A의 조건부 확률을 구하고 싶다. 그런데 지금 알고 있는 것은 사건 A가 일어난 것을 전제로 한 사건 B의 조건부 확률, A의 확률, B의 확률뿐이다. 그럴 때 다음과 같이 구할 수가 있다. [math]\displaystyle P(A|B) = {P(A)P(B|A)\over {P(A)P(B|A)+P(A^c)P(B|A^c)}} [/math]

사실 이것은 매우 단순한 경우로, 고등학교 확률문제에서도 나온다. 예를 들면, 주머니 속에 당첨제비가 3장, 꽝이 7장 들어있을 때, 갑이 1장을 뽑고 확인은 하지 않고 자기가 갖고 있는다. 그다음에 을이 1장을 뽑았는데 당첨이었다. 이때 갑도 당첨이었을 확률을 구하는 것인데, 갑이 당첨인 사건을 A라 하고 을이 당첨인 사건을 B라 한 다음 위 공식에 따라 계산하면 확률은 [math]\displaystyle {2\over 9} [/math] 라는 것을 알 수 있다.

좀더 일반적인 베이즈 정리는 다음과 같다.
n개의 사건 [math] A_1, A_2, ... , A_n [/math] 이 표본공간 [math] S [/math] 를 분할할 때, 공사건이 아닌 사건 [math] B [/math] 에 대하여 [math] P(B) [/math] 는 확률의 덧셈정리에 의하여 [math] P(B)=P(B\cap A_1)+P(B\cap A_2)+...+P(B\cap A_n) [/math] 를 만족하고, 이는 확률의 곱셈정리에 의하여 [math] P(B)=P(A_1)P(B|A_1)+P(A_2)P(B|A_2)+...+P(A_n)P(B|A_n) [/math] 와 같이 나타낼 수 있다. 이런 상황에서 사건 [math] B [/math] 가 일어나는 것을 전제로 한 사건 [math] A_i [/math] 의 조건부 확률은 다음과 같이 구할 수 있다.

[math]\displaystyle P(A_i|B)={P(B\cap A_i)\over P(B)}={P(A_i)P(B|A_i)\over {P(A_1)P(B|A_1)+P(A_2)P(B|A_2)+...+P(A_n)P(B|A_n)}} [/math]

위 식이 가지는 의미는 이렇다. 이전에 알고 있던 정보에 새로 습득한 정보를 조합해 이를 바탕으로 사후확률을 예측하고 결정을 내린다. 사후확률은 갱신된 이전 정보가 되고 여기에 또 다른 정보가 추가되면 사후 확률도 갱신된다. 이는 사람이 부지불식간에 세상을 해석하고 의사결정을 내리는 과정과 닮았다. 즉 사람의 뇌는 불확실한 세계에서 주어진 정보를 토대로 최적에 가까운 의사결정을 내리게 진화해 왔다는 것이다.

우리가 주변 세상의 변화에 적응해 살아갈 수 있는 것은 뇌가 끊임없이 들어오는 정보를 베이즈 정리의 방식으로 반영하면서 자신을 업데이트하기 때문이다. 베이즈는 확률에 기초한 사고도 합리적이라고 주장했다. 베이즈 정리에는 우리가 우주에 대해 점점 더 많은 정보를 모을수록 우주의 진리에 대해 한 걸음 더 가까이 다가갈 수 있다는 그의 수학적, 철학적 믿음이 표현돼 있다.
  1. 정확하게는 ((1/100)*(9/10))/((1/100)*(9/10)+((99/100)*(1/10))=0.08333...해서 약 8.3%이다.