몬티 홀 문제

(몬티홀 문제에서 넘어옴)

이 확률 문제 제목과 같은 스타크래프트 맵에 대해서는 몬티홀(스타크래프트) 문서를 참조하십시오.

1 개요

Monty Hall problem


사자왕이 설명하는 몬티홀 게임.깨알 같이 자신의 차가 포르쉐라고 자랑하는 사자왕

몬티 홀이라는 미국/캐나다 TV 프로그램 진행자가 진행하던 미국 오락 프로그램 《Let's Make a Deal》에서 유래한 확률 문제. 너무 유명해져서 구글에 몬티 홀이라고 검색해도 사람 대신 문제가 먼저 나올 정도이다. 최초로 수학 문제로서 제시된 것은 1975년의 일이고, 메릴린 보스 사반트가 1990년에 《퍼레이드》라는 잡지의 독자의 질문을 해결해주는 칼럼 '사반트에게 물어보세요'에서 이 문제를 다루면서 유명해졌다. 아래의 원문은 해당 칼럼에 실린 문제를 그대로 가져온 것이며, 상품의 종류 등의 디테일은 조금 바뀌기도 한다.

Suppose you’re on a game show, and you’re given the choice of three doors. Behind one door is a car, behind the others, goats. You pick a door, say #1, and the host, who knows what’s behind the doors, opens another door, say #3, which has a goat. He says to you, "Do you want to pick door #2?" Is it to your advantage to switch your choice of doors?

결승전, 당신 눈 앞에는 3개의 문이 있다. 문 하나의 뒤에는 승용차가 있지만 나머지 두 개의 문 뒤에는 염소만 있다. 당신이 문 하나를 고르자, 어디에 염소가 있는지 알고 있는 사회자가 나머지 두 문 중 하나를 열어 그 안에 염소가 있음을 보여준다. 사회자가 당신에게 선택을 바꿀 기회를 준다면, 당신은 선택을 바꿔야 하는가 바꾸지 말아야 하는가?

대부분의 사람들의 직관적인 생각에서는 선택을 바꾸든 바꾸지 않든 확률은 똑같이 1/2일 것이다. 당신이 최초에 한 선택 뒤에 염소가 있든 승용차가 있든, 염소가 있는 문은 한 개 또는 두 개가 남아있을 것이다. 사회자는 그걸 열면 그만이고, 남은 문은 무조건 염소 아니면 승용차일 테니 바꾸나 바꾸지 않으나 똑같을 것이다. 덧붙여 대부분의 사람들은 그냥 원래 선택을 유지하는 경우가 많은데, 괜히 바꿨다가 원래 선택한 문에 승용차가 있었으면 정말 억울할 테니 그러는 것이다.

이 문제의 정답은 바꾸는 경우에 승용차를 얻을 확률이 2/3로 더 높다. 여기서 중요한 전제 조건은 사회자는 어디에 염소가 있는지 알고 있어야 한다는 것이다. 문제를 조금 비틀어서 문 뒤에 무엇이 있는지 모르는 사회자가 남은 두 문 중에서 아무거나 열었고 만약 그때 사회자가 연 문 뒤에서 염소가 나온 경우에는 게임 참가자가 선택을 바꾸든 바꾸지 않든 승용차를 얻을 확률은 1/2로 동일하다.

2 바꾸는 쪽이 더 높은 이유는?

1/2가 아니라 2/3이 되는 이유에 대해서 직관적으로 이해가 되지 않는다고 좌절하지 말자. 이 문제가 대중적으로 가장 화제가 되었던 1990년도에 기네스 북에 높은 IQ로 등재된 보스 사반트의 칼럼 '사반트에게 물어보세요'에서 사반트가 이 문제에 대한 정답(2/3)을 제시했을 때 약 만 통의 편지를 받았고 그 중 약 천 통은 수학이나 공학에서 박사학위를 가진 사람들이 틀린 답에 항의하는 내용의 편지였다.

이 문제에 대한 시각적인 해답은 경우의 수를 다 따져서 표로 작성해보는 것이다. 직관적인 해답은 사회자가 두개의 문 중에서 하나의 문을 열어서 염소를 보여준다는 행위 자체가 열지 않은 다른 문에 승용차가 있을 확률을 높여주기 때문이다. 즉 오답 하나를 제거함으로써[1] 열지 않은 문에 대한 정보를 추가로 제공하는 셈이다.

이해를 못해도 여기에 가면 시뮬레이션을 해 볼 수 있다.[2]

간단히 말해 만약 당신이 무조건 선택을 그대로 밀고나간다 하자. 그럼 처음에 반드시 제대로 골라야 된다. 사회자가 열어주는 문은 계산할 것도 없이 말이다. 즉 이 경우엔 맞힐 확률은 1/3이 된다.

반대로 당신이 무조건 선택을 바꾸기로 마음먹었다고 하자. 만약 처음에 자동차가 있는 문을 골랐다면, 당신은 꽝을 얻게 된다. 사회자는 나머지 두 개의 꽝이 있는 문 중 아무거나 하나를 열어서 보여줄 것이고 말이다. 만약 처음에 꽝이 있는 문을 골랐다면? 그러면 당신은 당첨이 된다. 사회자가 꽝이랑 당첨이 있는 문에서 꽝을 보여주고 나면 남는 하나는 당첨이기 때문이다.

즉 무조건 선택을 바꾸기로 마음먹었다면, 처음에 반드시 꽝을 골라야 한다. 그리고 그 확률은 3분의 2다.

요약하면

선택을 바꾸지 않은 상태로 자동차를 얻을 확률

= 처음부터 자동차가 있는 문을 찍을 확률
= 1/3

선택을 바꾸면 자동차를 얻을 확률

= 처음에 꽝을 고를 확률
= 2/3(여기서 중요한 점은 사회자가 오답을 바꾸는 과정에서 오답을 지워주기 때문에 내가 처음에 꽝을 뽑았을때, 바꾸기만 하면 차가 보장된다는 것이다. 고로 바꿔서 차를 얻으려면 초반에 꽝을 뽑아야 한다.)

표로 설명하면

세 문을 각각 A, B, C 라고 하고 승용차가 A 뒤에 있다고 가정하면, 각각의 문을 고른 뒤 선택을 바꾼 경우와 안 바꾼 경우의 당첨/꽝(O/X) 결과를 다음 표와 같이 나타낼 수 있다.

선택ABC
바꿈XOO
안 바꿈OXX

위 표에서 '바꿈' 행과 '안 바꿈' 행을 비교해보면 선택을 바꾸는 경우 당첨 확률이 2/3이고, 선택을 바꾸지 않는 경우 당첨 확률이 1/3임을 알 수 있다. 그러므로 선택을 바꾸는 쪽이 더 유리하다고 할 수 있다.

참 쉽죠?

다른 방식으로 설명하자면, 문을 바꾸지 않으면 당신은 1/3 확률의 선택을 한 것이고, 문을 바꾸는 순간 당신은 두 번 선택을 한 것이므로 2/3의 확률을 가지게 된다.

3 그 외의 증명법

직관을 동원하는 다른 방식으로 설명하자면, 만약 문이 100개 있다고 했을 때 당신이 문 하나를 고르고 사회자가 98개의 오답을 걸러버리는 경우를 상상해보면 된다. 당신이 처음 아무거나 고른 문과, 현재 사회자가 선정해준 문 중 어느 게 정답일 확률이 높을지 직관적으로 이해할 수 있다.

그 외에도 매우 많은 종류의 증명이 존재한다. 베이즈 정리를 써서 증명한다든가, 혹은 컴퓨터 시뮬레이션으로 무지막지하게 계속 시행한다든가...[3] 사람 머리가 나쁘면 CPU가 고생한다(?)

덧붙이자면 컴퓨터 시뮬레이션으로 굳이 "무지막지하게" 계속 시행할 필요는 없다. 중심극한정리가 잘 적용되는 사례이기 때문에 수렴 속도도 빠르며, control variate 같은 기법을 사용하면 더더욱 빠르게 답을 구해볼 수 있다.

4 사람들의 오해

3번에 자동차가 있다고 하면,

-1번을 골랐을 경우에는 자동차가 없다. 그러므로 사회자가 염소가 있는 문을 연다면 2번 문을 열 것이다. 남은 문이 3번이므로 바꾸면 유리하다.
-2번을 골랐을 때도 자동차가 없다. 그러므로 사회자가 염소가 있는 문을 연다면 1번 문을 열 것이다. 남은 문이 3번이므로 바꾸면 유리하다.

여기까지는 아무 문제가 없어 보인다. 그런데...

- 3번 문을 골랐을 때는 사회자가 두 가지 선택을 할 수 있다.
- 1번 문을 열었을 때 남은 문이 2번이므로 바꾸면 불리하다.
- 2번 문을 열었을 때 남은 문이 1번이므로 바꾸면 불리하다.

그러니까 요지는 뭐냐 하면, 경우의 수는 4인데 유리한 경우는 2가지이므로 확률은 2/4=1/2다!

이 증명이 틀린 이유는, 애초에 경우의 수는 1번 문을 고르느냐, 2번 문을 고르느냐, 3번 문을 고르느냐 세 가지밖에 없기 때문이다. 자동차가 든 문을 골랐을 때 사회자가 어떤 문을 선택하느냐는 사실 고려 대상이 아니다.

이는 확률로 계산해보면 더욱 명확해진다. 위와 같은 경우, 즉 3번 문에 자동차가 들어 있는 상황이라고 할 때,

- 1번 문을 고를 확률이 1/3.
- 2번 문을 고를 확률이 1/3.
- 3번 문을 고를 확률이 1/3인데,
  • 사회자가 1번 문을 열어 줄 확률은 3번 문을 고를 확률 X 1번 문을 열어줄 확률(1/3 X 1/2) = 1/6
  • 사회자가 2번 문을 열어 줄 확률은 3번 문을 고를 확률 X 2번 문을 열어줄 확률(1/3 X 1/2) = 1/6

이해가 가시는가? 만약 위의 증명이 맞다고 하면 참가자는 뭐에 홀린 듯이, 염소가 있는 문을 선택할 확률과 자동차를 선택할 확률이 같아야 한다. 즉, 염소가 있는 문을 고를 확률 1/4(X2), 자동차가 있는 문을 고를 확률 1/2가 되어야 위의 증명이 성립한다고 할 수 있다.

그런데 여기서 조건부 확률이란게 참 기묘한게, 말 한마디 주어진 상황이 아주 조금만 바뀌어도 상황이 틀어진다. 같은 상황에서 몬티 홀이 문을 열때 오답을 전혀 모르고 있는 상태라고 전제조건을 바꾸어 생각해보자. 즉, 몬티홀이 열었을때 자동차가 나올수도 있는 상황이었다면, 사회자가 고른 문 뒤에서 무엇이 나올것인가가 고려대상이 포함되어 버리기 때문에 몬티홀이 먼저 염소가 있는 문을 열었더라도 이 경우만큼은 당첨자 뒤에 포르쉐가 있을 확률은 1/3이 아니라 1/2이 맞다!뭐 X발? 혹시 의심이 간다면 표를 그려서 확률을 계산해 보길 바란다. 사회자가 오답을 모르는 상태라면 진짜로 1/2가 나온다!

그 차이를 알고있냐 모르고있냐에 따라 문제가 확확 바뀌기 때문에 명확한 해결이 나온 아직도 이 문제에 대한 의견이 갈리게 되는 것이다. 몬티홀이 오답을 알고있을 경우에는 상술했듯이 확실히 아니라는 경우의 수 중에 하나는 오답이라고 확실히 인지시켜줌으로써 확률에 변화가 가해지지만, 모르고있던 상태에서 염소가 나왔다면 그 경우의 수를 아예 배제하고 확률을 새로 계산해야 하므로 계산 방법 자체가 달라진다. 위의 사자왕 동영상 후반부 설명에도 나와있듯이 경찰대학교 문제에서 이런 전제조건을 다르게 생각하고 문제를 내서 논란이 된적이 있었다고 한다.

물론 원래 문제에서 몬티홀은 오답을 알고 있었으니 시청자에게 오답인 상황을 하나 빼준다는 전제조건이 깔린 상황이라 바꾸는게 2/3이 되는 게 맞다. 이렇듯 몬티홀에 대한 오해와 견해차는 '문제에서 명시되지 않은 부분'을 어떻게 생각하고 있느냐에서 비롯한다. 사람들이 거의 무의식 중에 문제를 의심하면서 '문제 밖의 전제'를 각자 설정하는 경우가 적지 않은 것. "이렇게 되면 어떻게 되는데?" 하는 것은 정말 그렇게 되었을 때에나 따로 논해야 하는데, 문제에는 나오지도 않은 설정을 당연하다는 듯이 자기 머릿속에만 넣어 놓고 있으면 논의가 진전하지 못할 수밖에 없다. 몬티홀 문제는 규칙을 숨겨 놓고 틀리게 만드는 넌센스 퀴즈가 아니다. 규칙은 문제 안에 다 나와 있다. 바로 위의 사례도 그렇지만 '사회자'에 집착하는 경우가 있는데 사회자의 존재를 그냥 지워버리고 기계의 알고리즘으로 대체해도 문제는 달라지지 않는다.

5 확률의 정의

요약하자면 사람들이 흔하게 하는 오류는 이런것이다.
1번 선택 -> 하나의 문이 열림 -> 그 상태에서 가능한 경우의 수는 1번 선택문에 정답이 있거나 오답이있거나. -> 2가지 경우의수. -> 확률의 수학적정의 해당경우/전체경우 -> 0.5
대부분의 사람들이 생각한 0.5가 오류인 이유는 고등학교 교과과정에서 정의된 확률의 정의의 가정에 있다. 해당경우/전체경우를 확률로 정의할 때 분명히 앞에 "같은 확률로 일어나는 사건에 대해서" 라는 가정이 있었다.(아무도 눈여겨 보진 않겠지만) 즉 2가지 경우 기존 선택이 옳은 경우와 바꾼 선택이 옳은 경우는 동등한 정도로 일어나지 않기 때문에 1/2로 계산하면 당연히 틀린다. 답부터 말하자면 두 경우가 1:2의 가중치를 가진다. 즉 바꾼 선택이 옳은 경우가 기존 선택이 옳은 경우에 비해 2배 더 잘 일어나고 그래서 3의 가중치 중 2의 가중치를 가진 바꾼 선택이 2/3확률로 유리하게 되는 것이다.
왜 이렇게 되는지 살펴보자. 주어진 상황은 오로지 내가 뭔가를 선택했고 남은 2문중에 오답하나가 열렸다는 것이다. 이상황에서 생각할 수 있는 모든 경우의 수를 생각해보자. 편의상 3번에 정답이 있는 경우에 대해 생각해보면, 지금 일어난 상황은 (내가 선택한 문, 몬티홀이 열어준 문)의 순서쌍으로 도식화할 수 있다.
즉 (1,2) (2,1) (3,1) (3,2) 이 4개중에 하나가 일어났음이 틀림이 없다.
여기서 (1,2)가 일어날 확률은 1/3 * 1 이다.
(2,1) 1/3*1 이다.
(3,1) 1/3*1/2 이다.
(3,2) 1/3*1/2 이다.
보이는가? (1,2)가 일어날 정도와 (3,1)이 일어날 정도는 같지않다! 여기서 수많은 사람들이 낚이고 제대로 설명 못하는 것이다.
가중치로 설명하자면, (1,2)과 (2,1)은 2 정도로 일어나고 (3,1)(3,2)는 1 정도로 일어나는 것이다. 이 상태에서 (1,2) (2,1) 즉 4의 비중에선 바꾸는 것이 정답으로 이어지고 (3,1)(3,2) 2의 비중에서는 고수하는 것이 정답으로 이어진다. 그렇기 때문에 바꾸는 것이 4/6의 정답률을 가져다주므로 유리하다.

6 대중 매체에서의 등장

  • 웹툰 정글고의 명왕성(정글고등학교)사다리타기를 하다가 위의 이론대로 선택을 바꾸다가 매점에 가서 음료수를 사야 했다. 여기서 이 항목에 대해 잘 모르는 사람들은 명왕성이 불사조의 어설픈 심리전에 낚였다고 생각하기 쉽지만 선택을 바꾸는게 확률이 높아진다는 계산 자체는 맞았다. 단지 이 사다리타기에서는 당첨이 2개고 꽝이 1개였을 뿐. 애초에 누가 음료수 사는지 정하려고 사다리타는 거자나 . 지식은 불사조에 버금가면서 상식적인 방향으로 머리가 안돌아가는 명왕성의 특성이 돋보이는 에피소드다.
  • tvN 문제적남자 34회에서 장진이 뽑은 미디어 속 뇌풀기문제로 출제되었다.
  • 미래앤 확률과 통계 교과서에 나와 있다.
  • 일본의 수학 교양소설 수학 걸 4권 - 확률적 알고리즘(Randomized Algorithms)의 주제가 몬티 홀 문제NP-완전 문제이다.

7 참고

'왜 월요일은 빨리 돌아오는 걸까'라는 책에 의하면, 정작 이 문제의 어원이 된 오락 프로그램인 몬티홀에서는 당첨을 선택할 때 사회자가 꽝이 있는 문을 열어서 보여주거나 한 적이 없다고 한다.

마틴 가드너가 쓴 이야기 파라독스에서는 몬티홀 문제와 비슷한 듯 다른 문제가 실려있다.

  • 3개의 컵을 엎어놓고 그중에 동전이 들어있는 컵을 찾는 야바위 놀이에서 행인이 '승률이 1/3밖에 안되니 돈을 걸지 않겠다'고 하니 야바위꾼이 플레이어가 컵을 하나 고르면, 셋 중에 동전이 들어있지 않은 컵을 하나 열어 보여주겠다는 제안을 한다. 그러면 플레이어의 승률은 올라가는가? (물론 속임수는 없다고 가정)
얼핏 생각해보면 컵 하나를 제거한 순간 남은 컵은 둘 뿐이니 돈을 딸 확률이 1/2로 증가하는 게 아닌가 하는 생각이 들기도 한다. 그러나 이 경우에는 몬티홀 문제와는 달리 플레이어에게 선택할 컵을 바꿀 기회를 주지 않고 있다. 그러니 이 룰을 추가하든 하지 않든 플레이어의 승률은 1/3 그대로 고정되고 확률이 바뀔 리 없다. 이 야바위꾼 머리좀 쓰네

몬티홀처럼 직관적으로 내린 결론이 실제 수학적 답과 다른 또다른 문제. 문제는 다음과 같다.

  • 조커를 뺀 52장의 트럼프 카드 뭉치에서 카드 한장을 뽑아 확인하지 않고 바로 덮어두었다. 그리고 이후 무작위로 3장의 카드를 더 뽑았는데, 3장 모두 다이아였다. 이 때 처음 뽑은 카드가 다이아일 확률은?

일반적으로는 처음 카드를 뽑을 때를 기준으로 13/52=1/4이라고 생각하겠지만, 정답은 확인하지 않은 카드 중 다이아를 뽑을 확률과 같은 10/49이다.

후행사건의 결과에 의해서 선행사건의 확률이 바뀐다는 것이 일반적인 사고로는 납득되기 어려울 것이다. 위에서는 1/2 쪽이 직관적이라더니? 이는 이후에 뽑은 3장의 다이아 카드가 무작위[4]로 뽑은 카드이기 때문으로, 정확한 확률 계산법은 다음과 같다.

(뽑은 총 4장의 카드가 모두 다이아일 확률)/(이후에 뽑은 3장이 모두 다이아일 확률)[5]


더 간단하게 생각해보자면, 문제에서는 3장을 뽑은 것이 다이아였는데, 만약 4장이나 5장이었다면 어땠을까. 그래도 4분의 1이라고 생각될지도 모른다. 하지만 12장이라면? 더 나아가 13장이었다면? 즉 52장의 카드뭉치에서 1장을 무작위로 뽑은 다음, 나머지 카드 중에서 13장을 무작위로 뽑았는데 전부 다이아였다면 먼저 뽑은 1장이 다이아일 확률은?

이해하기 위한 다른 방법으로는 저 3장을 뽑았더니 다이아 카드였다는 것을 사건이 아닌 힌트라고 생각하는 방법도 있다. 이렇게 정리하면 다음과 같은, '확률'이 뭔지에 대해 배우면 초등학생이라도 풀 수 있는 쉬운 문제가 된다. 문제 : 13장의 카드에 1부터 13까지 숫자가 적혀있다. 카드를 잘 섞고 1장을 빼서 보지 않고 덮어두었다. 나머지 카드 중에서 3장을 뽑아보니, 각각 3, 5, 8이었다. 뒤집어져있는 카드가 1일 확률은?

사실 몬티홀과 비슷한 문제는 아들 딸 문제란게 더 유명하다. 'A씨에겐 자식이 2명 있다. 그런데 어느 날 A씨가 내겐 딸이 있다고 알려준다면 A씨 자식이 딸만 둘일 가능성은 얼마인가?' 몬티홀 문제의 해설자가 꽝을 알고 있고 꽝을 공개해야 하는 것처럼 A씨가 자식의 성별을 모두 알고, 딸이 있는 경우 항상 딸이 있다고 밝힌다면(신랑감을 구할 목적이라던가 하는 이유로) 답은 1/3이 되겠지만 그냥 아무나 되는 대로 골라서 성별을 말했는데 우연히 딸인 경우라면 사회자가 아무문이나 열었는데 염소가 있는 경우처럼 1/2이 된다.

이렇게 직관적인 결론과 수학적으로 풀이한 결론이 일치하지 않는 이유는 선행 사건과 후행 사건이 서로 영향을 주지 않고 따로 노는 독립사건이 아니라, 선행 사건에 의해 후행 사건이 일어날 확률이 영향을 받는 종속사건이기 때문. 한 사건과 관련이 있는 사건의 정보가 주어지면 해당 사건이 일어날 확률은 달라지게 된다.

양자역학을 일반 상식으로는 이해할 수 없는 것도 이러한 확률의 변화와 관련이 있다. 한 사건이 일어날 확률을 구함에 있어 확률의 변화가 수반되는 경우 눈에 보이는 사건이라도 혼동되기 마련인데, 눈에 보이지 않는 사건이라면 두말하면 잔소리다. 양자역학에서는 관찰이라는 행위도 관찰하고자 하는 사건과 관련된 하나의 사건으로 취급되므로 관찰하고자 하는 사건의 확률에 영향을 주게 된다. 즉, 관찰 행위(선행 사건)가 관찰하고자 하는 것(후행 사건)에 직접 영향을 주어 사건의 결과를 달라지게 한다는 말이다. 이를 파동함수의 붕괴라 하는데, 파동함수는 확률밀도 함수의 일종[6]이므로 파동함수가 붕괴한다는 것은 쉽게 말해 방정식 자체가 달라진다는 것이므로 그 파동함수를 통해 도출되는 결과값. 그러니까 관찰하고자 할 사건이 일어날 확률이 당연히 변하게 된다. 이 때문에 양자역학에서는 관찰 행위가 결코 무시될 수 없는 것이다.

전설적인 수학자 폴 에어디쉬도 선택을 바꾸든 아니든 확률은 같다고 생각했고, 컴퓨터로 실험해본 뒤에야 바꾸는 것이 유리한 선택임을 인정했다고 한다. 참고로 에어디쉬는 20세기 후반 최고의 수학자라 불러도 과언이 아닌 사람.

  1. 사회자가 정답을 알고 있는가는 크게 중요하지 않다. 오답만 알고 있으면 된다. 무대 뒤에 있는 사람이 팻말을 들어 알린다거나 하는 식이어도 무방하다. 정답을 아는 사회자와의 심리전이라든가, '정답을 모르는 사회자가 문을 열었는데 거기서 승용차가 나와버릴 확률' 같은 것은 고려할 필요가 없다.
  2. IE11, 크롬 등에서 접속 시 작동하지 않는다며 경고창이 표시되지만 문제없이 작동한다. 자동차는 무조건 왼쪽에 있다.
  3. 이를 몬테카를로 시뮬레이션 이라고 한다.
  4. 만약 뽑은 사람이 자기가 뽑을 카드가 다이아일 것을 미리 알았다면, 애시당초 '다이아몬드' 세 장을 첫 장 뒤에 놓았다는 것, 이 전제가 되므로 선행사건과 후행사건에 대한 착각이 벌어지지 않는다.
  5. [math]\displaystyle{ \frac{1}{4}\times\binom{12}{3} \over \frac{1}{4}\times\binom{12}{3} + \frac{3}{4}\times\binom{13}{3}}=\frac{10}{49} [/math]
  6. 한 사건의 확률을 구하는 엄청나게 복잡하게 생긴 방정식이라고 생각하면 된다.