확률

1 개요

일정한 조건 아래에서 어떤 사건이나 사상(事象)이 일어날 가능성의 정도. 또는 그런 수치. 수학적으로는 1을 넘을 수 없고 음이 될 수도 없다. 확률 1은 항상 일어남을 의미하고, 확률 0은 절대로 일어나지 않음을 의미한다. ≒개연량ㆍ개연율. ㅡ 표준국어대사전

모든 경우의 수에 대한 특정 사건이 발생하는 비율이다. 눈금이 6개인 주사위를 던졌을 때 특정수가 나올 확률은 [math] {1 \over 6} [/math] . 로또에서 모든 경우의 수는 8,145,060. 한장 샀으면 당첨될 확률은 1/8,145,060. 서로 다른 번호 두장사면 2/8,145,060. 실제로 두장 사면 당첨 확률은 2배 높다!

보통 수학 외에서는, 0 ~ 1 사이의 소수 혹은 분수나 순열 등으로 나타내기 보다는, 다른 비율을 나타낼 때처럼 0~1 사이의 확률에 100을 곱하여 0~100 사이의 백분율(%)로 나타내거나 옛날처럼 할/푼/리로 나타내기도 한다.

"확율"로 잘못 쓰는 경우가 있다. 두음법칙이 적용되는 경우라고 잘못 생각한 듯. "확율"이라고 쓰면 "화귤"이라고 읽어야 한다.

1.1 확률의 고전적 정의

확률의 최초의 정의는 수학자 라플라스가 논문 Théorie analytique des probabilités에서 다음과 같이 내린 정의이다.

어떤 사건의 발생 확률은 그것이 일어날 수 있는 경우의 수 대 가능한 모든 경우의 수의 비이다. 단, 이는 어떠한 사건도 다른 사건들 보다 더 많이 일어날 수 있다고 기대할 근거가 없을 때, 그러니까 모든 사건이 동일하게 일어날 수 있다고 할 때에 성립된다.

즉 표본공간 S가 n개의 근원사건으로 이루어져 있고, 각 근원사건이 일어날 가능성이 같다면, 확률은 (근원사건의 개수)/n으로 주어진다는 고교과정에서 일반적으로 배우는 정의이다.

이 정의에서 가장 중요한 것은 '모든 사건이 동일하게 일어날 수 있다고 할 때에,' 의 부분으로, 즉 근원사건이 같은 정도로 기대되지 않으면 수학적 확률의 정의를 적용할 수 없다. 예를 들어, 길을 가다가 로또복권 하나를 산 뒤 ' 내가 로또복권에는 당첨된다와 당첨되지 않는다라는 두 가지 경우의 수가 있으므로 내가 로또복권에 당첨될 확률은 1/2이다.'라고 생각한다면 이는 잘못된 것이다. '로또복권에 당첨된다.'와 '로또복권에 당첨되지 않는다'라는 두 근원사건이 같은 정도로 기대되지 않기 때문이다. 수능시험의 수리영역에 출제되는 확률문제에서도 근원사건이 같은 정도로 기대되는가가 중요하게 작용하는 경우가 많다.

그러나 곰곰히 생각해보면 이는 완벽한 '정의'라고는 할 수 없다. 표본공간 S를 유한 개의 근원사건으로 생각할 수 없는 경우에는 이 정의는 당연히 무용지물이 된다. 즉 이는 이산적 상황에서만 성립하는 정의이지, 전체 확률의 의미를 대변한다고 할 수 없다.

1.2 기하학적 확률

라플라스의 정의를 약간 바꾸어서, 다음과 같은 정의를 생각해 보자. 어떤 시행의 표본공간 S가 평면의 어떤 영역이라고 하고, 각 근원사건인 S의 점들이 일어날 가능성이 모두 같다고 한다면, 사건 A의 확률은 (A의 넓이)/(S의 넓이)로 정의한다. 이런 식의 확률을 기하학적 확률(Geometric probability)이라 하고, 일반적으로 2차원인 평면 대신 n차원 공간에서 영역의 n차원 부피를 생각하는 식으로 쓰인다.

이는 역사적으로 위의 라플라스의 정의로 설명되지 않는 기하학적인 문제를 풀기 위해 발전하였고, 대표적인 예로 뷔퐁의 바늘 문제(Buffon's needle problem) " 일정 간격으로 떨어져 있는 평행선들 위에, 평행선들 사이의 간격과 길이가 같은 바늘 하나를 떨어뜨릴 때, 바늘이 평행선과 교차할 확률은 얼마가 되겠는가?" [1] 등이 있다.

물론 이 기하학적 확률도 정의라고는 볼 수 없는 것이, 라플라스의 정의가 설명하는 이산적인 상황은 설명할 수 없기 때문이다. 하지만 더 큰 문제는 정의 자체가 애매하다는 데에 있고, 이는 다음 베르트랑의 역설(Bertrand paradox)에서 나타난다.

원의 임의의 현을 잡았을 때, 그 현이 원에 내접하는 정삼각형의 한 변보다 길 확률을 구하라.

이 문제는 생각하기에 따라 1/3, 1/2, 1/4 등의 다양한 답이 나올 수가 있다. 이는 위의 정의에서 'S의 점들이 일어날 가능성이 같다면'이라는 조건이, S를 어떤 영역으로 생각하느냐에 따라 천차만별로 다를 수 있기 때문이다.
또 다른 문제는 조건부확률을 주는 문제가 있다. 만약 S의 부분집합 T를 생각해서, "T가 일어났을 때 A가 일어날 확률"을 생각한다고 하자. 이산적인 경우와 비슷하게 (A∩T의 넓이)/(T의 넓이)를 생각하면 될 것 같지만, T의 넓이가 0이라면 무슨 일이 일어나겠는가?

사실 기하학적 확률과 라플라스의 정의는 모두 고전적 확률론자들의 정의에 속한다. 고전적 확률론자들은 확률을 어떤 현상의 특징에서 도출된 연역적인 것으로 보았다. 예를 들자면 주사위는 육면이고, 각 면이 나올 가능성은 동일하다. 이러한 주사위의 두 특징에 의거하면 주사위를 던졌을 때 1이 나올 확률은 1/6이 된다. 이처럼 관찰 현상의 본질에서 연역적으로 도출할 수 있는 것으로 확률을 바라보는 관점을 고전적 확률론이라고 한다.

1.3 통계적 확률

확률을, 어떤 사건을 반복하였을 때(독립시행) 일어나는 상대 빈도수로 보는 것을 빈도적 확률(frequentist probability)이라 한다. 수학적으로 확률을 구할 수 없는 상황에서 항상 적용할 수 있다. 즉 어떤 사건이 발생할 확률이 0.7이다 라는 말을 고전적 확률론자들은 그 사건의 특성 때문에 연역적으로 그 사건이 발생할 확률이 0.7로 나온다고 보는 반면에 빈도론자들은 실제로 열번 던져봤더니 일곱 번 그 사건이 발생했었다고 보는 것이다. 빈도적 확률론은 확률을 귀납적으로 도출한 것이라 할 수 있다.

그런데 주사위를 반복해서 던져서 구한 빈도적 확률은 주사위를 반복해서 던지면 던질수록 고전적 확률에 가까워지는 것을 관찰할 수 있고, 이를 수학적으로 증명한 것이 바로 대수의 법칙이다.

빈도론자와 고전론자 모두 객관적 확률론자들이다.

1.4 베이즈 확률론(Bayesian probability)

확률을 현상의 관찰에 따른 주관적인 믿음에 기반하여 도출된 것으로 보는 주관적 확률론의 한 계파이다. 유명한 주관적 확률론자로 케인즈가 있다. 케인즈는 베이주주의 확률에서 한발 더 나간 확률 개념을 가지고 있다. 베이지안도 객관적 베이지안과 주관적 베이지안으로 나뉜다. 케인즈는 질적 베이지안으로 분류되기도 한다.

1.5 공리적 확률

수학적으로 명확히 정의된 공리적 확률(axiomatic probability)의 개념은 콜모고로프(Andrey Nikolaevich Kolmogorov, Андре́й Никола́евич Колмого́ров)에 의해 20세기 중반에서야 등장하였다. 이 공리적 확률은 단순히 말하면 확률을 측도론(measure theory)의 측도(measure), 즉 확률측도(probability measure)로 생각한다는 개념이다. 이는 위의 세 확률 개념과 맥락이 다르다. 위의 세 확률 개념은 확률의 현실적 의미에 관한 것이라면 공리적 확률은 숫자로 나온 확률을 계산하려면 확률 개념이 미분이나 적분과 같은 다른 수학적 개념들과 호환되도록 세팅이 되어 있어야 하기 때문에 만들어낸 수학적 개념이다. 이를 정확히 이야기하는 것은 생략하도록 한다.

공리적 확률의 특징은 모든 사건들에 확률이 부여되어 있다는 것이다. 이 확률은 가산개 집합에 대한 합의 법칙만 만족한다면, 자유롭게 주어질 수 있다. 또 하나는 근원사건에 전혀 의미를 두지 않는다는 것이다. 표본공간 S의 부분집합들의 모임을 사건공간(event space)로 생각한다는 것은 맞지만, 여기서 S의 개별 원소 즉 근원사건은 거의 의미가 없다. [2]

어쨌든 이 공리적 확률은 현대수학자들이 보통 생각하는 확률의 개념이고, 위의 두 정의(고전적 정의/기하학적 확률)을 포괄한다. 또한 큰 수의 법칙으로 인해, 이 공리적 확률이 현실에서의 통계적 확률과 이어진다는 것을 확인할 수 있다.

2 확률에 관한 것들

2.1 확률의 독립

독립된 사건의 경우, 이전에 했던 결과는 다음 시행에 전혀 영향을 주지 않는다. 예를 들자면, 주사위를 던져서 정말 우연히 6이 10번 연속으로 나왔다고, 그 다음으로 던졌을 때 6이 나올 확률이 높아진다거나, 혹은 도박 등에서 내가 돈을 계속 잃었다고 앞으로 돈을 딸 확률이 높아지는 것이 절대 아니라는 것. 따지고 보면 지극히 당연한 논리임에도 불구하고, 이를 간과하여 파산하는 사람들이 수두룩하다. 심지어 확률의 독립을 정확하게 이해하고 있는 사람들도 크게 다를 바가 없다! 연속으로 돈을 잃게 되면, 계속 돈을 부어도 확률은 같다는 이성보다는 '이만큼 잃었으니 이번에는 되겠지'라는 감성이 먼저 작용하는 것이 보통이기 때문. 즉 아예 도박이나 강화질 등을 멀리하는것이 답이다[3]

독립인 사건들이 동시에 일어날 확률은, 각각의 사건들의 확률이 곱해져서 작용한다. 즉, 동전과 주사위를 던져 동전이 앞면이 나오고 주사위의 눈이 1이 나올 확률은 1/2 * 1/6 = 정확히 1/12가 된다. 이를 뒤집어서 설명하면, 90% 확률을 가지고 있는 사건이라도, 그 사건이 10번 연속으로 성공할 확률은 (9/10)^10 = 34.86% 정도에 불과하다.

주의할 점은, 배반사건은 독립이 아니라는 점이다! 만약 수학 문제에서 "배반사건은 독립사건이다"라는 문항이 있다면 무조건 틀린 문장이다. 시비걸지 말고 과감히 틀렸다고 체크하자. 이런 곳에서 시간 아껴야 한다! 5개의 공 중에서 1개 뽑는데 1번 뽑히면 2번이 못 뽑힌다. 이것은 1번 공 뽑은 것을 2번 공 뽑는 사건에 결정적 영향을 주므로 배반사건은 종속사건 중에서도 극단적인 종속사건이다! 또한 "배반사건은 항상 독립사건이 아니다" 역시 틀린 문장인데, 이것은 공사건의 존재때문에 그렇다. 예를 들면 1부터 6까지 적힌 일반적인 6면체 주사위를 굴려 1이 나오는 사건과 7이 나오는 사건은 배반사건이면서 독립사건이다.

'번개에 맞을 확률이 로또보다 낮으므로 번개를 맞은사람은 로또를 사라'같은 오류도 흔하다. 번개맞는데 운을 다 써버렸기 때문에 효과가 없다 운 보존 법칙이 역시 번개를 맞을 확률과 로또에 당첨될 확률의 독립성을 간과한 오류. 번개에 맞았으면 로또 살 생각 하지 말고 병원에 가자

2.2 큰 수의 법칙

정해진 확률은 시행 횟수가 적을 경우 우연에 의해 기존 확률과 크게 벗어난 값을 가질 수 있으나 (예를 들어, 운 좋은 사람이 한 번만에 무기 아이템의 고 강화에 성공했다던지) 일정한 확률을 가지고 있는 사건을 계속적으로 반복해 시행하면 결국 시행하면 시행할수록 원래 확률에 가까워진다. 이것을 큰 수의 법칙이라 한다. 예를 들어, 주사위를 던져 1이 나올 확률을 구할 때, 한 다섯 번 쯤 던져 우연히 1이 3번 정도 나오거나 혹은 한번도 안 나올 확률이 있지만, 대략 수백만 번 이상 던지면 1이 나온 횟수는 전체 던진 횟수의 1/6에 가까워져 간다는 것. 위의 법칙과 맞물려, 카지노 등의 도박장에서는 딜러가 플레이어보다 대략 55:45 정도로 유리한 위치를 점하는 것이 보통이다. 그렇기 때문에, 우연히 카지노에서 돈을 번 사람이 자신의 운을 믿고 계속적으로 카지노 게임을 한다면, 궁극적으로 반드시 손해를 볼 수 밖에 없다. 도박 중독을 치료하거나 예방하는 가장 궁극적인 방법은 그 사람에게 정확한 확률이론을 가르치는 것일지도 모른다.

이 법칙을 실제로 확인(...)해본 학자들이 존재하는데, 프랑스 자연주의자 C.Buffon은 4,040번의 동전을 던져 2,048번의 앞면을 얻어 그 상대도수값이 2048/4040=0.5069가 됨을 알았으며, 2차 세계대전중 독일군에 의해 포로가 된 남아프리카 통계학자 J.Kerrich는 수용소에서 생활을 하면서 10,000번의 동전을 던져 5067번의 앞면 즉, 0.5067이라는 상대도수값을 얻었다. 1900년경 영국의 통계학자 K.Pearson은 24,000(...)번의 동전을 던져 12,102번의 앞면, 즉 0.5050이라는 상대도수값을 얻기도 하였다.

하지만 확률이 존재하기만 한다면, 즉 0만 아니라면[4] 아무리 말도 안되는 확률의 일이라도 일어난다. 연속으로 로또 당첨, 연속으로 낙뢰 당첨(...), 말도 안되는 게임의 고강 무기 등등이 존재하는 이유. 심지어는 흑인 백인 이란성 쌍둥이 같은 것도 태어나는 세상이다. 하지만 너는 아니에요

이와 같은 확률에 대한 오류는 도박사의 오류항목에 보다 자세히 설명되어 있으니 해당 항목을 참조할 것.

3 일상에서의 확률

3.1 매체에서 나타나는 확률

캐릭터를 지적으로 보이게 만드는 수단으로 확률을 사용하는 경우가 많다. 같은 말이라도 "널 죽일테다!" 라고 말하는 것보다 "당신은 86.7%의 확률로 저에게 살해당합니다." 라고 말하게 해서 좀 더 지적 능력과 논리혹은 중2병에 의존하는 것으로 보이게 하는 식이다. 가끔 미래를 예측하는 류의 캐릭터도 이런 식의 대사를 한다.

천원돌파 그렌라간에서는 확률변통탄이라는 무기가 존재하는데 맞을 확률 100%를 내려 결국 공격을 명중시킨다는 개념.필중? 이놈들은 확률조차 조정한다는 얘기인데, 워낙 작품자체의 전투가 초월적으로 가고 기합과 열혈로 이루어진 나선력으로 어떻게든 다 되는 작품이므로 과학적인 설정따위 없다.

작전의 성공률이나 합체, 혹은 문제 해결의 확률이 낮을 경우 이걸 당연스레 극복하는 것도 흔한 클리셰 중 하나이다.

이런 확률도 있다.

참고로 나무위키에서 랜덤을 눌러 원하는 항목 하나가 나올 확률은 1 나누기 항목의 총 개수, 즉 [PageCount]분의 1이다! 자신의 운을 시험해보고 싶다면 한 번 해보는 것도 재미있을 듯 하다. 하지만 직접 해보면 뻘짓이라는 것을 알게된다

3.2 게임에서의 확률

게임과 확률의 관계는 불가분적 관계(뗄레야 뗄 수 없는 관계)이다. 거의 모든 게임은 확률적인 요소를 가지고 있고, 이 확률이 유저의 흥망을 결정할 만큼 큰 영향을 끼치기도 하는 반면, 게임을 즐기는 데에 큰 영향을 주지않는 게임도 있으며, 자신의 실력으로 어느정도 확률을 조절할 수도 있다.

이를테면 RPG에서 고난이도 던전에 드디어 입문을 하여 필요한 아이템을 파밍하는데 될놈은 몇주, 몇달만에 모든 아이템을 맞추지만 안될놈은 몇년을 해도 다 못 맞추는 경우.

대표적으로 극악의 확률을 자랑하는 컨텐츠로는 강화, 가챠(뽑기)가 대표적이라고 할 수 있다.만악의 근원, 될놈될 안될안, 운빨좆망겜

이 확률이 게임에 끼치는 영향이 점점 커지자 게임에서도 아무리 운이 없더라도 특정 기간동안 열심히 한다면 자신이 원하는 아이템을 확정적으로 얻을 수 있는 시스템을 도입하고 있다.

슈로대엑스컴같은 확률기반 턴전술게임의 경우 컴퓨터가 사기를 치는게 아닌가 하는 확알못들의 의심이 끊임없이 나온다. 흔히 말하는 것이 '내 90%는 빗나가고 적의 10%는 잘만 맞는다' 인데, 이건 사실 농담조로 하는 이야기지만, 간혹 이걸 진지하게 믿고 괴논리를 펼치는 사람도 있다. 물론 게임을 하다보면 저런 어이없는 상황을 안 겪는것은 아니지만 수많은 확률계산 중 몇 번에 불과한 것이다. 그런 것이 더욱 기억에 남는것은 선택적 기억에 따른 것으로, 당연한 일들은 별로 기억에 남지 않지만 95%가 빗나가는 등의 특이한 일만 기억에 남겨져서 95%로 백 번을 공격해서 95번 맞추는 게임을 해놓고도 빗나간 5번의 기억만 생생한 것이다. 만약 특정 상황에서 정말로 확률 조작을 가할 경우, 발생하는 결과의 폭이 매우 좁아지기 때문에 플레이어는 마음만 먹으면 테스트를 통해 그것을 쉽게 밝혀낼 수 있으며, 코어게이머들에게 의해 파해되어 역이용을 당하기 십상일 것이다. 난수고정이 되는 슈로대 시리즈에서 일단 고명중기체로 적을 맞춰놓고 리셋한 다음 저확률 고위력의 공격을 해서 명중시키는 꼼수가 대표적. 여담으로 엑스컴의 경우 확률 조작이 있긴 있었지만... 알고보니 그게 저난이도에서 플레이어가 유리해지는(...) 조작이었다.

3.3 쪽지시험에서의 확률

  • 5지선다형에서 25문제를 모두 찍어서 맞힐 확률은 3.3554432e-18이며, 2지선다라고 해도 1/33,554,432이다. 이는 로또 당첨 확률(815만분의 1)보다도 더 낮다. 심지어 반타작할 확률도 고작 0.000293(0.0293%)이다. 0점 맞을 확률도 고작 0.003778이다. 안심 찍을 생각 같은 건 버리고 열심히 공부하자 웃긴건 0점맞는 사람보다 만점받는 사람이 더 많다. 빵점 맞는 법은 이름 안쓰기라 카더라.

4 관련 항목

  1. 이 문제의 답은 놀랍게도 원주율을 사용하여 2/π로 주어진다. 즉 바늘을 여러 번 떨어뜨림으로서 π를 추정할 수 있는 것.
  2. 심지어 사건공간의 원소로 생각되지 않을 수도 있다. 다만 complete probability space에서는 보통 completion을 통해 사건공간의 원소로 편입된다.
  3. 다만 게임에서 확률적으로 아이템을 강화시키는 경우, 게임제작자가 아이템이 강화될 확률이 이전에 강화에 성공했는지, 서버에 강화 아이템 물량이 얼마나 있는지 등의 여부에 영향을 받도록 프로그램을 만들어놨을 수도 있다 특히 일정 수치이상 강화하면 그 뒤 수치부터는 확률이 안보이는 경우. 즉 독립시행이라고 확신할 수는 없다는 얘기. 이는 컴퓨터를 사용하는 모든 도박에서 가능한 일이다. 그러니 인터넷 도박사이트 같은 곳에 현혹되지 말라는 것.
  4. 결과를 조작하는 외부의 간섭이 없다는 뜻도 된다. 로또 등의 경우 공의 무게를 조작하거나 해서 특정 번호가 뽑히거나 안 뽑히게 만들 수 있는게 사실.