큰 수의 법칙

1 본문

Law of Large Numbers(LLN)[1]

어떤 시행에서 사건 A가 일어날 수학적 확률이 [math]p[/math]이고 [math]n[/math]번의 독립시행에서 사건 A가 r번 일어난다고 할때 임의의 [math]\epsilon\gt0[/math]에 대하여 [math]\displaystyle \lim_{n\rightarrow\infty} P\left(\left| \frac{r}{n} -p \right| \lt\epsilon \right)=1 [/math]이다.
서로 독립인 확률변수 [math]X_1, X_2, \cdots , X_n[/math]이 평균이 [math]\mu[/math]인 동일한 확률분포를 따를 때, 임의의 [math]\epsilon\gt0[/math]에 대하여 [math]\displaystyle \lim_{n\rightarrow\infty} P\left(\left| \frac{1}{n}\sum_{k=1}^{n}X_k -\mu \right| \lt\epsilon \right)=1 [/math]이다.

간단히 말하자면 표본 숫자가 많을수록 실사건의 확률이 통계적 예측에서 오차가 줄어간다는 것이다. 수학적 확률과 통계적 확률을 이어주는 굉장히 중요한 법칙이다. '당연한 소린데 무슨 법칙이라고 그럴듯한 이름까지 지어주었을까'라고 생각하겠지만 사실 당연하니까 법칙인 거다. 현대 과학에 있어 뉴턴의 운동법칙, 질량 보존의 법칙만큼이나 구속력, 공신력이 강한 법칙이다. 어쩌면 저 2개의 법칙과 함께 현대 자연과학의 근간 중 하나로 봐도 손색없을 정도로 중요한 법칙이지만, 특정인이 발견해낸 것이 아니기에 잘 알려지지 않은 법칙이다.


별게 아닌 것 같지만 생각보다 이게 중요한게 이 법칙을 적극적으로 활용하여 현실에서 많은 돈을 벌어들이는 경우도 있다. 카지노에서 하우스측이 돈을 벌어들이는 것도 이 법칙을 잘 활용한 덕. 카지노의 룰렛 게임을 예로 들자면 룰렛에서 '검정,빨강' '홀수,짝수'에 돈을 걸어 성공한 경우 2배의 금액을 받는다. 숫자는 당연히 홀수 아니면 짝수고 색도 검은색 아니면 빨간색 밖에 없으므로 2배의 금액이면 기대값이 1일 것 같으나 실제로는 0과 00이 있어 1에 미치지 못한다. 간단히 말하자면 이길 확률이 50%일 것 같은데 실제로는 47%정도의 승률이라는 것. 카지노 측은 바로 여기서 대수의 법칙을 활용하는 것이다. 고객 개개인은 게임을 몇번 하는 정도이지만 카지노 측의 입장에선 이 게임을 수만번은 행한다는 점에서 고객 몇명에게는 돈을 조금 빼앗기나 고객 전체에게는 엄청난 돈을 받아낸다는 것이 가능하다. 물론 노골적으로 심하게 승률이 낮으면 아예 손님이 모이지 않으므로 승률은 미묘하게 높게 해놓고 많은 게임, 또는 도박에 거는 금액을 높여 결론적으로 벌어들이는 양을 늘린다.

좀더 일상적인 예시를 들자면, 어떤 남성이 길거리를 지나가는 여성에게 접근하여 연락처를 따낼 가능성이 1/100 정도라고 할 때 성공이 불가능해 보이겠으나, 수없이 많이 도전한다면 1/100 정도는 거의 무조건 성공한다는 것.[2]

수능이나 과거 삼성그룹 SSAT가 공정하다는 소리를 듣는 이유가 모집단이 그만큼 많아서이기도 하다. 예외는 모집단을 줄이는 효과가 있다. 출제과정의 유출 등은 별론이겠지만.

반대의 개념으로 '소수의 법칙'(少數 작은 수)이 있는데[3] '경우의 수가 충분히 많으면 확률에 근접한다'라는 대수의 법칙의 반대로 '경우의 수가 충분히 많지 않으면 확률에서 벗어날 가능성이 높다'라는 것. 소수의 경우라면 동전 열개를 던져서 9번이 앞면일 수도 있고(즉 90%가 한쪽이다), 한번이라면 실력없는 아마추어가 프로를 이겨[4] 승률이 비정상적일 수도 있다. 그러나 경우의 수가 많아진다면 대수의 법칙으로 인해 동전 앞면이 나온 비율은 거의 무조건적으로 1/2에 수렴하고 (실력없는) 아마추어가 프로를 이기는 비율도 매우 줄어든다. 이러한 성향은 마작 같이 미묘한 곳에서 승부가 갈리는 게임에서 아주 잘 드러나는데, 특히 프로마작의 경우 승률 30%만 넘어도 고수, 40%만 되어도 고릴라#s-6라는 소리를 들을 정도이다. [5]

프로야구계의 명언 내려갈 팀은 내려간다는 이 큰 수의 법칙을 반영한 과학적인 발언이다. 초반에는 전력이 약한 팀도 높은 승률을 기록할 수 있지만 경기수가 많아질수록 큰 수의 법칙에 따라 원래 실력대로 수렴하여 하위권으로 내려가게 된다.[6] 던파확률의 법칙이나 천봉의 조작 논란 역시 '큰 수의 법칙'을 무시해서 생긴 근거 없는 속설일 뿐이며, 로또 명당 같은 복권 명당도 따지고 보면 사람 많이 몰리니까 계속 명당 자리를 지키고 있는 것일 (=당첨될 "확률"은 다른 집과 똑같은데도 사람이 많이 몰리니까 당첨된 횟수가 많아진) 뿐이다.

많은 사람들이 혼동하는 내용인데, 큰 수의 법칙은 이 반복시행의 결과가 정규분포 형태를 띤다는 중심극한정리(Central Limit Theorem)와는 다른 내용이다. 큰 수의 법칙 어디에도 r/n과 p의 차이가 정규분포를 따른다는 내용은 없기 때문. 어찌 보면 이 중심극한정리는 큰 수의 법칙의 '강화판'이라고 생각할 수 있다. 자세한 것은 정규분포 항목을 참고하자.

2 관련 문서

  1. 대수(大數)의 법칙이라고도 한다. '대수의 법칙'이란 일본에서 번역한 용어로 한국인에게는 직관적으로 와닿지 않는 측면도 있고, 대수(代數)와도 헷갈리기에 점차 '큰 수의 법칙'이라는 표현을 사용하는 추세이다. 물론 나이 많은 사람들은 보통 '대수의 법칙'이라는 표현을 쓴다.
  2. 이런 경우 실제로 한번 이상 성공할 확률은 횟수를 반복할수록 생각 이상으로 높아진다. 던파확률의 법칙 참고.
  3. 실상 대수의 법칙이라는 개념에 소수의 법칙이 포함된다. 그러므로 일반적으로 쓰이는 개념인지는 확인바람
  4. 초심자의 운(beginner's luck)이라는 표현이 많이 쓰인다.
  5. 마작은 4인게임이기 때문에 평균 승률은 25%정도이다.
  6. 이는 얕은 선수층으로 인한 장기 레이스에서의 뒷심 부족일 수도 있다. 온전히 큰 수의 법칙 때문이라고 보기엔 무리.