하디-바인베르크 법칙

1 개요

Hardy–Weinberg principle. "개체군이 가지는 유전자풀 안에서 여러 유전자들의 비율은 세대를 거듭해도 그대로 유지된다."라는 법칙이다. 유전학에서 물리학의 뉴턴의 운동법칙 수준의 지위를 가지는 법칙이다. "우성이 왜 열성보다 안 많아져요?"[1]라는 질문에 대한 '이론적으로는 100점짜리' 설명이다.[2]

영국의 수학자 고드프리 해럴드 하디(Godfrey Harold Hardy)와 독일의 유전학자 빌헬름 바인베르크(Wilhelm Weinberg)가 각자 독자적으로 발견한 법칙으로 영어식으로 읽어서 '하디-와인버그 법칙'이라고도 한다. 대개 줄여서 'H-W Rule'로 표기한다.

고등학교 교육과정 내에서는 생명 과학Ⅱ에서 이 법칙에 대해 처음 배우게 된다. 그리고 고등학교 생명과학2에선 거의 유일한 계산이다. 그리고 생명과학 시간에 왜 자신이 2차방정식을 풀고 있는지 의문이 생기기도 한다.

2012학년도 홍익대학교 수시 1차 수리논술의 주제로 나왔다. 2013학년도 EBS 수능완성 언어영역 실전편에서 비문학 지문으로 다루었으므로 문과생들은 당황했다.

2 역사

1908년, 케임브리지 대학의 유전학 교수였던 퍼넷(Reginald Punnett)[3]멘델의 유전 법칙에 대한 강의를 하던 중, 당시 저명한 통계학자였던 율(G. U. Yule)[4]로부터 이런 질문을 받았다.

: 교수님, 단지증[5]은 우성형질이라고 알려져있지요. 그런데 열성과 우성 유전자를 다 가진 개체는 우성형질이 발현된다고 하면, 부모 세대보다 자식 세대에서 단지증이 늘어나는 것이 맞지요? 동일한 수의 단지증 환자와 일반인(1:1)끼리 무작위로 교배했을 때 다음 세대는 단지증 : 일반인의 비율이 3:1이 되겠지요?[6] 그렇게 다음 세대로 갈 때마다 단지증 환자가 늘면 나중에는 모든 사람의 손발가락이 다 짧아져야 하는 것 아닙니까?

퍼넷: 어...

퍼넷은 경험상 이 말이 틀렸다는 걸 알았지만[7], 왜 그런지는 그 자리에서 설명하지 못했다.

사실 이는 멘델의 유전 법칙 중 분리의 법칙을 생각해보면 간단하다. 우성-열성 잡종은 우성 형질이 나타나지만 자식에게 열성 유전자를 줄 수도 있기 때문이다. 즉, 유전 인자를 자식에게 물려줄 때는 우열 구분이 없다. 예를 들어, ABO식 혈액형의 우열 관계는 A=B>O인데, 부모가 A형과 B형이라고 했을 때 A형 쪽의 실제 유전자가 헤테로 A형(AO)이고 B형 쪽의 실제 유전자가 헤테로 B형(BO)이라면 그 자녀는 헤테로 A형(AO)이 나올 수도, 헤테로 B형(BO)이 나올 수도, AB형이 나올 수도, O형이 나올 수도 있다. 더 간단하게 생각해보면 모든 유전자는 우성이든 열성이든 (생존/번식에서 가지는 유불리가 동일하다고 가정했을 때) 다음 대로 전해질 확률이 50%이므로, 우성인자를 A, 열성인자를 B라고 했을때 각 세대간 AA, AB, BB 개체의 비율은 동일하다. 위의 육손의 예를 들어 설명하자면, 호모(homogenous)육손(AA)과 육손이 아닌 사람(aa)이 자식을 낳을 경우 표현형은 100% 육손만 나오므로 일견 우형성질인 육손 인구가 늘어나는 것처럼 보인다. 그러나 이렇게 해서 나온 육손들은 전부 헤테로(heterogenous) 육손(Aa)반쪽짜리이기 때문에, 이들과 육손이 아닌 사람이 자식을 낳을 경우 육손일 확률은 절반으로 낮아진다. 심지어 이들간에 자식을 낳아도 25%의 확률로 육손이 아닌 개체(aa)가 나온다.

얼마 뒤 퍼넷은 친구인 수학자 고드프리 해럴드 하디와 저녁 식사를 함께 하게 되었다. 그때 이 이야기를 꺼내 봤는데 갑자기 하디가 냅킨 위에 수식 몇 개[8] 적어주곤 "그건 이렇게 풀면 되잖냐. 중학생도 풀겠다."라고 하는 게 아닌가? 수학과 출신인 나도 알고 있음

깜놀한 퍼넷은 하디에게 당장 이것을 논문으로 발표하라고 했지만, 순수 수학자였던 하디는[9] 자기 전공분야도 아닌 생물학의 '너무 쉬운 문제' 하나 푼 것 가지고 논문을 쓴다는 것에 거부감을 보였다. 수학으로서 위대한 발견을 하겠다고 거절했다고. 그러나 결국 친구 등쌀에 못 이긴 하디는 A4 한장짜리 논문(...)[10]을 작성하여 학술지에 실었다. 그런데 이 'A4 한 장짜리 너무 쉬운 문제'를 정리한 논문은 훗날에 유전학의 F=ma라고 불리게 되었다.

한편, 독일의 의사 빌헬름 바인베르크는 하디의 논문 발표보다 6개월 전인 1908년 1월 13일 독일의 학회에서 몇 년간의 자료 조사와 연구에 근거해 독자적으로 동일한 법칙을 발표했었지만, 그 사실은 1943년 독일인 과학자 쿠르트 슈테른(Curt Stern)이 미국의 학술지 사이언스에 기고한 기고문에서 지적할 때까지 35년 동안 묻혔었다. 바인베르크가 당시 유전학계의 주된 언어인 영어가 아니라 독일어로 논문을 냈기 때문에 묻혔다는 게 중론. CAS가 나온지 얼마 안 돼서 아무도 안 봤나 보다...

3 전제조건

하디-바인베르크 법칙은 '멘델 집단'에서만 성립하는데, 멘델 집단이란 진화가 일어나지 않는 집단으로 유전적 평형이 유지되는 가상의 집단이며, 다음을 만족해야 한다.

  1. 집단의 크기가 충분히 커야 한다.
  2. 다른 집단과의 유전자 흐름이 없어야 한다.
  3. 집단 내에서 개체 간의 교배가 자유롭게 일어나야 한다.
  4. 돌연변이가 일어나지 않아야 한다.
  5. 특정 대립 유전자에 대한 자연선택이 일어나지 않아야 하고, 집단 내 구성원의 생존력이 동일해야 한다.

이는 현실에 구현하는 것이 불가능한 조건이지만, 현실에서는 관찰 가능한 집단 크기의 한계에서 생기는 표본 오류가 더 크기 때문에 오차가 상쇄된다. 진화가 없다면 이 법칙에 따라 유전 정보의 비율이 유지되기 때문에 유전자풀의 조성 변화가 곧 진화의 증거가 된다. 따라서 멘델 집단의 조건이 깨지는 경우가 곧 진화의 원인이라고 할 수 있다. 멘델 집단의 조건과 진화의 원인을 짝지어 보면 각각 순서대로 유전적 부동, 이주, 격리, 돌연변이, 자연선택이라고 할 수 있다.

바꿔서 말하자면, 진화가 일어난 집단은 하디-바인베르크 법칙을 더 이상 따르지 않기 때문에, 진화 여부를 판단하는 기초적인 공식으로 이용된다.

4 증명

0. 전제

  • 형질 X를 결정하는 우성 유전자 A와 열성 유전자 a가 있다고 하자.
  • 임의의 개체군의 유전자풀(Gene Pool)[11] 안에서 이 형질을 결정하는 유전자 A와 a의 비율은 각각 p와 q이다. 이때 p + q = 1이다.
  • f(A)Gn='n번째 세대의 유전자집단 안에서 유전자 A의 비율'이라고 정의 하면.

1. 어버이 세대(G1)에서의 유전자집단에서 형질 X를 결정하는 유전자 A와 a의 비율

  • f(A)G1=p
  • f(a)G1=q
  • p+q=1
  • 여기서 p, q라고 한 비율은 유전자 집단 안의 유전자 개수들의 비로, p=(유전자집단 안에서 유전자 A의 개수) / (유전자집단 안에서 형질 X를 결정하는 모든 유전자(여기선 A와 a)의 총 개수)

2. 자식 세대(G2)의 유전자형과 개체군 안에서 각각의 비율

  • 어버이 세대(G1)의 교배 후 자식 세대(G2)가 태어났을 때, 형질 X에 대해 나올 수 있는 유전자형은 AA, Aa, aa의 세가지 이다.
  • 개체군 안에서 각 유전자형의 비는 p2 , 2pq, q2 이다.
  • 개체군이 멘델 집합이란 가정은 여기서 필요하다. 개체군이 충분히 크고 무작위로 교배하지 않으면 이렇게 딱 맞는 비율이 안 나온다.
  • 여기서 p2 , 2pq, q2 라고 쓴 비율은 개체군 안에서 각 유전자 형의 비율로, p2 = 개체군 안에서 형질 X에 대한 유전자형이 AA인 개체의 수 / 총 개체 수. 위에서 말한 유전자의 개수와는 다른 것이다.

3. 자식 세대(G2)에서의 유전자집단에서 형질 X를 결정하는 유전자 A와 a의 비율

  • 유전자 형이 Aa인 개체는 유전자 2개중 유전자 A를 1개, 유전자 a를 1개 가지고 있으므로.
  • f(A)G2=p2 +(1/2)×2pq=p(p+q)=p (∵ p + q = 1)
  • f(a)G2=(1/2)×2pq+q2 =q(p+q)=q

4. 결론

  • f(A)G1=f(A)G2=p
  • f(a)G1=f(a)G2=q
  • 어버이 세대(G1)의 유전자군 안에서 유전자 A와 a의 비율은 자식 세대(G2) 의 유전자집단 안에서 유전자 A와 a의 비율과 같다.
  • 여기서 수학적 귀납법을 사용하면, f(A)Gn=p, f(a)Gn=q 임을 알 수 있다.
  • 즉, 유전자 A와 a의 비율은 어떤 임의의 자연수 세대만큼 지나도 그대로 유지된다.

5. 보충

  • 여기선 형질 X를 결정하는 유전자가 2개 뿐(우성 1개, 열성 1개)이라는 가정 하에서 수식을 풀었지만, 사실은 형질 X를 결정하는 유전자가 몇 개이든 상관 없이 이 법칙은 성립한다. 결국 상동염색체 상에서 발생하는 현상이니 n차 정사각행렬로 풀 수 있다.

언뜻 보기엔 어려워 보이지만 차근차근 보면 (A+a)2 = A2+2Aa+a2을 생물학에 적용시킨 것과 같다. 중학생도 할 수 있을 거라 믿는 것은 바로 이것 때문이다. 우리나라 중1 수학 교육과정(2009년 개정)에서도 배우는 수식이다. 즉 위의 내용을 이해하기 위한 기본 컨셉은 이미 중학생 수준에서 다 배운다. 그렇다고 중학생이 저걸 유도해낼 수 있는건 아니지만 이해하는 데는 이론상 문제가 없으며, 잘 풀어서 설명해주면 선행학습하는 고1들이 문제없이 이해하는걸 보면 중학생도 똘똘한 애들은 이해할 수 있을 것이다.

5 초간단 요약

우성 형질이 열성 형질보다 우세하므로 서로 상반되는 형질이 동시에 존재하는 경우 우성 형질만 발현된다. 핵심은 발현 여부는 후손으로의 유전과는 아무런 상관이 없다는 것. 따라서 우성 형질이 발현된 경우에도 열성 유전자는 그대로 유전되고 그 비율은 변하지 않는다(멘델의 유전법칙만 알아도 여기까지는 간단하다!). 부모와 자손이 가지는 우/열 유전자의 비율이 변하지 않았다는 것은 결국 각 형질의 발현 가능성 역시 변하지 않는다는 것을 의미한다. 참 쉽죠?

사실 퍼넷이 하디급이 아니라 그냥 지나가던 수학 교수 붙잡고 물어봐도 풀었을 거라는 썰도 있다(...) 통섭이 이렇게 중요합니다 여러분 근데 퍼넷도 중고등학생 때 2차방정식 배웠을 텐데...
  1. 여기서 우성과 열성이라는 것은 단순히 유전적인 우성 열성을 말하는 것으로, 해당 유전형이 갖는 진화적 유불리에 관한 것이 아니다.
  2. 이론적으로 100점인 이유는, 아래에도 기술하듯이 현실의 집단은 멘델 집단이 아니기 때문이다.
  3. Punnett Square의 그 퍼넷이다.
  4. 일명 Undy Yule. 이후 Yule Process와 Yule Distribution으로 학계에서 이름이 남게 된다.
  5. Brachydactyly, 短指症. 손발가락이 비정상적으로 짧은 장애.
  6. G. U. Yule, Proceedings of the Royal Society of Medicine, Epidemological Section, 1908, Vol. 1, p.165.
  7. 청중에 단지증 환자가 없었으므로. 새끼 손가락이 짧아지는 형태는 전체 인구 중 2% 정도 존재하지만 나머지는 희귀하다.
  8. (A+a)2 = A2+2Aa+a2. 곱셈 공식이다.
  9. 정수론을 비롯한 순수 수학만 한 수학자로, 지금까지 인류에게 실재적인 도움을 눈곱만큼도 주지 않고 순수한 수학만 한 게 자랑이라 여긴 사람이었다. 자신의 제자이자 공동연구자였던 리틀우드와 함께 Hardy-Littlewood circle method, first and second Hardy–Littlewood conjectures 등을 발표해 당대 영국 최고의 수학자로 이름을 날렸다. 남들이 다 무시했던 라마누잔 노트의 가치를 알아보고 스리니바사 라마누잔을 영국으로 초빙했던 것도 바로 이 사람.
  10. Hardy, G. H., 1908, Mendelian Proportions in a Mixed Population, Science, N.S. Vol. 28, Jul. 1908, p. 49-50. 이런 엄청난 압축과 대충 쓰기(...)가 가능한 게 수학 논문의 특징 중 하나다. 물론 그를 위해서는 엄청난 내공이 필요하다. 밀레니엄 문제 중 푸앵카레 추측을 풀어낸 논문도 처음엔 딸랑 3페이지였다. 다만 여기서는 수식이 작성된 부분을 제외한 모든 부분에서 귀차니즘(...)과 핀트를 잘못 짚은 율에 대한 디스(...)를 적나라하게 느낄 수 있다.
  11. 어떤 생물집단 속에 있는 유전정보의 총합. 소련의 생물학자 T.도브잔스키가 주창. 아직 '유전자풀'로 설명되어 있으나 최재천 교수가 '풀'이라는 단어를 집합체라는 뜻의 '군'으로 바꿔 부를 것을 제안하였다. 하지만 '유전자군'은 같은 염색체상의 연관된 구조를 만드는 'Gene clusters'를 번역한 말인데, 사용할 만한 유전자풀의 동의어로 '유전자 집단', '유전자급원'이 있다. 비슷한 것이 유전체(게놈).