하플로그룹

Haplogroup

1 개요

분자생물학 지식을 기반으로 DNA의 변형을 추적하여 인간의 혈통을 그룹으로 분리될 수 있는 집단을 의미한다. 사람의 혈통을 거슬러 올라가면 같은 조상을 지닌 집단으로 분리가 가능하고 그 시점을 조정함에 따라서 인간의 혈통을 트리의 형태로 구분할 수 있다. 이러한 방법은 과거에도 빅토리아 여왕혈우병 유전자 등을 통해서 쓰인 것이지만 현재 인류유전학에서 쓰이는 하플로그룹은 족보 추적을 쉽게 하기 위해 Y염색체와 mt-DNA를 주로 쓴다는 점에서 과거의 연구와 차이를 보여준다.

2 하플로 그룹 분리에 사용되는 DNA

Y염색체와 mt-DNA의 DNA 염기서열 중 복제 오류로 생겨난 염기서열 다양성을 알아내어 혈통을 추적한다.[1] 망가졌을 때 돌연변이가 발생하여 자연선택 압력을 받는 지역이면 돌연변이가 축적될 수 없으므로, 돌연변이가 축적될 수 있는 유전자 사이 지역(intergenic region)이나 인트론(intron) 지역의 염기 서열 차이, 혹은 염기서열이 바뀌어도 아미노산 서열이 바뀌지 않는 silent mutation의 발생 양상을 찾는 것이다. 이런 중립적인 돌연변이는 시간에 따라 누적될 것으로 예상할 수 있다. 인류가 이동, 교류, 확산에 따라 거주지를 바꾸게 될 때, 원 거주지 집단의 일부만 그 이동에 참여하게 되므로 떨어져 나간 집단이 원래의 집단보다 중립 돌연변이의 다양성이 적게 된다. 따라서 돌연변이 다양성을 거슬러 올라가는 방향으로 추적해서 인류의 이동, 교류, 확산 양상을 복원해 낼 수 있는 것이다.

  • Y 염색체: 유전 방식 상 아버지에게서 아들로만 전달될 수 있어 부계 혈통을 파악하는 데 사용된다. 상염색체나 여성의 X 염색체는 감수분열 과정에서 유전자 교환이 일어나지만 Y 염색체는 감수분열시 X 염색체와 결합하는 pseudoautosomal region을 제외하곤 유전자 교환이 일어날 수 없기 때문에 더욱 적합하다.
  • 미토콘드리아 DNA (mt-DNA): 미토콘드리아 DNA는 기본적으로 생명체가 진화 과정에서 흡수한 세포내 기관[2]의 DNA이다.[3] 유전 방식 상 어머니의 mt-DNA만 자식에게 물려줄 수 있으므로 결국 모계 혈통을 파악하는 데 사용할 수 있다. 더 나아가 세포 하나당 미토콘드리아가 1000개 이상 존재하므로 적은 샘플에서도 DNA 정보를 증폭해서 찾아내기 쉬운 장점이 있다.

일반적으로 일부다처제 양상과 전쟁 등을 이유로 부계의 단절 가능성이 높고 반면 족외혼 때문에 서로 다른 두 집단간 모계 유전정보의 차이가 적어질 수 있기 때문에 Y 염색체의 하플로 패턴의 대립 양상이 mt-DNA 하플로 패턴 보다 역사적인 사건을 설명하는데 주로 사용되는 경향성이 있다.

연구의 편의를 위해서 일부러 수정시에 섞이지 않은 유전자를 선택했으며, Y염색체와 mt-DNA를 제외한 다른 염색체들은 감수분열시에 교차를 함으로써 염색체가 서로 섞이는 과정을 겪으므로 짧게는 수대, 길게는 수백대를 거슬러 올라가는 유전자를 이용한 족보추적에는 난점을 보여주기 때문에, 앞으로도 계속 사용될 예정이다. 심플하게 1/2을 각 대마다 거듭제곱을 하면 어떻게 될지 생각해보자. 10대만 거슬러 올라가도 10대조의 유전자는 이론상으로는 1/1024밖에 남아있지 않는다(...) 여기에 교차까지 생각하면 더더욱 카오스가 된다(...)

3 하플로 그룹의 등장: 인류의 기원 찾기

3.1 인류의 조상 찾기

유전자를 통한 인류의 족보 추적은 생각보다 빨리 시작되었다. 일반인에게 널리 알려진 것이라면 미토콘드리아 이브(또는 '아프리카 이브')설. 이 설은 말 그대로 모계를 통해 인류의 족보를 추적한 것으로 mt-DNA를 이용했다. 그리고 나온 결론은 현생 인류는 20만여년 전 아프리카의 한 여성의 후손이라는 점[4]. 당연히 이러한 방법은 Y염색체에도 쓰이며 Y염색체로 추적한 인류 공통의 조상은 아프리카 아담이다. 물론 네안데르탈인과 현생인류와의 관계문제로 여전히 다른 방법과 반론이 나오고 있지만 여기서 중요한 것은 아니니 자세한 점은 해당 항목 참조.

3.2 인류의 진출 경로 및 숫자 추적

6~700만년 전에 침팬지에서 갈라져 나온 인류는, 독자적 진화 시간을 고려하면 현재 2~3종의 아종을 가질 가능성이 매우 크다. 하지만 여러 민족의 유전적 차이[5]에도 불구하고, 현존하는 어떤 인류 집단에서 남녀를 뽑아 자손을 만들더라도 생식 능력에 문제가 없는 자손을 볼 수 있다. 이는 사실 현재 인류의 조상이 '크기 병목'[6]을 거쳤다는 것을 의미하는데 실제로 인류는 겉보기로 확인할 수 있는 여러 차이에도 불구하고 유전적 다양성이 굉장히 떨어지는 편으로 친척인 침팬지는 물론이고 멸종위기종인 고릴라보다도 유전적 다양성이 떨어진다.

유전자 분석을 통해 하플로 그룹을 정의하고, 인류의 공통된 조상을 추적할 수는 있었지만 하플로 그룹의 쓰임새는 그것으로 그치는 것이 아니다. 인류가 대를 이어서 퍼져나가고 그 과정에서 병목현상이나 창시자 효과등으로 인간의 유전자는 상대적으로 극심한 변화를 보여주기도 하고, 역사시대에 접어들면 정복자와 피지배자간 계층의 차이로 주된 혈통의 변화가 나타나기도 한다. 즉 각 민족의 혈통까지도 추적할 수 있다는 것이다. 실제로 현재 하플로그룹, 특히 부계유전인 Y염색체 하플로그룹은 비단 개인의 족보추적이 아닌 민족집단의 족보추적에 널리 활용되고 있다.

3.3 Y염색체 하플로그룹의 특징

Y염색체 하플로그룹은 위에서 설명한대로 부계유전의 특징을 지니고 있다. 그 때문에 mt-DNA보다 상대적으로 역사시대에 걸맞는 특징을 보여준다. 물론 mt-DNA로 역사시대의 인류의 족보를 추적하지 않는 것이 아니다. 오히려 그것이 더 먼저 이루어졌다. 하지만 부인하고 싶어도 인류역사의 대부분은 남자들의 역사이며, 종족집단의 이주에서도 여자보다는 남자의 이주흔적이 더 크게 나타나며, 어느 종족이 고위층이었는가도 남자쪽이 더 강하게 드러난다. 여기에 Y염색체는 mt-DNA와 비교하면 상대적으로 오래 남기가 힘들기 때문에 선사시대에 쓰고 싶어도 제한적으로 쓰일 수 밖에 없다.

그러한 결과 Y염색체 하플로그룹은 처음부터 미토콘드리아 이브로 유명한 mt-DNA에 비해서 인류의 이동 과정을 종족 단위 중심으로 추적하는데에 널리 사용되고 있다. 특히 역사시대의 어족이나 민족 단위의 이주에 그 흔적을 강하게 보일 때가 많기 때문에 각 집단의 이동의 파악에 매우 용이하다. 그러한 결과 역사시대의 민족 이동을 보는데 쓰는 하플로그룹은 대부분 Y염색체 하플로그룹이다. mt-DNA는 따로 붙여서 표기할 때가 많지만, Y염색체는 그냥 하플로그룹이라고 칭하는 경우가 많을 정도.

하지만 Y염색체 하플로그룹은 부계유전의 단점 또한 지니고 있다. 그 문제는 바로 계급의 영향의 지나친 강화. 정복자의 수가 5%나 그 미만이라고 할지라고 해당집단의 현재 하플로를 보면 20~30%는 흔하고 심하면 거의 100%로 뻥튀기되는 경우도 있다. 즉 왜곡이 쉽게 일어난다는 것이다. 그래서 Y염색체 하플로의 비율이 이주민의 비율과 일치한다고 할 수는 없다. 전체적인 참고에는 한계가 있으며 피정복민보다는 정복민을 파악하는데 유용하다고 할 수 있다.[7]

그러나 이러한 단점이 장점이 되기도 한다. 특히 민족이동과 문화의 전파에서는 말이다. 지배층은 그 수에 비해서 언어, 문화 등의 영향이 훨신 강했고, 역사상 민족이동도 대부분 특정 집단이 이주해서 다른 지역의 지배층이 된 것이 대부분이다. 이 때문에 Y염색체 하플로의 왜곡정도만 유의를 하면 역사시대의 족보추정에는 매우 유용하다고 할 수 있다.

3.4 mt-DNA 하플로그룹의 특징

위에서 적은 것처럼, mt-DNA 하플로그룹은 난자에서 오기 때문에 모계유전의 특징이 있다. 그리고 Y염색체 하플로그룹보다 일반적으로 유해에서 더 오래 남아 있기 때문에 고인골에서 검출이 쉬운 장점이 있다. 이는 상염색체와 성염색체(X,Y) DNA는 핵 내에만 존재하는 데 비해, 미토콘드리아는 세포 내에 대체로 복수로 - 세포에 따라서는 수백 개 이상 - 존재하기 때문에 절대량이 많기 때문이다. 따라서 Y염색체 하플로그룹은 주로 살아 있는 사람들에서 나온 자료가 절대다수인 데 비해, mt-DNA는 고인골에서도 높은 빈도로 검출된다.[8]

모계 유전은 남성에 비해 전달 편차가 적다. 다른 말로, 현재 남자의 자식 수 최고 기록이 888명[9]인데 비해 여자는 69명[10]에 불과하다는 점을 떠올려 보자. 이 때문에 Y 하플로그룹보다 다양성이 더 크다[11]. 검출이 쉽다는 점은 큰 장점이지만, 인류의 이동에 대한 정보는 Y 하플로보다 덜 포함한다. 이주 및 정벌이 이루어질 때 대체로 남자들이 많이 이동해서 현지의 여자들과 우선적으로 짝을 이루며 피정복민 남자를 도태시키는 사례가 많다는 점을 고려하면 이해가 쉬울 것이다[12]. 반면 어느 지역 '선주민'의 흔적을 조사할 때는 Y 하플로보다 훨씬 유용하다. 즉 해당 지역에 가장 먼저 정착한 사람들이 어느 혈통이었으며 얼마나 오래도록 살아왔는지도 원칙적으로는 정량화가 가능하다는 말이다.

그리고 Y염색체보다 오래간다는 것도 mt-DNA를 활용하는 이유중 하나가 된다. 서기기원으로만 거슬러 올라가도 Y염색체의 하플로를 추적하기는 기술상으로 매우 힘드나 [13] mt-DNA는 네안데르탈인까지 가능하다. 그리고 선사시대의 인구이동이 역사시대보다 적었을 경우나, 이주민 집단이 여성까지 같이 움직인 것으로 보인 경우에는 mt-DNA를 통해 Y염색체를 추정할 수 있다. 정확하다고는 할 수 없지만 현대와 비교해 상대적으로 덜 섞였을 가능성이 높은 역사시대 초기, 혹은 선사시대에는 부족하지만 쓰일 수 밖에 없는 방법이다.

3.5 하플로그룹의 명명

하플로그룹의 분류는 트리의 형태를 지닌다. 가장 기본이 되는 하플로들을 대문자 A, B, C등으로 분류하고 그 하플로에서 나뉘는 서브클래스를 숫자, 소문자의 연속적인 배열로 붙인다. 지중해 원주민 하플로인 E1b1b를 예로 들어서 보면 이해하기 편할 것이다. 가장 큰 분류인 E, 그리고 그 밑의 트리를 1, b, 1, b의 순서로 나뉘는 것이다. 이말은 즉 E2도 있고, E1a도 있다는 말이다. 한국인의 특징을 보여주는 하플로인 O2b도 마찬가지로 O-2-b의 순서. O2b의 상위는 O2이고 O2의 상위는 O가 된다. 서브클래스는 상세한 분류에서는 필요하지만 너무 번잡하므로 적절히 대표되는 상위클래스로 말한다.

또한 각 하플로마다 이명을 가지고 있다. O2b의 경우는 M176으로도 불리는 식. 위의 명명법으로 하면 하플로에 따라 이름이 지나치게 길어져 번잡해질 때가 있기 때문에 이렇게 따로 이명으로 부르기도 한다. 그 외에도 하플로그룹의 연구가 현재진행형이기 때문에 위의 트리가 바뀌기도 하고 그러면 차라리 M176 같은 이명으로 부르는 것이 더 나을 수도 있다. 하지만 지금 이정도만으로도 골이 아프겠지

3.6 하플로그룹의 활용

이렇게 정의된 하플로는 통계분석의 형태로 연구된다. 현대의 특정 지역, 특정 민족의 하플로타입을 확인하고, 고대 인골의 하플로타입을 확인하고 이것을 가계도나 문화, 언어 등과 결부시켜 인류가 어이 이동했는가 확인하는 것이다. 여기서 중요한 것이 비율이다. 각 하플로의 대단위는 대부분 늦어도 1만년 이전에 분화된 것이기 때문에[14] 역사시대의 인류중 특정 하플로만으로 도배한 경우는 특수한 경우를 제외하고는 드물다. 민족의 정의나 형성시점에 이견이 많지만 환빠들 조차도 대부분 역사시대 안에서 망상을 한다는 점을 생각하면 당연히 혈통이 섞일 수 밖에 없다는 것이다. 그 때문에 특정집단의 각 하플로 비율을 확인하는 형태가 될 수 밖에 없다.

그리고 지역에 따라서는 대단위로는 동질체라도 서브클래스를 나누면 완전히 다른 집단의 합일 경우도 많다. 예를 들어 서유럽의 하플로그룹은 대부분 R1b지만, 이 중에서 켈트계열도 있고, 게르만 계열도 있으며 각 서브클래스의 분포에 따라서 그것을 확인할 수 있다. 따라서 지역에 따라 서브클래스를 상세히 나눠서 조사하는 것은 곡 필요하다. 하지만 그것이 귀찮(...)기 때문에 보통은 높은 단위로 말할 뿐이다.

또한 하플로그룹의 연구는 기본적으로 통계분석을 통해 비율을 확인하는 것이기 때문에 특정 민족을 나타내는 하플로는 특정 민족에 절대다수인 하플로와 동의어가 아니다. 주변 지역이나 주변 민족에 비해 유달리 많이 나타나는 하플로를 뜻하는 것이다. 예를 들어 한국인의 Y염색체 하플로중 가장 많은 비율을 차지하는 것은 40~50%의 O3 계열이지만 이는 구석기시대부터 동북아에 폭넓게 분포했던 하플로이므로 한국인을 나타내는 지표로써의 역할을 할 수 없다.[15] 그 때문에 한국인을 나타내는 하플로는 한국인의 20~40%를 차지하는 O2b이다. O2b는 중국에는 거의 전무하고 만주족, 한국인에게만 특정하게 나타는 하플로이기 때문에 이들을 대표하는 하플로로 쓰인다.

3.7 하플로그룹의 집단

4 하플로그룹에 대한 오해들

4.1 인류를 우생학적으로 분류한다?

어떤 현존 생물이건 서식 환경에 맞게 적응했다는 공통점이 있으며, 모두 공통 조상에서 같은 시간만큼 진화해 왔다. 따라서 현존 생물 사이에는 우열이 없다.[16] '고등' 또는 '하등' 생물이란 개념은 현재는 전혀 통용되지 않는다. 심지어 박테리아와 사람 사이에도 우열이 없는데 인류 내에서? 오히려 이것은 이 분야를 연구하는 학자들부터 더 잘 인식하고 있다. 애당초 말 안 되는 소리다

더군다나 mt-DNA 항목에서 설명했듯이, 변화 파악에 요긴하게 쓰이는 영역은 변화가 있어도 기능에 거의 지장이 없는 부분이기 때문에 이런 차이가 '우생학적 우열'과는 무관하다는 점도 염두에 두어야 한다. 염색체유전 얘기만 나오면 조건반사적으로 우생학을 떠올리는 낡아빠진 생각은 이제 그만 접어둘 때가 됐다. 다만 Y염색체는 변화가 심하면 고자가 될 수도 있겠지만 내가 고자라니!!

사실 오히려 흔하게 널린 하플로는 주변 지역에도 많으므로 우생학보다는 평등에 기여할 수도 있다.

4.2 연구자들이 하플로만을 맹목적으로 믿는다?

당연히 오해다. 과학기술의 힘으로 연구를 하는 것이긴 하지만 근본적으로 다른 고고학과 다를 것이 없다. 단 학문영역이 좀 다를 뿐이다. 하플로그룹은 형질인류학적인 방법으로 연구를 하는 것이고 나온 연구결과 자체는 심하게 말하면 통계 데이타에 그칠 뿐이다. 이렇게 나온 데이터를 역사적인 사건, 고고학적인 발굴 등과 연관시켜서 연구하는 것이다. 단지 연구방법에서 과학기술이 훨씬 더 많이 들어가는 것이 다를 뿐인데 왜 적대감을 가져야 할까?

과학자들은 매드 사이언티스트로 대표되는 것도 아니고, 이러한 연구가 과학자들만이 하는 것도 아니다. 하플로그룹 검출기술만 알면 고고학자들이 하는 데에 전혀 문제가 없다. 오히려 그러한 의심을 가지는 것이 문제다. 왜 다른 고고학적인 연구결과는 충분히 검토할만한 근거로 쓰면서 단지 과학기술이 많이 들어갔다고 의심을 해야하는 것인가? 또한 고고학적인 연구에 이미 과학기술이 깊이 관여되어 있는 상황에서[17] 유전자를 통한 추적을 한단 이유로 편견을 가지는 것이 더 문제가 아닌가?
  1. DNA 복제의 오류 발생률은 초기 단계에서 십만분의 1이다. 교정장치를 거치면 오류 발생률은 100억분의 1로 줄어든다.
  2. 엽록체나 미토콘드리아 같이 자체 DNA가 있는 세포 소기관은 원래 독립 생물이었다. 이것이 (아마도) 감염이나 포식 등으로 다른 세포에 들어갔다가 현재처럼 공생으로 진화한 것이다. 생물학자 린 마굴리스('코스모스'로 유명한 칼 세이건의 첫 아내였다)가 처음 주장했고 지금은 정설이다.
  3. 단 현존하는 미토콘드리아 DNA는 원래 독립 생물일 때보다 훨씬 줄어들었다. 이는 대부분이 세포핵으로 자리를 옮겼기 때문이다.
  4. 물론 이 여성에게 "궁극의 큰어머니(...)" 같은 거창한 타이틀을 붙일 필욘 없고, "실험의 모집단에서 추적 가능한 마지막 공통분모" 정도로 이해하는 것이 좋다. 미토콘드리아 이브 항목에서도 잘 나와 있지만, 단지 모계의 조상이라는 것 뿐이다. 상염색체나 Y염색체 쪽은 아무런 상관이 없다.
  5. 흑인은 비타민 D의 합성이 매우 부족하고, 백인은 피부암 발병 확률이 높다. 피그미족은 숲 속의 생활에 적응하여 키가 작아졌고, 티벳 원주민은 고지 적응 특성이 여러 모로 확연한 등 실례는 매우 많다.
  6. 교배 때 문제가 생기지 않을 정도로 최소한의 유전적 동질성을 가져야만 종으로써 호모 사피엔스(homo sapiens)가 성립한다. 7만년전 추정 인구는 약 15,000명으로 멸종위기종이었다. 이것은 번식 않는 노인이나 어린이 등의 인구를 제외했기 때문에 '실제 인구'는 이 두 배 이상은 됐을 것이나 타 동물에 비해 소수였음에는 매한가지이다.
  7. 이 때문에라도 하플로그룹 연구의 추정결과는 수시로 바뀐다. 물론 현재 활발히 연구중인 분야라 데이터의 업데이트가 매우 빠르다는 것이 결정적이지만 말이다.
  8. 고인골에서 DNA를 얻으려면 우선 묻혀 있던 지역의 온도가 낮아야 하며(그래야 DNA 파괴 속도가 느려진다) 토양이 산성이면 뼈가 아예 녹아 없어지기 때문에 곤란하다. 스반테 파보 팀이 최초로 박물관의 네안데르탈 인의 유해에서 DNA를 찾아냈을 때도 위 두 조건을 만족했기 때문에 가능했다고 한다. 우리나라는 대부분이 산성 토양이라서 이 점에서는 상당히 불리하다고 알려져 있다.
  9. 모로코의 황제로 큰 하렘을 거느리고 있었음
  10. 19세기 모스크바에 살았던 여인. 세 쌍동이를 많이 낳았다.
  11. Y 하플로그룹은 남자 한 명이 다른 남자를 다 죽이고 하렘을 만들어서 다른 Y 유전자를 쉽게 축출할 수 있지만 mt-DNA 하플로는 그렇지 않다.
  12. 성경에 "남자를 알지 못한 여자를 제외하고는 다 죽여라"란 말이 등장할 정도다. 다음에 무슨 일이 생겼겠는가?
  13. 물론 현재 기술의 발달속도가 빠르니 점차 연대는 올라가고 있는 듯하다.
  14. 물론 몇가지 예외가 있다. 게르만족의 I1a1은 3000년전에, 한국인의 O2b는 6000년전에 나타나서 각각 30%에 가까운 비율을 차지하고 있다. 하지만 이는 특수한 사례다.
  15. 또한 O3는 워낙 광범위하게 분포하기 때문에 지표로서 확인하기 위해선 서브클래스로 보다 세밀하게 분류하여야 한다
  16. 사람을 심해어가 서식하는 환경에 갖다 놓았다가는 당장 수압 때문에 짜부가 될 것이다. 지구상에서도 모든 환경 킹왕짱 생물 따위는 있을 수가 없다.
  17. 방사성 동위원소를 이용한 연대 측정은 물론이고, 유물에 남은 생체 분자들의 흔적을 추적하는 방법은 요즘엔 오히려 유물 자체(토기 등)를 관찰하는 것보다 더 시간을 투자하기도 한다.