RNA 이어맞추기

(RNA splicing에서 넘어옴)
  • 이 항목은 spliceosome으로도 들어오실 수 있습니다.

1 개요

파일:RNA splicing.png
전사 과정에서 나온 pre-mRNA를 성숙한 mRNA로 만드는 과정 중 하나. 이 과정을 통해 인트론이 제거되고 엑손끼리만 결합하게 된다. 원핵생물에서는 거의 일어나지 않고 진핵생물에서 주로 일어난다. RNA editing과는 다르다.

DNA에는 인트론(intron)과 엑손(Exon)이 있다. 인트론은 단백질에 대한 정보가 없는 non-coding 서열이고, 엑손은 coding 서열이다. 원핵생물은 인트론이 거의 없지만[1], 진핵생물은 엑손 사이에 수많은 인트론들이 끼어들어가 있다. 하지만 RNA 중합효소는 엑손과 인트론을 구분하지 않고 모조리 RNA로 전사하는데, 때문에 원하는 단백질을 만들기 위해서는 반드시 RNA 이어맞추기(splicing)을 통해 인트론을 제거해야 한다. 위의 그림자료 처럼 이어맞추기가 완료되어도 5' cap과 poly-A가 남아있는데, 엑손으로 취급 받기 때문이다. 이 둘은 특이하게도 non-coding 엑손으로 불린다.

고등생물로 갈 수록 인트론의 수가 늘기 때문에 인트론과 엑손을 정확히 구분하는 것이 매우 중요해진다. 사람의 경우는 전체 유전자 중 10% 내외만 엑손인 것으로 알려져있다. 진핵생물은 이어맞추기 복합체(spliceosome)이라는 특수한 단백질이 전문적으로 이어맞추기를 한다.

2 발견

20세기 중후반, 핵에 존재하는 mRNA가 세포질에 있는 mRNA보다 훨씬 길다는 사실은 유전학의 수수께끼 중 하나였다. 그러던 중 1977년 Richard J. Roberts와 Phillip A. Sharp는 각각 아데노바이러스(adenovirus) 연구를 통해 인트론[2][3]의 존재와 RNA splicing을 밝혀냈고, 당시 전사에 대해 갓 이해하고 있던 생명과학자들에게 큰 충격을 가져다주었다. 결국 두 과학자는 1993년 노벨생리학상을 받게된다.[4]

아데노바이러스는 대표적인 감기 바이러스로, 당시 진핵생물의 유전적 이해를 위해 실험에 사용되고 있었다. 아데노바이러스 안에는 하나의 DNA가 있고, 이 DNA 상에 아데노바이러스를 구성하는 단백질들이 코딩되어 있다. 처음에는 아데노바이러스 각 단백질들의 mRNA 5 말단을 조사해서 전사 개시 서열을 추측해 게놈 지도를 만드려는 실험이었다. mRNA에 DNA를 혼성결합(hybridizaiton) 시켜서 DNA의 어느 지점이 결합되는지를 확인하는 것이 실험 과정이었다. 그런데 이상한 일이 일어났다. mRNA에서는 서로 연속적이던 5 말단 서열이, DNA상으로는 따로 떨어져있었던 것이다. Roberts는 서로 분리(split)되어 있는 개시서열을 3군데 찾아냈고, 이를 tripartite leader라고 이름을 붙였다. 즉 DNA 상에 흩어져있는 3개의 leader들이 mRNA에서는 알 수없는 방식으로 합쳐져있다는 것이 밝혀진 것이다. 실험을 더 진행시켜보니, 똑같은 tripartite leader를 가졌는데 뒤에 오는 단백질 서열만 다른 mRNA들이 발견되었고, 이는 결국 인트론과 RNA 이어맞추기의 발견으로 이어지게 되었다.

그림자료 만들기 귀찮으므로 직접 설명하는 영상을 보도록 하자. 영어 주의

3 매커니즘

3.1 인트론 - 엑손 경계

파일:Intron-exon boundary.png

인트론과 엑손은 그 경계에 특정 서열을 가지고 있다.[5][6] 이 서열들은 대부분의 인트론, 엑손에서 공통되는 서열들로, 5' splice site(혹은 donor site), branch site, 3' splice site(혹은 acceptor site) 총 세 부분으로 나뉜다. 5' splice site는 인트론의 5' 말단을 의미하고, 3' splice site는 인트론의 3' 말단을 의미한다. branch site는 인트론의 중간에 위치하는데, 엄밀히 따지면 3' 말단에 더 가까이 있고 뒤로 폴리피리미딘 서열이 뒤따른다. 5' splice site의 GU 서열, 3' splice site의 AG 서열, branch site의 A 서열은 모든 진핵생물에서 가장 잘 보존된 서열이며 인트론에 반드시 포함되어있다. 이와 반대로 엑손은 단백질 정보를 담아야하기 때문에 덜 보존되어있다.

참고로 그림자료에서 R은 퓨린(A,G) 중 하나, Y는 피리미딘(C,T) 중 하나, N은 아무 염기 중 하나를 의미한다.

3.2 이어맞추기 반응

파일:Splicing reaction.png

인트론은 두번의 transesterification(에스테르 전이반응)에 의해 제거된다. branch site 아데노신(A)의 3'-OH(nucleophile)가 spliceosome(후술)의 도움을 받아 5' splice site 구아닌(G)의 인산기를 공격한다. 이렇게 G와 A가 인산디에스테르 결합으로 연결되어, 밧줄 매듭 모양의 루프를 만들게 된다. 이것을 'Lariat shape'라고 하고, A를 중심으로 세갈래길(3 way junction)이 만들어진다[7]. 그리고 G-A 연결에 의해 인트론 5'말단 쪽에 있던 exon이 절단된다.

절단된 5' 엑손의 3'-OH기는 인트론의 비스한 방식으로 3' splice site를 절단하고 결합한다. 이렇게 인트론 루프와 조합된 엑손이 생기고, 이어맞추기는 끝나게 된다.

만약 mRNA가 두개 있다면, 이들 사이에서도 이어맞추기가 일어날 수 있다. 그 매커니즘은 위와 같지만, 서로 분리되어 있던 mRNA이기 때문에 고리모양(ρ[8]) 대신 Y자 모양의 인트론이 형성된다.

4 이어맞추기 복합체(Spliceosome)

이어맞추기의 기본적인 반응은 위와 같지만, 실은 전사와 마찬가지로 여러 단백질들이 반응을 도와야 한다. 그 단백질들이 이루는 복합체를 ‘이어맞추기 복합체(Spliceosome)’라고 한다. 이어맞추기 복합체는 5여개의 RNA와 150여개의 단백질로 구성된 리보자임이고, 이 중에서도 RNA가 대부분의 역할을 수행한다. U1, U2, U4, U5, U6, 총 5개의 snRNA[9]가 있고, 이 들이 150여개의 단백질과 복합체를 이루면서 snRNP[10]가 된다.

물론 이것은 주(major) 이어맞추기 복합체의 구성이며, U11, U12 등을 이용하는 부(minor) 이어맞추기 복합체도 존재한다. 그러나 연관된 단백질들만 다르고 매커니즘 자체는 동일하기 때문에, 이 문서는 주 이어맞추기 복합체만 설명한다.
파일:RNA-RNA interactions.png
이어맞추기 복합체는 1. 5’ splice site와 branch site를 인식하고, 2. 둘을 가까이 위치하도록 해서, 3. RNA의 절단 및 결합을 촉매하게 된다. 위 그림자료는 snRNA들이 mRNA와 상호작용하는 예시들이다. 이런 RNA 사이의 결합들과, 다른 단백질들의 결합으로 구조적인 재배열이 일어나게 된다. 특히 U2와 U6은 각각 다른 mRNA 자리를 인식하면서도 서로 상호작용함을 볼 수 있다. 이로인해 5’ splice site와 branch site가 가까이 위치할 수 있게 된다. 비유를 하자면, 서로 다른 장소에 있던 원수지간을 외나무다리에서 만나게 해, 싸움을 유도하는 셈이다.

이어맞추기 복합체는 어떤 식으로 이어맞추기 반응을 보조하는가? 위의 RNA-RNA 상호작용이 관여하므로, 위 그림자료를 참고하면서 보면 좋다.
600px
우선 5’ splice site에 U1이 결합하고, branch site 근처의 피리미딘(Y) 연속서열과 3’ splice site를 U2AF[11]가 인식해서 결합한다. U2AF는 두 개의 서브유닛이 있는데, 65kDa 짜리는 피리미딘 연속서열을, 35kDa 짜리는 3’ splice site를 인식한다. U2AF는 BBP[12]를 데려와 branch site에 결합시킨다. 참고로 BBP가 인식하는 branch site 서열은 U2와 같다. 여기까지를 ‘E[13] 복합체’라고 부른다. BBP의 역할은 제대로 밝혀지지 않았다.

600px
U2는 U2AF를 인식해서 BBP의 자리에 대신 결합한다. 이 때 ATP가 소모되며, branch site 아데노신(A)이 bulge[14]를 형성하게 된다. 어째서 bulge가 되는지는 위의 RNA-RNA 상호작용 그림자료를 참고하면된다. 여기까지는 ‘A 복합체’라고 한다.
600px
U2AF는 떨어져나가고 U4, U5, U6으로 이루어진 tri-snRNP 입자가 U1과 U2 사이에 결합한다. 이 결합에 의해 인트론이 휘어지게 된다. U4와 U6은 RNA 서열이 서로 상보적으로 결합한 상태이기 때문에, U6과 U2 사이의 상호작용은 일어나지 않는다. U5는 RNA가 아닌 단백질간의 상호작용으로 약하게 결합한 상태이다. 여기까지를 ‘B 복합체’라고 부른다.

600px
U6은 ATP를 소모하여 U1의 자리를 대체하게 된다. 그리고 U2와 U6 둘 사이를 가로막고 있던 U4가 빠져나가게 되면서, U2와 U6의 상호작용이 발생한다. 이 상호작용에 의해 다시 인트론 구조의 재배열이 생겨서 5’ splicte site와 branch site가 가까워진다. 그리고 이 상태를 ‘C 복합체’ 라고 부르는데, 이 때 에스테르 전이반응을 위한 활성 부위가 만들어진다[15]. 이전의 단계를 거쳐야만 RNA(U2, U6)에 의해 활성부위가 형성되기 때문에, 원치 않은 이어맞추기 반응을 방지할 수 있다.

600px
이후 첫 번째 에스테르 전이반응이 발생하고, U5의 도움을 받아 두 번째 전이반응이 일어나서 이어맞추기가 끝나게 된다. C 복합체의 snRNP들은 제거된 인트론에 결합해있다가, 인트론이 빠르게 분해되면서 떨어져 나가 다른 이어맞추기 반응에 참여한다.

여기까지가 이어맞추기 복합체에 의한 이어맞추기 과정이다. 전체적인 반응은 이 문서를 참고하자. 물론 실제로는 저 경로를 일일이 차곡차곡 따르진 않는 게 함정. 당연하게도 생명체 내의 활동들은 물리나 화학처럼 엄격한 법칙에 의해 지배되는 것이 아니므로 각종 변종 반응들이 항상 도사리고 있다. 그래서 세포는 또 다른 기전들을 준비해놓았다.
  1. 아예 없진 않다.
  2. 이 이름은 나중에 Walter Gilbert에 의해 붙여진 것으로, 처음에는 split gene이라고 불렸다.
  3. Gilbert, Walter (1978). "Why genes in pieces". Nature 271 (5645): 501–501.
  4. "Physiology or Medicine 1993 - Press Release". Nobelprize.org. Nobel Media AB 2014. Web. 27 Nov 2015. [1]
  5. Padgett RA, Grabowski PJ, Konarska MM, Seiler S, Sharp PA (1986). "Splicing of messenger RNA precursors". Annu. Rev. Biochem. 55: 1119–50.
  6. Breathnach, R. and Chambon, P. (1981) Organization and expression of eucaryotic split genes coding for proteins. Annu. Rev. Biochem. 50, 349–383
  7. A는 이미 branch site에서 두개의 염기와 결합한 상태라는 것을 상기해보자.
  8. 단순히 모양을 표현한 것일 뿐, 실제 저 기호의 의미와는 관련 없음
  9. small nuclear RNA로, 약 100~300bp의 길이다.
  10. small nuclear ribonucleoprotein complex
  11. U2 auxiliary factor
  12. branch-point binding protein
  13. early
  14. 그림처럼 볼록 튀어나온 형태
  15. U2와 U6 둘이서 만드는 것으로 보인다.