[include(틀:분자생물학&생화학)] [목차] == 개요 == [[파일:RNA_splicing.png]] [[전사(생물학)|전사]] 과정에서 나온 pre-mRNA를 성숙한 [[mRNA]]로 만드는 과정 중 하나. 이 과정을 통해 [[인트론]]이 제거되고 엑손끼리만 결합하게 된다. 원핵생물에서는 거의 일어나지 않고 진핵생물에서 주로 일어난다. RNA editing과는 다르다. [[DNA]]에는 [[인트론]](intron)과 엑손(Exon)이 있다. 인트론은 단백질에 대한 정보가 없는 non-coding 서열이고, 엑손은 대부분이 coding 서열이다. 원핵생물은 인트론이 거의 없지만[* 아예 없진 않다, 하지만 비율이 엄청 희박하다.], 진핵생물은 엑손 사이에 수많은 인트론들이 끼어들어가 있다. 하지만 RNA 중합효소는 엑손과 인트론을 구분하지 않고 모조리 [[RNA]]로 전사하는데, 그렇기에 원하는 단백질을 만들기 위해서는 반드시 인트론을 제거하고 엑손만을 남겨야 한다. 이때 쓰이는 가공 작업이 바로 RNA splicing이다. 고등생물로 가면 갈 수록 인트론의 수가 점점 늘어나기 때문에, 인트론과 엑손을 정확히 구분하는 것이 매우 중요해진다. 특히 사람의 경우는 전체 유전자 중 10% 내외만 엑손인 것으로 알려져있다.[* 즉 DNA 중에 5%만 유전자인데, 그것의 10% 내외만 엑손인 것이다. 즉, 전체 20억 염기 중, 엑손은 겨우 1000만개] 진핵생물은 이어맞추기 복합체(spliceosome)이라는 특수한 단백질이 전문적으로 이어맞추기를 한다. == 발견 == 20세기 중후반, 핵에 존재하는 mRNA가 세포질에 있는 mRNA보다 훨씬 길다는 사실은 유전학의 수수께끼 중 하나였다. 그러던 중 1977년 Richard J. Roberts와 Phillip A. Sharp는 각각 아데노바이러스(adenovirus) 연구를 통해 인트론[* 이 이름은 나중에 Walter Gilbert에 의해 붙여진 것으로, 처음에는 split gene이라고 불렸다.][* Gilbert, Walter (1978). "Why genes in pieces". Nature 271 (5645): 501–501.]의 존재와 RNA splicing을 밝혀냈고, 당시 전사에 대해 갓 이해하고 있던 생명과학자들에게 큰 충격을 가져다주었다. 결국 두 과학자는 1993년 노벨생리학상을 받게된다.[* "Physiology or Medicine 1993 - Press Release". Nobelprize.org. Nobel Media AB 2014. Web. 27 Nov 2015. [[http://www.nobelprize.org/nobel_prizes/medicine/laureates/1993/press.html]]] 아데노바이러스는 대표적인 감기 바이러스로, 당시 진핵생물의 유전적 이해를 위해 실험에 사용되고 있었다. 아데노바이러스 안에는 하나의 DNA가 있고, 이 DNA 상에 아데노바이러스를 구성하는 단백질들이 코딩되어 있다. 처음에는 아데노바이러스 각 단백질들의 mRNA 5 말단을 조사해서 전사 개시 서열을 추측해 게놈 지도를 만드려는 실험이었다. mRNA에 DNA를 혼성결합(hybridizaiton) 시켜서 DNA의 어느 지점이 결합되는지를 확인하는 것이 실험 과정이었다. 그런데 이상한 일이 일어났다. mRNA에서는 서로 연속적이던 5 말단 서열이, DNA상으로는 따로 떨어져있었던 것이다. Roberts는 서로 분리(split)되어 있는 개시서열을 3군데 찾아냈고, 이를 tripartite leader라고 이름을 붙였다. 즉 DNA 상에 흩어져있는 3개의 leader들이 mRNA에서는 알 수없는 방식으로 합쳐져있다는 것이 밝혀진 것이다. 실험을 더 진행시켜보니, 똑같은 tripartite leader를 가졌는데 뒤에 오는 단백질 서열만 다른 mRNA들이 발견되었고, 이는 결국 인트론과 RNA 이어맞추기의 발견으로 이어지게 되었다. == 메커니즘 == === 인트론 - 엑손 경계 === [[파일:intron-exon_boundary.png]] 인트론과 엑손은 그 경계에 특정 서열을 가지고 있다.[* Padgett RA, Grabowski PJ, Konarska MM, Seiler S, Sharp PA (1986). "Splicing of messenger RNA precursors". Annu. Rev. Biochem. 55: 1119–50.][* Breathnach, R. and Chambon, P. (1981) Organization and expression of eucaryotic split genes coding for proteins. Annu. Rev. Biochem. 50, 349–383] 이 서열들은 대부분의 인트론, 엑손에서 공통되는 서열들로, 5' splice site(혹은 donor site), branch site, 3' splice site(혹은 acceptor site) 총 세 부분으로 나뉜다. 5' splice site는 인트론의 5' 말단을 의미하고, 3' splice site는 인트론의 3' 말단을 의미한다. branch site는 인트론의 중간에 위치하는데, 엄밀히 따지면 3' 말단에 더 가까이 있고 뒤로 폴리피리미딘 서열이 뒤따른다. 5' splice site의 GU 서열, 3' splice site의 AG 서열, branch site의 A 서열은 모든 진핵생물에서 가장 잘 보존된 서열이며 인트론에 반드시 포함되어있다. 이와 반대로 엑손은 단백질 정보를 담아야하기 때문에 덜 보존되어있다. 참고로 그림자료에서 R은 [[퓨린]](A,G) 중 하나, Y는 피리미딘(C,U) 중 하나, N은 아무 염기 중 하나를 의미한다. === 이어맞추기 반응 === [[파일:splicing_reaction.png]] 인트론은 두번의 transesterification(에스테르 전이반응)에 의해 제거된다. branch site 아데노신(A)의 3'-OH(nucleophile)가 spliceosome(후술)의 도움을 받아 5' splice site 구아닌(G)의 인산기를 공격한다. 이렇게 G와 A가 인산디에스테르 결합으로 연결되어, 밧줄 매듭 모양의 루프를 만들게 된다. 이것을 '올가미(Lariat) 구조'라고 하고, A를 중심으로 세갈래길(3 way junction)이 만들어진다[* A는 이미 branch site에서 두개의 염기와 결합한 상태라는 것을 상기해보자.]. 그리고 G-A 연결에 의해 인트론 5'말단 쪽에 있던 exon이 절단된다. 절단된 5' 엑손의 3'-OH기는 인트론의 비슷한 방식으로 3' splice site를 절단하고 결합한다. 이렇게 인트론 루프와 조합된 엑손이 생기고, 이어맞추기는 끝나게 된다. RNA 사이에서도 이어맞추기가 일어나는 트랜스 스플라이싱도 있다. 그 매커니즘은 위와 같지만, 서로 분리되어 있던 RNA이기 때문에 올가미 모양(ρ[* 단순히 모양을 표현한 것일 뿐, 실제 저 기호의 의미와는 관련 없음]) 대신 Y자 모양의 인트론이 형성된다. == 이어맞추기 복합체(Spliceosome) == 이어맞추기의 기본적인 반응은 위와 같지만, 실은 전사와 마찬가지로 여러 단백질들이 반응을 도와야 한다. 그 단백질들이 이루는 복합체를 ‘이어맞추기 복합체(Spliceosome)’라고 한다. 이어맞추기 복합체는 5여개의 RNA와 150여개의 단백질로 구성된 [[리보자임]]이고, 이 중에서도 RNA가 대부분의 역할을 수행한다. U1, U2, U4, U5, U6, 총 5개의 snRNA[* small nuclear RNA로, 약 100~300bp의 길이다.]가 있고, 이 들이 150여개의 단백질과 복합체를 이루면서 snRNP[* small nuclear ribonucleoprotein complex]가 된다. [* 엄연히 말하자면, 이들이 결합한 중합체가 snRNP라 정의되는 것이 아니라, snRNP와 타 여러 단백질들이 결합하여 복합체를 이루고, 이것이 Spliceosome으로서 작용한다.] 물론 이것은 주(major) 이어맞추기 복합체의 구성이며, U11, U12 등을 이용하는 부(minor) 이어맞추기 복합체도 존재한다. 그러나 연관된 단백질들만 다르고 매커니즘 자체는 동일하기 때문에, 이 문서는 주 이어맞추기 복합체만 설명한다. [[파일:RNA-RNA_interactions.png]] 이어맞추기 복합체는 1. 5’ splice site와 branch site를 인식하고, 2. 둘을 가까이 위치하도록 해서, 3. RNA의 절단 및 결합을 촉매하게 된다. 위 그림자료는 snRNA들이 mRNA와 상호작용하는 예시들이다. 이런 RNA 사이의 결합들과, 다른 단백질들의 결합으로 구조적인 재배열이 일어나게 된다. 특히 U2와 U6은 각각 다른 mRNA 자리를 인식하면서도 서로 상호작용함을 볼 수 있다. 이로인해 5’ splice site와 branch site가 가까이 위치할 수 있게 된다. 비유를 하자면, 서로 다른 장소에 있던 원수지간을 외나무다리에서 만나게 해, 싸움을 유도하는 셈이다. 이어맞추기 복합체는 어떤 식으로 이어맞추기 반응을 보조하는가? 위의 RNA-RNA 상호작용이 관여하므로, 위 그림자료를 참고하면서 보면 좋다. [[파일:spliceosome_mediated_0.png|width=600]] 우선 5’ splice site에 U1이 결합하고, branch site 근처의 피리미딘(Y) 연속서열과 3’ splice site를 U2AF[* U2 auxiliary factor]가 인식해서 결합한다. U2AF는 두 개의 서브유닛이 있는데, 65kDa 짜리는 피리미딘 연속서열을, 35kDa 짜리는 3’ splice site를 인식한다. U2AF는 BBP[* branch-point binding protein]를 데려와 branch site에 결합시킨다. 참고로 BBP가 인식하는 branch site 서열은 U2와 같다. 여기까지를 ‘E[* early] 복합체’라고 부른다. BBP의 역할은 제대로 밝혀지지 않았다. [[파일:spliceosome_mediated_1.png|width=600]] U2는 U2AF를 인식해서 BBP의 자리에 대신 결합한다. 이 때 ATP가 소모되며, branch site 아데노신(A)이 bulge[* 그림처럼 볼록 튀어나온 형태]를 형성하게 된다. 어째서 bulge가 되는지는 위의 RNA-RNA 상호작용 그림자료를 참고하면된다. 여기까지는 ‘A 복합체’라고 한다. [[파일:spliceosome_mediated_2.png|width=600]] U2AF는 떨어져나가고 U4, U5, U6으로 이루어진 tri-snRNP 입자가 U1과 U2 사이에 결합한다. 이 결합에 의해 [[인트론]]이 휘어지게 된다. U4와 U6은 RNA 서열이 서로 상보적으로 결합한 상태이기 때문에, U6과 U2 사이의 상호작용은 일어나지 않는다. U5는 RNA가 아닌 단백질간의 상호작용으로 약하게 결합한 상태이다. 여기까지를 ‘B 복합체’라고 부른다. [[파일:spliceosome_mediated_3.png|width=600]] U6은 ATP를 소모하여 U1의 자리를 대체하게 된다. 그리고 U2와 U6 둘 사이를 가로막고 있던 U4가 빠져나가게 되면서, U2와 U6의 상호작용이 발생한다. 이 상호작용에 의해 다시 인트론 구조의 재배열이 생겨서 5’ splicte site와 branch site가 가까워진다. 그리고 이 상태를 ‘C 복합체’ 라고 부르는데, 이 때 에스테르 전이반응을 위한 [[활성 부위]]가 만들어진다[* U2와 U6 둘이서 만드는 것으로 보인다.]. 이전의 단계를 거쳐야만 RNA(U2, U6)에 의해 활성부위가 형성되기 때문에, 원치 않은 이어맞추기 반응을 방지할 수 있다. [[파일:spliceosome_mediated_4.png|width=600]] 이후 첫 번째 에스테르 전이반응이 발생하고, U5의 도움을 받아 두 번째 전이반응이 일어나서 이어맞추기가 끝나게 된다. C 복합체의 snRNP들은 제거된 인트론에 결합해있다가, 인트론이 빠르게 분해되면서 떨어져 나가 다른 이어맞추기 반응에 참여한다. 여기까지가 이어맞추기 복합체에 의한 이어맞추기 과정이다. 전체적인 반응은 [[:파일:spliceosome_mediated_reaction.png|이 문서]]를 참고하자. 물론 실제로는 저 경로를 일일이 차곡차곡 따르진 않는 게 함정. 당연하게도 생명체 내의 활동들은 물리나 화학처럼 엄격한 법칙에 의해 지배되는 것이 아니므로 각종 변종 반응들이 항상 도사리고 있다. 그래서 세포는 또 다른 기전들을 준비해놓았다. === 자가 스플라이싱 === 올가미 구조를 만드는 이유는 자가 스플라이싱 Rna 에서 기원했기 때문이다. tRNA 가공 과정에서는 바로 이어주기가 가능하다. 물론 그룹 별로 세부 과정이 다르기 때문에 찌꺼기가 올가미가 아닐 수 있다. === 선택적 스플라이싱 === 위와 같이 특정 유전자가 항상 Spliceosome으로 적절하게 인식돼서 똑같이 처리되는 것을 Constitutive splicing event 이라고 한다. Alternative splicing은 말 그대로 전자와는 다르게 선택적으로 엑손을 인트론 취급한다든지 해서 여러 다른 mRNA 가 튀어나오는 스플라이싱을 칭한다. 그 결과, 하나의 유전자에서 여러가지 단백질이 탄생하게 된다. 이러한 Alternative splicing은 pre-mRNA 의 cis-acting RNA element에 의해 일어나게 되고, DNA 전사 조절에서의 조절요소 와 거의 똑같은 역할을 한다. 이는 spliceosome에 의해 인식되는 Splicing signal과 SREs로 구분된다. SREs는 rna위의 위치에 따라서(엑손 위에있는지 인트론 위에 있는지), 그리고 그 기능에 따라서(엑손을 잘라내게끔 하는 silencer 와 그 반대인enhancer)에 따라 ESEs, ESSs, ISEs, ISSs 로 나뉜다. 또한 이러한 SREs 에 결합 조절하는 애들은 rna가 아니라 단백질만 확인되었다. [[분류:분자생물학]][[분류:세포 수준 과정]][[분류:RNA]]