다양한 스토리를 담고 있는 연재를 만나보세요.
[분자생태학 톺아보기] 3편- 생명의 나무, 계통수
Bio통신원(Pisces)
지난 연재에서는 분자생태학의 개념 그리고 분자생태학의 분자마커에 대해 살펴보았다. 이제는 본격적으로 분자생태학의 세부 연구분야인 분자계통학에 대해 톺아보려 한다.
1. 들어가며
그림1. 나주오씨의 700년의 역사가 담긴 족보(나주오씨참봉공파화수도) [출처]
모든 인간은 자신의 뿌리에 대한 궁극적인 호기심을 갖고 있다. 그 호기심을 채워줄 수 있는 방법은 바로 족보를 보는 것이다. 인간은 재미있게도 족보를 넘어 주변의 모든 생명들의 족보까지 알고 싶어하는 지구상 유일무이한 존재이다. 또한 나와 내 주변 존재가 어떤 연관성을 갖고 있는지 궁금해 하는 존재이기도 하다. 이러한 호기심을 채워 줄 수 있는 분야는 바로 계통학이다.
계통학은 생물 간의 유사성과 차이점을 바탕으로 계통수(생명의 나무)를 그려냄으로써 생명의 진화사(evolutionary history)를 추론하는 분야를 말한다. 계통수는 이름 그대로 생명의 진화사를 나무의 형태로 그린 것이다. 나무를 보면 하나의 줄기에서 수많은 가지들이 갈라져 나가는 패턴을 볼 수 있는데, 여기서 줄기를 하나의 공통조상, 수 많은 가지의 말단을 종/집단으로 대입해 볼 수 있다. 이 계통수의 가지 말단을 가까이서 보면 가족/집단의 관계를 나타낸 가계도가 되고, 좀 더 멀리서 조망한다면 종, 더 나아가 종들이 묶인 상위분류군(higher taxa)의 역사를 들여다 볼 수 있다. 계통수는 그 자체로 진화가 걸어온 궤적을 보여주며 동시에 진화의 현재 그리고 앞으로의 방향에 대한 통찰도 제공할 수 있다.
2. 분자계통학의 등장배경
분자계통학은 분자를 이용한 계통학의 한 갈래이다. 계통학은 한마디로 계통수를 통해 박물학과 분류학에서 발굴해온 종들이 어떻게 갈라져 나왔는지 그 분기하는 패턴을 연구하는 것이다(물론 분기만 하는 것은 아니고 때로 분화된 그룹이 합쳐지거나 분화된 그룹이 잡종을 형성해 제3의 그룹을 만들어내기도 한다). 이러한 계통학의 역사는 박물학에서 처음 시작되었다. 지구상의 생물다양성을 발굴하고 기록하는 그들은 박물학자로 불렸다. 그들은 다양한 생물들을 관찰하고 그들의 형태적 생태적 차이를 기록해 나갔고 신종들을 발표해왔다. 초기에는 미세한 차이까지 들여다 보지 않더라도 신종을 발표할 수 있었지만, 시간이 지나서 상당한 종들이 발표된 뒤에는 미세한 차이까지 들여다 봐야 했다. 결과적으로 각 종들 사이에 유사성과 차이점의 정도에 크고 작은 차이가 있는 것을 알게 되었고, 자연스럽게 생물들 사이의 공통점과 차이점의 정도를 기준으로 모둠을 묶기 시작했다. 이러한 체계는 결국 린네에 의해 종/속/과/목/강/문/계의 분류체계로 정립되어 현재까지 이어지게 된다.
그림2. 다윈의 노트에 기록된 ‘전설적인’ 계통수
이렇게 다양한 종들이 수집되고 발표되고 또 모둠으로 묶이던 박물학의 전성기에 한 젊은 박물학자가 세계일주에서 돌아온 뒤 책 한권을 출판한다. 그는 지구상의 모든 생명체들이 독립적인 창조물이 아닌, 유기적으로 연결된 ‘공통조상’을 공유하는 후예임을 그의 평생에 걸쳐 세상에 분명히 각인시켰다. 그의 이름은 바로 찰스 다윈. 다윈은 생명의 나무를 통해 생물들이 독립적인 존재가 아니고 연관되어 있는 관계임을 제안했으며, 인간 역시 그 가지의 한 끝에 불과함을 역설한다.
다윈은 진화적 관점이 통합된 ‘계통수’ 개념을 완성시켰다. 그리고 “분류군들은 결국 하나의 조상형으로부터 계승된 형태적 유사성을 공유하는 것이 아닐까”라고 하는 계통학의 기본 골격이 될 핵심적인 질문으로 발전한다. 이는 박물학자들이 발표하고 모둠지어온 분류군이 결국 공통조상을 공유하는 모든 후손들의 집합(바꿔 말해 단계통)일 것이라는 이론을 강화시켰다. 이 아이디어에 공감한 박물학자들은 이 이론을 검증하기 위한 시대적 요구에 부응하여 계통학자로 거듭나 지금에 이르게 된다.
형태적 형질에 근거한 계통학적 연구는 초창기에 꽤 성공적이었다. 그 결과 계통수 상의 많은 가지들이 완성되고‘잠정적으로’ 제안되었다. 그런데, 어느 순간 한계에 봉착하게 된다. 한계는 크게 여섯 가지였다.
첫째, 비교할만한 형태적 형질은 종종 일부 분류군 내에서 누락된다. 예를 들어 눈의 미세한 형태 기준으로 묶인 속이 있었는데, 새로 발견된 어떤 종에서 눈이 소실된 경우 눈을 기준으로 종을 묶는 시도는 힘들어진다. 만약 모든 특징이 유사하고 눈의 구조만이 다르다고 한다면, 어떤 모둠을 묶는다는 건 불가능하다. 놀랍지 않게도 이러한 일은 비일비재하다.
둘째, 일부 종들의 모둠에선 형태적 차이가 극단적으로 차이가 나는 경우도 존재했는데, 이러한 경우는 흔히 진화적으로 짧은 시간동안 폭발적인 종분화, 다시 말해 적응방산(adaptive radiation)을 겪은 분류군에서 흔했다. 이런 경우는 형태적 차이가 너무 극단적이어서 유사한 형태적 형질을 바탕으로 모둠을 묶는다는 게 불가능했다. 대표적으로 이러한 적응방산이 일어난 분류군으로는 아프리카의 말라위, 탕가니카 호수에 사는 담수어류인 시클리드류가 해당된다.
셋째, 잡종에 의한 기원을 갖는 종의 경우 형태적 요소만으로 어느 그룹에 묶어야 할지 판단을 내리는 것은 쉽지 않다. 어떤 생물들은 오랜 예전에 서로 다른 종들의 교잡에 의해 새로운 계통으로 탄생했다. 이런 경우 형태적 특징이 희석되거나 한쪽 계통만을 반영하여 도대체 어떤 두 종이 잡종을 일으켜 새로운 계통을 만든 것인지 알 수 없다.
넷째, 형태의 유사성은 종종 조상을 공유하지 않더라도 나타난다. 이러한 ‘상사’는 형태를 기준으로 한 계통분석을 방해한다. 날개라는 특징을 공유하는 생물들을 하나의 모둠으로 묶어 놓는다면, 아가미가 그 기원으로 추정되는 곤충과 다리가 변형된 새는 같은 모둠으로 묶일 것이다. 물론 이러한 극단적 사례는 충분히 극복할 수 있을 것이다. 하지만 극단적이지 않은 사례의 경우는 극복할 수 있는 방법이 없다시피 하다.
다섯째, 앞서 언급한 이유들로 인해 활용 가능한 형태 형질의 숫자는 적다. 일반적으로 서로 다른 생물들 사이에 형태 데이터는 극도로 취하기 어렵고 그 숫자도 제한적이다. 특히 앞서 언급한 적응방산이 발생한 분류군의 경우는 형태적 유사성이 극도로 제한적이다. 서로 다른 종을 대상으로 하는 경우도 제한적이지만, 더 나아가 같은 종의 서로 다른 집단을 대상으로 형태적 차이를 추출하기란 여간 어려운 점이 아니다.
여섯째, 표현형적 형질은 종종 주관적인 경우가 있다. 진달래의 색을 누군가는 보라색이라 하지만, 누군가는 연보라색이라고 할 것이다. 누군가가 어떤 꽃의 모둠을 보라색의 색상을 기준으로 규정지었다고 가정한다면, 연보라색의 꽃도 그 모둠에 속해야 하는 것인지 애매해질 수 있다.
반면, 분자데이터를 활용한 계통학은 형태에 비해 상대적으로 덜 변하는 보존적인 특성을 지닌 중립적인 변이들을 분석에 이용하기 때문에 만약 적절한 변이를 보유한 충분히 많은 숫자의 적절한 상동유전자들만 비교한다면, 앞서 설명한 문제들을 극복할 수 있는 훌륭한 대안이 될 수 있으며, 실제로 분자계통학은 형태만으로 그려낼 수 없었던 생명의 나무의 공백을 메꿔 나가고 있다.
이제 형태 데이터만으로 계통학적 해석을 하는 경우는 찾아보기 힘들어지고 있다. 이미 완전히 멸종해버린 분류군을 대상으로 하는 경우 이외에 현생종에 대해서는 형태 형질은 단독으로 활용되지 않고 분자계통 분석 결과와 함께 활용되고 있다. 결국 분자 데이터를 활용한 계통수가 기반이 되고, 형태적 특징의 진화적 패턴을 해석하는 쪽으로 무게중심이 이동했다.
분자계통학은 기존의 계통학적 분석에 영향력을 미치는 것을 넘어 이제는 계통학적 가설과 분류체계에도 상당한 수준의 영향을 끼치기 시작한다. 다시 말해, 분자계통학은 새로운 분류군들의 발굴하는데 증거를 제시할 수 있을 뿐만 아니라 기존의 분류체계를 변화시키고 생성되어 왔는지 그 진화적 역사를 분자계통학이라는 강력한 도구를 통해 이해해 나가고 있다.
3. 분자계통학의 주요 이론
(가) 합류이론(coalescent theory)
그림 3. 합류이론의 개념도. 과거의 하나의 현재의 변이를 시간을 거슬러 올라가면 어느 한 세대의 공통조상에서 출발하는 것을 알 수 있다 [출처]
유전체에 변이들은 끊임없이 생성된다. 만약 그 변이가 생존에 불리하다면 세대를 거듭하며 사라지고(purifying selection), 생존에 유리하다면 그 변이는 세대를 거듭하며 집단 내에 확산될 것이다(positive selection). 하지만, 그 변이가 개체의 생존에 아무런 영향을 미치지 않는다면 다시 말해 중립적인 변이라면 집단에서 사라질 수도 일정 부분 유지될 수도 혹은 집단 전체에 확산될 수도 있다. 이러한 중립적인 변이들은 종 혹은 집단이 나뉘어짐에 따라 서로 독립적인 특성을 갖게 될 가능성이 세대를 거치며 증가된다.
이는 산맥, 바다와 같이 지리적인 장벽으로 단절된 지역 간에 언어가 조금씩 달라지는 것으로 비유 할 수 있다. 비교적 교류가 최근까지 있었던 인접한 문화권 사이에는 비슷한 언어를 갖지만, 멀리 떨어지고 교류가 없었던 문화권 사이에는 언어 상의 유사성을 찾기가 어려운 이유는 격리된 문화권 내에서 무작위적으로 우연에 의해 바뀐 어휘, 억양 등이 집단 내에 확산되었기 때문이다. 결과적으로 가까운 관계를 갖는 종들 사이에서는 변이의 유사성이 높고 멀리 떨어진 관계 사이에는 변이의 유사성이 낮을 것으로 예상할 수 있다. 이는 여러 실험적 증거를 통해 증명되어 왔고, 분자계통학을 관통하는 가장 근본적인 가정인“유사한 변이를 공유하는 두 종은 그렇지 않은 종보다 최근까지 조상을 공유했을 가능성이 높을 것이다.”로 완성된다.
(나) 파시모니(parsimony)
어떤 분류군이 공유하는 변이가 있다고 가정할 때 그 변이는 공통조상 이전부터 유지되어 왔거나 그 그룹의 공통조상이 자매군(공통조상을 공유하는 가장 가까운 분류군)과 나뉠 때 획득되었거나 아니면 독립적으로 각 후손들이 획득했을 가능성이 있다[1]. 이때 최소한의 변화만에 더욱 무게를 두는 것을 파시모니(parsimony)의 원리라 한다. 어떤 결과를 설명하는 여러 시나리오가 있을 때 그중 가장 덜 복잡한 시나리오가 실제에 가깝다고 보는 것이다. 쉽게말해‘포유류의 젖샘’의 형질이 후손종의 종분화 이후 독립적으로 획득된 형질이 아니라, 공통조상에서 딱 한번 진화한 뒤 후손들이 그대로 물려받게된 형질일 가능성을 더 높게 보는 것이다. 이 고전적 접근법은 복잡성 있는 형태적 형질의 진화를 설명하는데 이용되어 왔다. 하지만 그 예외가 적지 않아 이 가정만을 기반으로 분석을 하는 경우는 점점 드물어지고 있다. 파시모니는 불필요한 가정을 최소화한다는 점에서 ‘오컴의 면도날’과도 유사성을 갖고 있다.
4. 분자계통학은 무엇을 설명할 수 있는가?
종 혹은 집단이 어떤 양상으로 갈라져 나왔는지 다시말해 종분화의 역사를 설명할 수 있는 분자계통학은 다음의 질문들에 대한 ‘잠정적인’ 증거를 제공할 수 있다. ‘잠정적인’이라는 표현을 강조한 이유는 이것은 어디까지나 주어진 데이터를 바탕으로 추론된 결과이기 때문이다. 분자계통학에서‘흔들림 없이 견고한’ 이란 표현은 타임머신이 발명되고 과거로 돌아가서 진화의 현장을 보기 전까지 사용할 수 없다.
(가) 분류체계 검증
그림 4. 단계통, 측계통, 다계통에 대한 설명 [출처 : 진화학]
적절한 표본들을 확보하여 계통수를 작성하면, 연구대상종과 가장 최근까지 공통조상(most recent common ancestor, MRCA)을 공유한 자매군(sister group or sister taxon)을 알 수 있다. 만약 형태, 생태를 기반으로 기존에 자매군이 이미 제시되었다면, 계통수를 통해 기존 자매군의 타당성을 검증 할 수 있다. 자매군은 진화적 분석에서 매우 중요한데, 자매군의 설정이 잘못되면, 왜곡된 진화적 역사를 추론하게 될 뿐만 아니라 광범위한 분자생태학 분야의 연구에 혼란을 초래하게 된다.
실제로 이런 사례는 종종 볼 수 있다. 같은 지역에서 공존하던 형태적으로 유사한 A종과 B종이 있었는데, 혹자는 이 두 종을 MRCA를 갖는 자매군으로 가정했고, 이 두 종이 동소적 종분화(sympatric speciation)에 의해 분화했을 것이라고 결론 내린다. 하지만, 광범위한 분류군을 수집한 계통수 분석결과A종의 자매군은 공서하던 B종이 아닌 다른 먼 지역에 분포하던C종이었던 것으로 밝혀진다.
비단 자매군 뿐만 아니라 분자계통학은 분류 체계에 대한 검증을 수행할 수 있다. 이를 위해서는 단계통, 다계통, 측계통의 개념을 우선 이해해야 한다. 이들 개념이 생소한 분들을 위해 예를 들어 설명하자면,지구상에 20종의고양이과, 30종의 개과 동물이 있다고 가정했을 때, 계통수 상에서 고양이류 20종이 하나의 가지에서 시작되었고, 고양이류를 하나의 과(family)로 묶었다면 이것은 단계통(monophyly)에 해당된다. 다시 말해 단계통은 “하나의 공통조상에서 유래된 후손종들 전체의 집합”을 말한다. 한편, 20종의 고양이류와 3종의 개과 동물을 포함시켜 누군가 ‘개냥이’라는 분류체계를 제안했다면, 그것은 다계통(polyphyly)에 해당된다. “하나의 모둠에 여러 조상에서 기원한 후손들이 포함”되었기 때문이다. 만약 18종의 고양이류를 하나의 과로 규정하며 2종을 누락한다면 그것은 측계통(paraphyly)에 해당된다. “하나의 조상에서 유래된 후손종이 모두 포함되지 않은 채 일부가 누락”되었기 때문이다.
이상적인 분류체계는 한 조상을 공유하는 모든 분류군을 포괄하는 단계통이다. 단계통이 아닌 분류군은 지지받지 못하고 사라져가며 또한 그래야 한다. 기존분류체계들이 계통수 상에서 어떻게 구현되었는지 검증함으로써 기존 분류체계는 보다 완전하고 견고한 계통수로 진화하고 있다.
(나) 분기연대추정(divergence time estimation)
그림 5.분기시점과 조상분포지점 추정. node의 색상은 각 조상종의 분포지점을 나타낸다. S. gracilis majimae (SG)와 S. multimaculatus의 MRCA는 플라이스토세 초기에 SG의 분포지역에 분포했던 것으로 나타난다. [출처]
한편, 분자계통학에서는 중립적인 변이가 점진적으로 누적되는 경향을 응용한 분자시계(molecular clock)의 개념을 활용하여 분기연대를 추정(divergence time estimation)을 할 수 있다. 이전 연재에서도 설명하였지만, 다시 단순 부연하자면, A종과 B종 사이에 분자마커(1,000 bp) 에 7 bp의 변이가 있고, 그 분자마커가 1백만년 마다 1,000 bp 당 1개의 변이가 생기는 변이율을 갖는다면, 단순 계산으로 두 종은 약 7백만년전 분기했을 것으로 추정할 수 있을 것이다. 종이 분화하는 시기를 아는 것은 과거의 지질학적 사건들과 종의 분기 사이의 연관성을 추론할 수 있는 기회를 제공한다. 예를 들어 한국과 일본에 각각 분포하는 육상동물 자매군 사이의 분기시기가 대한해협이 형성된 시기와 상응한다면, 해협의 형성이 공통조상의 지리적 장벽으로 작용해 이소적분화를 가능하게 했을 것이라는 가설을 제시할 수 있을 것이다. 만약 분기시기가 해협 형성보다 훨씬 이전이라면, 해협형성이 종분화에 기여하지 않았다는 이론을 제시할 수 있다. 실제로 한국 동남부의 양산단층의 활동에 의한 하천의 연결사건(하천쟁탈, river capture)은 해당 지역에 분포하는 담수어류 자매군의 분화시기로 추정할 수 있었다.
(다) 조상의 지리적 분포 추정
종 다양성은 종분화(speciation)에 의해 나타나며 이 종분화는 크게 지리적 격리로 인해 유전적 교류가 차단되어 서로 다른 종으로 점진적으로 분화하는 이소적 종분화(allopatric speciation), 지리적 장벽이 없음에도 종분화가 일어나는 동소적 종분화(sympatric speciation)로 이루어진다. 이 지리적 맥락의 종분화를 검토하기 위한 방법은 과거에 조상종이 분포했던 지역을 아는 것이다. 이상적인 것은 화석기록이겠지만, 분자계통학으로도 그에 대한 간접적인 증거를 확보하는 것이 가능하다. 계통수와 현생종의 지리적 분포 데이터를 바탕으로 조상종의 분포지역을 몇 가지 모델로 추정하는 것이 바로 그것이다. 이 추정을 바탕으로 현재 존재하는 종이 이주(dispersal)를 통해 현재의 분포를 갖게 되었는지, 아니면 지리적 분단(vicariance)으로 인해 현재의 분포를 갖게 된 것인지 그도 아니면 두 요인이 모두 기여한 것인지 추론할 수 있다. 이러한 ‘지리적 분포 추정’은 전술한 ‘분기연대추정’과 ‘고지리학적 증거들’과 함께 과거의 역사에 대한 보다 선명한 밑그림을 그리는데 도움을 주며 이런 연구 분야를‘계통지리학(phylgeography)’이라 한다[2]. 계통지리학의 성과가 축적되면서 최근에는 어느 지역에 분포하는 다양한 분류군의 역사를 비교하여 종합하는 비교계통지리학(comparative phylogeography)으로 발전하였다.
한편, 조상 분포 지역의 추정은 과거의 환경을 추정하는데 실마리를 제공하기도 한다. 여기에는 전제가 하나 필요한데, 조상종이 살아갔을 환경이 현생종이 선호하는 이라는niche conservatism이 바로 그것이다. 중생대부터 지금까지 형태적 변화가 거의 없는 은행나무의 경우, 화석 증거들로 추정된 서식환경이 지금 현생종이 사는 환경과 유사하여, niche conservatism의 대표적 사례로 잘 알려져 있다[3]. 이러한 개념을 전제한다면, 과거에 해당 분류군의 계통이 분포했을 것으로 추정된 지역이 현생종이 사는 환경과 유사한 환경이었으리라 추정할 수 있다.
(라) 형질 진화의 패턴 규명
그림 6. 형질 진화 계통수. 15종의 단계통 그룹 내에서 검은색 형질은 독립적으로 두 번 진화한 것으로 나타난다.
다양한 생물들의 형태적 특성들이 조상으로부터 전해져 내려온 것인지 아니면, 종으로 분화된 이후 독립적으로 획득한 것인지 판별하는 것은 화석을 통해 과거의 형질에 대한 증거를 얻지 않는 이상 알 수 없는 영역이다. 설령 화석이 존재할지라도 화석으로 판별하기 어려운 형질들의 조상상태(부드러운 조직의 형태, 생태적 특징 등)는 알 수가 없다. 하지만, 형태와 독립적인 데이터로 작성된 계통수가 존재하고 그 계통수에 형태적 특성을 대입하면, 해당 형질이 어떻게 진화되어 왔는지 설명할 수 있다. 다시 말해, 그 형질이 상사적 형질인지 아니면 상동적 형질인지 판별할 수 있는 것이다. 예를 들어, 하품이란 행동은 턱을 갖는 모든 척추동물들이 공유하는데, [참고영상]. 턱을 갖는 현생척추동물류(유악하문, Gnathostomata)는 하나의 공통조상을 공유하는 모둠으로 여겨지기 때문에 후손들의 하품 행동의 유사성은 공통조상에서 유래된 유사성으로 볼 수 있다. 만약 계통수 상에서 유악하문 내에 일부 종들이 다른 공통조상에서 기원한 것으로 나타난다면, 하품이란 행동의 진화는 독립적으로 여러 번 있었다고 봐야 할 것이다.
(마) 은밀종의 발굴
그림7. 다른 종 사이에 형태적 차이는 반드시 뚜렷하게 존재해야만 할까? [출처]
은밀종(cryptic species)이란 형태적 유사성으로 말미암아 기존의 분류학적 연구에서 밝혀지지 않은 종을 말한다. 생물종을 바라보는 전통적인 형태 기반의 관점을 위배하는 것처럼 보이기 때문에 이에 대해 회의적인 시선을 갖는 경우가 여전히 상존하고 있다. 하지만, 종의 개념에 인간에게 식별이 용이한 다른 형태를 반드시 갖고 있어야 한다는 기준이나 이유는 없다 [4]. 은밀종은 엄연히 다른 집단들과 분기되어온 진화적 역사를 보여주기 때문에 최근에 활발히 새로운 분류군으로 발표되고 있다. 또한 채 밝혀지지 않고 사라질 위기에 처한 경우도 있어 이에 대한 연구는 보다 활발해져야 할 것이다 [5].
필자 역시 계통수를 은밀종을 발견하는 증거 중 하나로 이용하였다. 어떤 담수어류의 특정 집단의 형태가 다른 집단과 미세하게 다르다는 점을 발견하고, 미토콘드리아와 핵의 총 3개 좌위의 유전자 계통수를 작성해보니 다른 집단과 분기되는 경향을 발견한다. 다시 말해 이 집단은 다른 집단과 유전적 교류가 없었던 단일한 집단일 가능성이 높다는 것이다. 이들 집단은 다른 집단과 생식적 격리(reproductive isolation)를 갖고 있다는 선행연구까지 있었기에 이 은밀종은 새로운 종으로 발표되게 된다.
(바) 언어 및 문화의 역사 추정
계통학은비단 생물의 분기 뿐만 아니라 조상형으로부터 시간에 따라 분기되어온 거의 모든 것들을 분석하는데 도움을 줄 수 있다. 언어와 문화 역시 예외가 아니다[6].
그림 8. 언어의 진화 계통수
대표적으로 빨간망토 이야기도 계통학적 분석을 통해 그 이야기의 기원과 역사에 대한 연구가 이루어졌다[7]. 연구자들은 빨간망토 이야기의 다양한 버전(변이)가 각 문화지역마다 존재한다는 것을 발견하고 그 이야기들로부터 주인공의 특징, 빌런의 특징, 빌런의 속임수 등의 각 요소들을 추출한 뒤 계통수를 작성하였다. 계통수 결과는 빨간망토 이야기의 기원이 중동지역이며, 이후 아시아, 아프리카, 유럽의 세가지 갈래로 확산되는 것으로 나타났다.
5. 분자계통학의 실전
(가) 적절한 분자마커 선정
분자계통학은 이전 글에서 살펴봤듯이 분자마커의 특성에 의존적이다. 따라서 적절한 분자마커의 선정이 중요하다. 미세한 개미를 관찰하기 위해 해부현미경을 사용해야 하듯 최근에 분화되었을 것으로 추정되는 형태적으로 매우 유사하고 지리적으로도 인접한 분류군 사이의 계통학적 관계를 추론한다면, 변이가 쉽게 누적되어온 분자마커를 사용해야 한다. 한편, 상위분류체계 다시 말해 보다 먼 관계의 다양한 생물들 사이의 계통학적 분석을 하고 싶다면 보다 보존적인 다수의 분자마커를 활용하는 것이 유리하다.
일반적으로 계통수는 여러 유전좌위의 독립적인 역사를 종합한 계통수를 그 분석에 이용한다. 미토콘드리아 게놈의 좌위들은 서로 연관되어 있으므로 일반적으로 핵 게놈에 존재하는 복수의 좌위를 포함시켜 종계통수(species tree)를 작성한다. 여기에는 중복(duplication)이 없고, 재조합에서 자유로우며, 동형접합상태인 유전자들이 주로 이용된다. 또한 이 유전자는 비교하고자 하는 종들 사이에 공통적으로 존재해야 하고 동일한 기원을 갖는 상동적인 유전자여야 한다. 만약 그렇지 않다면, 종/집단의 진화적 역사를 추정하는게 아니라 그 유전자의 진화만을 반영하는 결과를 얻게 될 것이다. 일반적으로 이러한 조건을 만족하는 유전자들은 기능적으로 보존적이다.
(나) 비교하고자 하는 분류군 수집(taxon sampling)
대부분의 분자 계통 분석을 수행할 때 범하는 오류는 비교하고자 하는 대상을 충분히 확보하지 않은 상태에서 성급하게 분석을 시도하는 것이다. 예를 들어 한국에 존재하는 어떤 물고기의 계통학적 역사를 규명하겠다면, 그 종과 자매군으로 추정된 모든 분류군을 수집해야 한다. 흔히 저지르는 오류는 한국의 물고기를 연구하겠다면서 정말로 한국에서만 표본을 모으는 것이다. 분류군을 수집하는 것에 따라 잘못된 해석이 얼마든지 가능함을 잘 보여주는 일화라 할 수 있다.
(다) 아웃그룹설정(outgroup)
실험에는 실험군과 대조군이 존재해야 하듯 분자계통학에서는 그 변이들의 토대가 된 조상형이 요구된다. 조상형으로부터 어떻게 파생해 나갔는지를 알아야 하기 때문이다. 그러한 원래의 토대를 제공하는 것이 바로 아웃그룹이다. 아웃그룹은 일반적으로 연구하고자 하는 분류군의 자매군을 이용한다.
(라) 염기서열 정렬하기(Alignment)
선정된 마커와 샘플들로부터 유전자 단편들이 확보되었다면, 그 다음에는 서열들을 정렬해주는 과정을 거친다. 계통수를 그릴 때에는 각 염기 위치마다 비교하기 때문에 잘못된 염기서열 정렬은 왜곡된 결과를 만들어낼 수 있다.
(마) 적절한 염기 진화 모델 추정하기(model selection)
염기 서열 정렬과정을 마쳤다면, 계통수를 그리기 위한 데이터는 완성되었다. 계통수를 그릴 때는 크게 세가지 알고리듬을 사용하는데, 이웃연결법(neighbor-joining, NJ), 최대개연성법(maximum likelihood, ML), 베이즈 추론법(Bayesian inference, BI)이 그것이다. 특히 후자의 두 접근법은 염기가 진화되는 모델에 대한 사전 탐색이 요구되며, 이 모델이 분석 결과에 차이를 야기할 수 있다. 염기의 치환의 가능성이 무작위 적인지 아니면 어떤 일정한 패턴이 있는지 아니면 둘 다 인지 명확한 답을 내리는 것은 쉽지 않기에, 염기진화에 대한 여러 모델이 제안되어 왔고 연구자들은 그 모델을 자신의 데이터에 테스트한 뒤 최적의 모델을 취해 계통수를 그리게 된다.
(바) 계통수작성하기
일반적으로 계통수의 패턴을 살펴보기 위해서는 전술한 세가지 알고리듬을 모두 이용하곤 한다. 여러 유용한 공개소프트웨어가 있고, 누구나 쉽게 튜토리얼을 따라서 계통수를 그려볼 수 있다. NJ의 경우 PAUP, MEGA 등이 애용되며, ML의 경우 IQTREE, RAxML, BI의 경우 MrBayes가 독보적이다. BI의 경우 확률분포값을 얻기 위한 MCMC (Markov chain Monte Carlo) 분석에 오랜 시간이 소요되므로 시간을 절약하고자 한다면, 고사양의 컴퓨터로 진행하는 것이 좋다.
(사) 계통수 해석하기
상기한 계통수 만들기 과정은 조금의 시간과 노력을 들인다면 누구나 만들 수 있지만, 완성된 계통수를 해석하는 것은 여러가지 개념적 이해가 선행되어야 한다. 우선 계통수의 각 부분의 위치에 대한 이름을 아는 것이 중요하다. 나뭇가지에 상응되는 계통수의 부위를 말그대로 branch로 부르며, 나뭇가지 끝에는 각 분류군이 위치한다. 나뭇가지의 분기가 일어난 지점을 node라고 한다. 계통수 상에서 3개 이상의 branch가 하나의 node에서 갈라져 나온 경우를 polytomy라고 한다. 자연계에서 3개 이상의 계통이 동시에 분기하는 사례는 거의 없으며, Polytomy 문제를 해결하기 위해서는 보다 해상력 있는 마커의 추가가 효과적이다.
그림9. 계통수 예시. A~H가 포함된 분류군은 하나의 공통조상에서 기원한 단계통이다. [출처]
계통수를 보았을 때 branch의 끝은 현생종들이고 각 branch를 따라 올라가다 보면 node를 만나게 되는데, 그 첫번째 node를 공유하는 종이 앞서 말했던 MRCA를 공유하는 자매군이다. 쉽게 예를 들면, 인간이 속한 Homo속의 자매속은 침팬지 보노보가 속한 Pan 속으로 이 두 속은 하나의 MRCA에서 분화된 것이다. 여기서 흔히 하는 오해는 인간이 Pan 속으로부터 진화되었다고 생각하는 것인데 자매는 공통적인 부모를 두고 있을 뿐이다. 노드를 지나서 계속 branch를 거슬러 올라가다 보면 어느덧 그 분류군이 시작된 단 하나의 공통조상을 마주하게 된다. 여기서 가장 먼저 branch가 나온 분류군이 있다. 비유하자면 자매들 중 가장 먼저 집에서 독립한 첫째딸과 같다. 이 첫째딸을 basal 이라 한다. basal은 부모인 조상형의 특징을 보유하고 있는 경우가 종종 있다. 이러한 계통 분기의 양상에 앞서 언급한 시간, 공간적 분석을 곁들이면 해당 분류군의 진화적 역사에 대한 근사한 이론이 만들어진다.
7. 맺음말
이상으로 분자계통학에 대해 간단히 살펴보았다. 지구상의 생명들이 지금에 이르기까지 거쳐온 역사를 파악하는 것은 여전히 해결되어야 할 숙제로 남아있다. 이 글을 통해 그 숙제를 해나갈 사람이 한명이라도 더 늘어나길 바란다.
8. 참고문헌
[1] Hennig, W. (1966). Phylogenetic Systematics. Universito of Illinois
[2] Avise, J. C. (2000). Phylogeography: the history and formation of species. Harvard university press.
[3]Royer, D. L., Hickey, L. J., & Wing, S. L. (2003). Ecological conservatism in the “living fossil” Ginkgo. Paleobiology, 29(1), 84-104.
[4] De Queiroz, K. (2005). Ernst Mayr and the modern concept of species.Proceedings of the National Academy of Sciences, 102(suppl 1), 6600-6607.
[5] Yan, F., Lü, J., Zhang, B., Yuan, Z., Zhao, H., Huang, S., ... & Chen, S. (2018). The Chinese giant salamander exemplifies the hidden extinction of cryptic species. Current Biology, 28(10), R590-R592.
[6] Kitchen, A., Ehret, C., Assefa, S., & Mulligan, C. J. (2009). Bayesian phylogenetic analysis of Semitic languages identifies an Early Bronze Age origin of Semitic in the Near East. Proceedings of the Royal Society B: Biological Sciences, 276(1668), 2703-2710.
[7] Tehrani, J. J. (2013). The phylogeny of little red riding hood. PloS one, 8(11), e78871.
계통수 해석 관련 참고 링크
https://www.digitalatlasofancientlife.org/learn/systematics/phylogenetics/reading-trees/
본 기사는 네티즌에 의해 작성되었거나 기관에서 작성된 보도자료로, BRIC의 입장이 아님을 밝힙니다. 또한 내용 중 개인에게 중요하다고 생각되는 부분은 사실확인을 꼭 하시기 바랍니다.
[기사 오류 신고하기]
분자생태학을 전공하고 현재 박사후 연구원으로 “인위적 교란에 따른 담수어류의 진화"를 집단유전체의 방법론으로 연구하고 있다. 과학자는 지식의 발견과 더불어 지식의 확산이라는 소명을 갖고, 분자생태학에 대한 이해를 증진시키고 저변을 확대하고자 연재를 시작하게 되었다.
다른 연재기사 보기
전체 보기