실험Q&A를 통해 여러분의 지식을 나누어 주세요. 답변을 등록하시려면 로그인 해주세요.
본 정보는 네티즌에 의해 작성된 정보로, 내용 중 중요하다고 생각되는 부분은 추가적인 사실 확인을 반드시 하시길 바랍니다.
-
마른보이
(비회원)
-
06.12.11 15:43
생각보다 복잡한 내용입니다. 배경지식들도 필요로 하구요. 책 추천해 드립니다.
Hall, B. G. Phylogenetic trees made easy: A how-to manual for molecular biologists. Sinauer Associates, Inc. 179 pp. (2001).
1. Maximum parsimony; 최대절약분석. 각각의 염기변이를 하나의 형질로 보고 계통수 추론 시 형질 변이의 합이 최소로 되는 방향으로 설정. 가장 짧은 계통수가 분류군들의 진화역사를 담고 있는 진짜 계통수라는 가정에서 출발.
2. Distance methods; 각각의 염기 치환을 계산식을 통해 분류군들간의 차이를 계통수에서의 길이로 표현. UPGMA와 Neighbor Joining (근린결합분석)은 수식의 차이.
3. Maximum likelihood; 최대유사분석. 염기변이의 치환에 진화적 모델을 채용하여 계통수에서 표현.
=> Maximum parsimony는 염기변이를 각각의 형질로 파악하여 원시형질과 파생형질로 구분함. Distance methods는 염기변이를 차이로 계산하여 분석. Maximum likelihood는 차이를 분석할 때 가상적인 진화적 모델을 채용하여 가장 있을 법한 경로로 추정.
트리 알고리즘의 사용법이나, 효율성 비교 같은 분야를 연구하신다면, 저 모두를 상세히 이해할 필요가 있다고 생각합니다. 질문자의 전공이 무엇인지 참 궁금합니다.
저도 한때 이 계통수 만드는 알고리즘에 재미들렸던 적이 있어서요.
그러나 계통도를 이용해 단순히 서열들 간의 상호 관계를 보기위해서는 UPGMA나 NJ 가 유용하다고 생각 됩니다. 이 경우는 가장 가설이나 가정이 적기 때문에, 서열이 가지는 변이성을 가장 확실하게 볼 수 있는 것 같습니다.
위의 세가지 방법중 종간의 진화적인 가설에 가장 적합한 트리를 얻고자 한다면, ML 트리가 좋겠죠. 예를 들어, 영장류 같은 경우 사람, 침팬지, 고릴라, 오랑우탄... 의 순으로 진화적인 가설이 존재 합니다. 이 경우 ML 트리를 그려보면 현재의 서열이 위의 가설을 지지하는지 아닌지를 검증할 수 있게 되겠죠.
MP 트리의 경우는 서열의 변화가 중요한 경우 입니다. Coding 영역을 비교할 경우, distance는 그다지 의미가 없습니다. 대신 DNA나 Protein의 변화 과정이 중요하겠죠 적용에 유의한지 아닌지가 중요하겠죠.물론 요즘은 Coding 영역을 비교할 때 트리를 잘 그리지 않습니다. 대신 synonymous non-sysnonymous 치환의 비율을 계산하여, selection의 정도를 관찰하는게 대세인듯 보입니다.
그러나 무엇보다도, 계통도를 그릴때 제일 중요한 것은 자신이 가장 잘 이해하고 있는 알고리즘을 사용한 트리를 만드는 것이라 할 수 있습니다.
위에 설명한 어떤 트리를 사용하더라도, 자신이 확실하게 결과를 그 트리의 원리에 맞게 설명 할 수 있다면 제일 좋은 것 같습니다.