한빛사 인터뷰
1. 논문관련 분야의 소개, 동향, 전망을 설명, 연구과정에서 생긴 에피소드
다양한 생물간의 진화적 관계(evolutionary relationships)를 밝혀내 계통도(phylogenetic tree)를 만드는 일은 진화 생물학 분야에서 가장 중요한 일중 하나입니다. 다양한 진화생물학의 가설을 뒷받침 하기 위해서는 보다 신뢰할 수 있는 계통도가 필요합니다. 또한 계통도의 신뢰도에 따라 comparative genomics 혹은 functional genomics 분야의 많은 가설을 뒷받침 할 수도 있습니다.
현대의 진화생물학에서는 DNA 혹은 단백질 서열을 이용해 계통 발생도를 작성하고 있으며, 최근 다양한 생물의 유전체 정보가 공개됨에 따라 여러 종의 모든 유전적 특징을 사용하여 종의 분화 과정을 추론하기 위한 계통유전체학(phylogenomics) 연구가 다양한 분류군에서 진행되고 있습니다. 계통유전체학은 다양한 생물의 유전체 사이에서 orthologous genes 들을 수백, 수천 개를 찾고, 이를 모두 사용해 분자계통도를 구성하고 종분화 과정을 추론 하는 연구 입니다. 최근 Next generation sequencing 방법론이 다양하게 발전하고 비용이 감소됨에 따라 다양한 생물들의 유전체 서열을 밝혀 낼 수 있었으나, 여전히 지놈 사이즈가 큰 진핵생물과 많은 분류군이 필요한 경우에는 genome assembly 와 annotation 을 고품질로 해내기에 시간과 비용이 많이 듭니다.
이러한 문제를 해결하기 위해 좀 더 비용이 적게 드는, RNA seqeuncing과 de novo transcriptome assemble를 통해 얻어내는 전사체(transcriptome) 서열 정보를 활용하여 계통도를 작성하는 계통전사체학(phylotranscriptomics)방법이 등장하게 되었습니다. 하지만 전사체는 발현하고 있는 유전자의 서열 정보만을 확인 할 수 있기 때문에 여러 문제점이 있을 수 있습니다. 모든 유전자는 항상 발현하고 있지 않으며, 조직 특이적으로 유전자가 발현하는 (tissue specific gene expression) 생물학적 현상은 모든 유전자가 코딩 되어있는 유전체의 정보를 전사체가 완전히 대변할 수 없음을 보여줍니다. 또한 de novo transcriptome assembly 과정에서 isoform을 구분하는 것이 어렵기 때문에 paralogous 유전자로 잘못 분류할 가능성이 있습니다.
이번 연구에서는 RNA sequencing 데이터만을 사용한 계통전사체 나무(phylotranscritpomic tree) 와 유전체 정보를 사용한 계통유전체 나무(phylogenomic tree) 의 계통도 형태 비교를 통해 계통전사체 연구 결과의 신뢰성을 확인하였습니다. 이를 위해 유전체 서열과 전사체 서열이 모두 공개되어 있는 포유류 22종과 식물 15종의 정보를 사용하여 각각 유전체 계통도와 전사체 계통도를 완성하였으며 계통도 사이의 형태 차이(topological distance)를 통해 두 결과를 비교 해 보았습니다.
다양한 조직의 전사체 정보를 섞어서 사용해 보기도 하고 orthologous 유전자 추론을 위한 여러가지 방법을 사용해 계통전사체 나무를 구성 해 본 결과, 다양한 조직의 데이터를 섞어서 사용하여도 결과에 큰 영향이 없지만 orthologous 유전자 추론 과정이 결과에 영향을 크게 미친다는 사실을 확인 할 수 있었습니다. 이 과정을 통해 기존의 전사체 데이터를 활용하여 작성한 계통도가 단일 유전자보다 많은 데이터를 활용하였기 때문에 신뢰성이 있을 것이라는 전제를 실질적인 비교를 통해 검증하고 확인 해 보았으며, 이론적인 추측에 그치지 않고 지놈 데이터의 부분적 서열 정보인 전사체 정보로 계통도를 작성하는데 있어서 주의해야 할 점들을 검증 해 볼 수 있었습니다.
이렇게 유전체 시퀀싱 비용에 비해 상대적으로 비용이 적게 드는 전사체 데이터를 통해서 분석한 계통전사체 나무의 신뢰성이 확인되었고 이를 많은 생물 종에서 적용할 수 있을 것으로 생각합니다.
이 프로젝트는 연구실에 학부연구원으로 참여하게 되면서부터 시작하게 되었는데, 계통수를 작성하는데 사용된 유전자의 숫자가 많다 보니 논문을 마무리하기까지 오랜 시간이 걸렸습니다. 연구를 진행해 나가며 컴퓨터를 통해 연구를 하기 위한 리눅스 서버 환경을 구축하고, 부전공으로 프로그래밍을 공부하면서 다양한 사이드 프로젝트에 참여 해 본 경험은 지금 연구를 진행하고 데이터를 관리하는데 있어서 많은 도움이 된 것 같습니다.
2. 연구를 진행했던 소속기관 또는 연구소에 대해 소개 부탁 드립니다.
저는 전남대학교 생명과학기술학부 박춘구 교수님의 시스템 생물학 연구실에 소속되어 있으며, 분자진화학, 전사체학, 비교유전체학 분야에서 생물 정보학 데이터를 활용한 다양한 연구 주제를 수행하고 있습니다. 저희 연구실은 생물학적 질문을 풀어나가기 위한 분자생물학 실험과 그에 따른 다양한 생물정보학 분석으로 해양 플랑크톤, 미세 조류, 해양 동물에 대해 연구하고 있으며 다양한 공동연구를 통해 마이크로바이옴, 단일 세포 시퀀싱 방법을 활용한 의학 분야의 연구도 수행하고 있습니다.
3. 연구활동 하시면서 평소 느끼신 점 또는 자부심, 보람
처음 이 연구를 위한 데이터를 정리하여 모으기 시작했을 때만 해도, 저는 서버에 리눅스를 설치하고 운영하며, 필요한 프로그램을 설치하여 데이터를 분석하거나 대량의 자료를 처리하는 방법을 전혀 몰랐습니다. 데이터를 모으는 과정에만 1년이 넘는 시간이 걸렸고, 여기서 orthologous 유전자를 찾고 정리하여 첫 계통수를 그리는데 까지 다시 1년의 시간이 걸렸습니다. 그 와중 새로운 모델과 분석 도구들이 등장하여 모든 과정을 새로운 방법으로 다시 진행하였으며, 오랜 시간의 리비전을 마치고 4년이 넘는 시간이 걸렸습니다. 그 시간 동안 깃허브와 블로그를 통해 많은 자료를 공유해 주시는 분들과 다양한 질문에 친절하게 답해 주시는 분들 덕분에 많은 것들을 배울 수 있었습니다.
또한 처음 시작한 연구이기에 데이터를 정리하여 결과를 만들어 내면 연구가 끝나는 것이라 생각하였지만, 논문이 완성되고 나서야 마무리 된다는 것을 배웠습니다. 교수님께서 항상 첫 논문을 써보고 나면 그 전과는 다른 세상이 보일 것이라고 말씀하셨는데, 여러 번의 리비전 과정을 지나고 난 지금, 지난 시간을 되돌아보면 좀 더 넓은 시야에서 논리적으로 설득하기 위한 흐름을 고민해 볼 수 있게 된 것 같습니다.
4. 이 분야로 진학하려는 후배들 또는 유학준비생들에게 도움이 되는 말씀을 해 주신다면?
저도 아직 부족하지만, 다른 분들의 조언 중, 논문을 아주 많이, 다양하게 읽으라는 말씀은 항상 정답인 것 같습니다. 공부에는 왕도가 없는 모양입니다.
5. 연구활동과 관련된 앞으로의 계획이 있으시다면?
저희 연구실에서 연구하고 있는 다른 생물종의 계통수를 작성하고 분류상 아직 이슈가 남은 몇가지 부분을 계통전사체 방법을 통해 해결하기 위한 연구를 여러 분류군에서 진행 하고 있습니다. 또한 장기적으로는 phylogenomics 분야의 데이터를 comparative genomics 혹은 functional genomics 등에 활용하여 유전서열의 변이에 따른 기능적 변화를 설명하기 위한 연구도 해보고 싶습니다.
또한 공동연구를 통해서 RNA-seq, Alternative splicing, single cell RNA-seq, 메타지놈 분석 등등을 통해 다양한 분야의 생물 정보학 데이터를 분석 해 볼 수 있었는데, 이러한 경험을 토대로 의료분야의 데이터를 통해 서열 변이에 의한 발현량 차이, DNA와 RNA, 그리고 histone protein에서 관찰되는 methylation 의 조절 사이에서 일어나는 상호작용의 매커니즘, 장내 미생물에 의한 면역 반응의 차이와 같은 종간 상호작용(inter-specific interaction)이 일어나는 원인과 차이점 등에 대한 연구에도 관심이 많습니다.
6. 다른 하시고 싶은 이야기들....
코로나 바이러스 확산을 막기 위해 의료 최전선에서 힘쓰시는 많은 의료진 분들과 의생명과학자 분들에게 감사드리며, 응급 상황에서도 빠르게 대처하여 조금 더 안전한 환경을 만들어 주시는 많은 분들께 감사드립니다. 논문이 잘 마무리되기까지 긴 시간 동안 함께 애쓰고 지치지 않고 앞으로 나아갈 수 있도록 지도해주신 제 지도교수님 박춘구 교수님께 감사드립니다. 그리고 많은 아이디어와 디스커션을 스스럼 없이 다방면에서 함께 고민해준 우리 실험실 멤버들에게도 감사를 전합니다.
관련 링크
연구자 ID
관련분야 연구자보기
소속기관 논문보기
관련분야 논문보기
해당논문 저자보기