1. 논문관련 분야의 소개, 동향, 전망을 설명, 연구과정에서 생긴 에피소드
유전체 진화 (genome evolution)와 환경에 대한 적응(fitness)과의 관계에 대해서 짧은 기간 동안의 배양에 의한 결과나 혹은 화석을 이용한 연구가 진행되었지만, 사실 장기간 동안의 실험과 관찰이 아니라면 이들의 관계를 밝혀내기가 쉽지 않습니다. 본 연구에서는 실험실에서 약 20년 동안 Escherichia coli B strain REL606을 대상으로 동일한 조건에서의 배양을 (minimal-glucose culture) 꾸준히 진행해오면서 나타난 유전체의 변이와 환경에의 적응과의 관계를 규명하였습니다.
2천, 5천, 1만, 1만5천, 2만, 4만세대의 genome을 Nimblegen의 comparative genome sequencing (CGS) 와 Solexa sequencer (Illumina Inc.)를 이용하여 서열을 모두 해독하고, 각 세대의 genome과 조상 균과의 차이를 확인하였을 때, 2천 세대에서부터 2만 세대까지 나타난 유전체 변이 수는 선형으로 증가하는 반면, 환경에 대한 적응도는 초반에 급격히 증가하다가 세대가 지날수록 완만한 곡선을 보여주었습니다. 이러한 두 곡선의 형태는 기존의 수학적 모델에 근거하여 유추할 수 있었던 패턴-두 곡선이 동일하게 증가를 하거나 혹은 반대로 두 곡선이 모두 비슷하게 감소하는 형태-에 일치하지 않았습니다. 그런데 저희가 관찰한 패턴은 random drift에 의해 우연적으로 일어났을 수도 있겠지만, 첫 번째, 2천~2만 세대까지 단지 non-synonymous mutation만이 확인 되었다는 점. 두 번째, 다른 population에서도 동일한 유전자에서 같은 변이가 발견 되었다는 점. 세 번째 이전 세대에서 나타난 변이가 이후에도 고정되어 나타났다는 점. 네 번째, 이러한 변이를 가진 유전자들이 환경 적응에 영향을 준다는 점을 실험으로 증명함으로써 우연히 일어난 것이 아님을 밝혔습니다. 그래서 결국 이러한 두 곡선의 관계는 조상 균과 진화한 균의 사이에서 clonal interference (무성생식을 하는 집단에서 적응에 더 유리한 변이를 가진 개체가 경쟁에서 살아남게 되는 것)에 의한 것으로 초기에는 환경에 대한 적응에 크게 기여하는 변이가 일어나는 반면, 그 이후에는 기여도가 낮은 변이가 일어났던 것이며 이들 변이의 총 수는 mutation rate에 의해 선형적으로 증가했을 것으로 유추할 수 있었습니다.
이후 26,500세대에서 초기의 변이가 시작되었을 것으로 예상하는 mutT의 mutation의 영향으로, 4만 세대에서는 변이 수가 급격히 증가하였습니다만 이 때의 변이들은 non-synonymous mutation과 함께 synonymous mutation도 함께 발견되었고, 그 수가 무작위적으로 예상된 수치보다 약간 높게 확인되었습니다만 유의 수준(P-value)에 근접하기 때문에, 4만 세대에서 확인된 변이의 대부분은 neutral한 변이일 것이지만 단지 일부의 변이가 환경의 적응에 기여할 것으로 예상해 볼 수 있었습니다.
이번 연구를 통해 제한된 조건의 환경에 대한 적응과 함께 나타나는 유전체의 진화의 형태를 살펴봄으로써 진화에 대한 원천적 지식뿐만 아니라, 산업적으로도 유용하게 응용될 것으로 기대하고 있습니다.
2. 연구를 진행했던 소속기관 또는 연구소에 대해 소개 부탁 드립니다.
제가 몸 담고 있는 연구실은 21C 미생물프론티어사업단의 지원과 함께 한국생명공학연구원 바이오화학/에너지연구센터에 소속되어 있는 곳으로 미생물의 게놈 서열을 해독하고, 이들의 분석 정보를 다른 연구자들에 제공하는 일을 담당하고 있습니다. 현재 저희 연구실에서는 Escherichia coli B strain REL606뿐만 아니라, 식물 근권 유용 미생물(Paenibacillus polymyxa), 토착 해양 미생물(Hahella chejuensis, Donghaeana dokdonensis), 김치유산균(Leuconostoc citreum), 인체 유용 미생물(Bifidobacterium animalis subsp. lactis AD011, Bifidobacterium bifidum BGN4)등의 genome을 저희 팀에서 염기서열의 해독과 함께 분석된 내용을 현재 저희 홈페이지인 Genome Encyclopedia Microbes (GEM) 에서 서비스하고 있습니다. 그리고, 병원성 유전자 데이터베이스(PAIDB), 미생물의 Esterase/Lipase 데이터베이스(MELDB), Isoflavonoid pathway의 정보(IPIS)등의 데이터베이스와 유틸리티를 함께 제공하여 다양한 분석에 도움을 드리고 있습니다.
홈페이지: Genome Encyclopedia Microbes (GEM,
http://www.gem.re.kr)
3. 연구활동 하시면서 평소 느끼신 점 또는 자부심, 보람
생명현상을 컴퓨터를 이용하여 예측 및 분석하는 생물정보학 분야에서 연구하고 있어서, 복잡하고 다양한 생명체의 생리현상을 수학과 전산학을 이용해여 컴퓨터가 이해할 수 있는 언어로 바꾸어야 하는 일이 고되고 힘들기도 하지만, 저희가 만든 프로그램이 다른 많은 과학자들의 연구에 보탬이 될 수 있다는 생각에 큰 자부심과 함께 보람을 느낍니다.
그리고, 주위에 각기 다른 분야, 시스템생물학, 분류학, 유전체학, 병리학에 능통하신 분들 이 제 주위에서 많은 도움을 주시고 계셔서 오히려 이런 팀 내에서 함께 연구할 수 있다는 것이 오히려 영광으로 생각하고 있습니다.
4. 이 분야로 진학하려는 후배들 또는 유학준비생들에게 도움이 되는 말씀을 해 주신다면?
다른 분야에 대해서 많은 훌륭하신 분들의 조언이 있었을 것이라 생각하기에 저는 생물정보학 분야에 진학하기를 망설이는 후배들에게 말씀을 드리고자 합니다.
생물 전반의 지식을 공부하고 연구하는 중에 전산학을 공부하는 것은 사실 쉽지가 않습니다. 시간이 허락하지 않을 뿐만 아니라, 주위의 도움이 없이 혼자서 공부하기가 독한 마음으로 임하지 않으면 안되기 때문입니다. 그래서인지 많은 분들이 전산학 기술에 대해서 필요성을 느끼지만 쉽게 다가가지 못하는 경우를 많이 봐왔습니다. 한편으로는 이해를 하지만 또 다른 한편으로는 안타까울 때도 많습니다. 반대로 전산학 기술이 있는 후배들의 경우 마찬가지로 쉽게 생물분야에 접근하지를 못하는데, 이들은 생물학과 전산학이 전혀 별개의 것으로 생각하기도 하고, 많이 어려워하기 때문입니다.
지극히 개인적인 생각이지만, 학문은 어떤 분야를 막론하고 다 어렵다고 생각합니다. 단지 자신이 보고, 듣고, 배운 학문이 익숙할 뿐, 그리고 익숙하지 못한 학문에의 접근이 조금은 두렵기 때문에 다가가질 못하는 것 같습니다. 시작이 반이라고 처음에는 누구나 새로운 지식을 습득하기가 힘들지만, 그 순간을 넘으신다면 분명 자기 자신에게나 자신의 팀에 분명 엄청난 도움을 줄 것을 확신합니다.
5. 연구활동과 관련된 앞으로의 계획이 있으시다면?
현재 하고 있는 일은 장내세균의 유전체 서열정보를 비교 분석하고 있으며, 차후에는 metagenome을 효과적으로 분석할 수 있는 알고리즘을 개발해 볼 생각입니다. Metagenome은 전산학의 입장에서 볼 때, 대용량 데이터의 집결체이며 이러한 데이터를 재원의 낭비가 없이 효과적으로 처리, 분석할 수 있는 알고리즘의 개발은 생물연구뿐만 아니라 전산학에서도 크게 기여를 할 것으로 기대합니다.
그리고 개인적으로 나이가 많은 편이 아니며, 아직 한 참을 달려야 할 길이 있기에 지금보다 더 나은 모습을 위해 더욱 많은 공부를 해야 할 것 같습니다. 가끔은 어릴 때 열심히 공부하지 못했던 것이 많이 후회가 됩니다 (시간을 되돌릴 수만 있다면…). 하지만 미래에도 똑 같은 생각을 하지 않도록 지금 열심히 달릴 것입니다.
6. 다른 하시고 싶은 이야기들....
이런 훌륭한 연구결과에 제가 참여했다는 자체만으로도 저는 운이 좋았다고 생각합니다. 특히 넓은 통찰력으로 한국-미국-프랑스 3개국간의 협력을 담당하시고 기획하신 저희 연구실의 책임연구원이신 김지현 박사님 (바이오화학/에너지연구센터 센터장), Escherichia coli B strain REL606의 조상균을 직접 염기서열을 분석하시고 이 후의 세대에 대한 변이의 확인을 도와주신 정해영 박사님, 그리고 solexa 염기서열기계로부터 얻어진 각 세대의 genome data를 밤이 늦도록 분석하신 윤성호 박사님(현재, Institute for Systems Biology, Seattle, WA, USA)의 도움이 없으셨다면, 제가 이렇게 한빛사 인터뷰를 쓸 수 없었을 지도 모릅니다. 또한 힘들었던 문제가 생겼을 때, 마치 자기 일처럼 도와주시는 송주연 박사님, 김병권 박사님, 김성근 선생님, 이충훈씨, 한상수씨, 권순경씨, 유기진씨, 한지희씨, 곽민정씨를 비롯한 많은 분들과, 생물정보학 및 전산학에 흥미를 잃지 않도록 지도와 함께 격려해주시는 저의 지도교수님이신 공은배 교수님(충남대학교 컴퓨터공학과)께 이 기회를 빌어 깊은 감사를 드립니다. 이번의 연구결과로 인해 좋은 결실을 맺게 되어 개인적으로도 기쁘게 생각하지만, 이 결과에 만족하기 보다는 좀 더 발전된 연구를 위해 더욱 더 열심히 하겠습니다. 마지막으로 이런 인터뷰 기회를 만들어주신 생물학연구센터(BRIC)에 감사를 드립니다.