1. 논문관련 분야의 소개, 동향, 전망을 설명, 연구과정에서 생긴 에피소드
본 연구는, 단순하게 보면 질환군과 비질환군의 genome을 비교하는 또 하나의 Genome-wide Association Study (GWAS)다. GWAS는 이미 10년도 넘게 지속되었고, 이미 많은 정보들이 쌓였기 때문에, 계속되는 성공에도 불구하고 현재는 단순히 GWAS 결과만으로는 좋은 연구가 되기 어렵다. 현재의 GWAS들은 어떤 방법으로 임팩트를 갖추게 되는지에 대해 먼저 소개하고, 분야의 동향 및 전망에 대해 개인적인 생각을 적어보고자 한다.
첫째, 사용한 데이터가 특이 해야한다. 원발(성) 경화성 담관염(primary sclerosing cholangitis, PSC)은 만명 중에 한 명 정도 걸리는 매우 희귀한 질병이기에 미국, 영국, 유럽 간의 공동연구가 아니었으면 본 연구는 불가능했을 것이다. 최소 몇 년 동안은 이와 비슷한 크기의 PSC 연구가 이뤄지지 못할 것이기에 사용한 데이터만 하더라도 큰 가치를 지녔다. 현재의 정량적 유전학 및 의학 연구는 점점 더 많은 과학자와 의사들 간의 공동연구를 통해서만 가능하다는 것을 보여준다.
둘째, 단순히 GWAS hit들을 보고하는 것을 넘어서서 생물학적/의학적 의미를 제시해야 한다. 대부분의 GWAS hit들의 경우 관련된 유전자를 찾기 어려운 경우가 많으며, mechanism 해석이 어렵고, 마땅한 제약 타겟을 제시하기는 더욱 어렵다. 본 연구의 경우에서는 여러 functional genomics (특히 transcriptome) 데이터를 함께 분석하여 UBASH3A 유전자의 alternative splicing에 의한 nonsense-mediated mRNA decay가 GWAS signal을 뒷받침 하고 있으며, 이것이 좋은 제약 타겟이 될 수 있다는 것을 제시하였다. 다양한 유전적 분석을 통해 제약 타겟을 제시하는 것은 기초연구에서 간단하게 치료로 응용될 수 있는 가능성을 가지고 있다. 유전학적 근거의 유무와 임상을 통과할 확률이 유의미한 상관관계를 보인다는 근래의 연구 결과들과, 12월에 제약업계의 강력한 로비로 미국에서 통과한 21st Century Cures Act가 대규모 유전학을 활용한 제약산업에 큰 활력을 불어넣을 것으로 예상된다.
셋째, 사용한 데이터가 가지고 있는 특별한 점에 집중해야 한다. PSC 환자 중 약 75%의 환자들은 염증창자병(inflammatory bowel disease, IBD)도 함께 앓고 있다. 본 연구에서는 이 특이한 관계를 유전적으로 얼마나 설명 가능한지를 분석하여, PSC와 함께 발병하는 IBD의 경우 일반적인 IBD와는 유전적으로 다른 architecture를 가지고 있다는 것을 보여줌으로써 PSC와 동반하는 IBD는 일반적인 IBD와는 별개의 질병으로 다루는 것이 옳다는 것을 제시하였다. 질병들 간의 유전적 상관관계 연구는 정신분열증, 조울증, 자폐증 등, 정신과질환들 간의 유전적 관계를 규명한 이후부터 큰 관심을 받기 시작하였는데, 우리는 이 연구방법을 PSC와 IBD의 매우 극단적인 관계에 집중하여 흥미로운 결론을 내릴 수 있었다.
현재 이 분야의 또다른 의제 중에 하나는, 과연 유럽 중심의 GWAS나 sequencing 연구를 통해 찾아낸 유전자의 영향이 다른 인종, 혹은 문화권 간에 얼마나 transferable 한가이다. 이는 그만큼 다양한 문화권의 genomics project에 많은 투자가 이루어지고 있다는 것이 반증한다. 분명히 차이가 있는 부분도 있고, 거의 똑같은 부분도 있다. 하지만, 유전자의 영향은 매우 복잡하게 환경과 얽혀 있기에 어느 부분에서 왜 차이가 나는지를 밝히는 것은 쉽지 않다. 대부분의 유전적 분석법은 환경이 동일하다는 전제하에 시작되는데, 이는 더이상 유효하지 않기 때문이다. 그렇기에 한국 등 동양에서도 많은 노력들이 진행되어 서방의 축적된 데이터들과 잘 어우러지면 좋은 연구결과들이 나올 것으로 기대된다.
또 다른 큰 흐름은 Electronic Medical Record (EMR)와, 유전정보를 포함한 다양한 실험결과를 연계한 대규모 cohort를 구성하여 다각적인 분석을 하는 것이다. 이미 UK Biobank를 바탕으로 수백 개의 논문들이 발표되었으며, Genomics England, Precision Medicine Initiative, Million Veterans Project 등 더욱 큰 cohort들이 구성되고 있다. 게다가 카타르, 싱가포르, 그리고 아프리카 등지에서도 큰 규모의 정부주도 연구들이 시작되었으며, 지난 주에 Science지에 발표된 Regeneron의 50K exome, 그리고 AstraZeneca의 2 Million Genomes Project 등이 발표되며 이제는 제약회사들도 관심을 갖고 있다는 것이 극명해졌다.
2. 연구를 진행했던 소속기관 또는 연구소에 대해 소개 부탁 드립니다.
Wellcome Trust Sanger Institute 는 단일 기관으로서는 Human Genome Project에 가장 큰 기여를 했고, 수 년간 high-throughput sequencing 센터로 중요한 기능을 해왔다. 근 10여년 동안은 오직 인간의 질병 연구에만 몰두해 왔으며 다양한 world index에서 매년 상위권을 차지해왔다. 본 연구소의 박사 학생은 University of Cambridge를 통해 박사 학위가 수여되는데, 학생 개인에게 직접 주어지는 펀딩과 교수님께 주어지는 연구비가 따로 존재하여 학생 신분으로 가질 수 있는 최대의 자율성을 보장해주는 시스템으로 운영되고 있다.
3. 연구활동 하시면서 평소 느끼신 점 또는 자부심, 보람
박사과정 동안 큰 컨소시움에서 main analyst를 맡아왔다. 약 2년간 텔레컨퍼런스를 통해 미국, 영국, 유럽의 연구진들 앞에 매주 경과보고를 했고, 수백명이 넘는 의사들을 통해 모아진 환자 샘플을 주도적으로 분석하며 큰 책임감과 자부심을 동시에 느낄 수 있었다. 또한, 박사과정 동안 다양한 방법으로 의사 및 환자들과 교류를 할 기회가 많았는데, 나의 연구가 궁극적으로 영향을 미치고자 하는 사람들과 대화하며 큰 보람을 느낄 수 있었다. 반면, 이를 통해 나의 현재 연구가 그들이 기대하는 것과 아직은 동떨어져 있다는 사실 또한 알게 되었다. 나의 연구가 실제 사용자들에게 미칠 영향을 과장하지 않으면서 어떻게 사용자의 피부에 와 닿을 수 있는지에 대해서 계속 고민해야 하는 것 같다.
4. 이 분야로 진학하려는 후배들 또는 유학준비생들에게 도움이 되는 말씀을 해 주신다면?
이제는 정확하게 sequencing/genotyping하는 것 보다는 데이터 분석을 통해 인간의 건강에 대해 유의미한 결론을 도출하는 것이 중요해졌다. 부정확도가 존재하는 데이터에서 유의미한 결론을 내기란 쉽지 않으므로 통계와 수학과 친해지는 것을 추천한다.
뿐만 아니라, 단순히 영어를 잘하는 것을 넘어서서 다양한 분야의 사람들과 대화할 수 있는 능력 또한 중요하다. 요즘의 연구 환경에서는 자신의 분야에서는 specialist가 되는 동시에 interdisciplinary함 또한 요구한다. 예를 들어, 나의 연구를 의사들에게 설명해야 할 때 비슷한 분야를 대하고 있지만 서로 완전히 다른 언어를 사용한다를 느낌을 받는 경우가 종종 있었다. 유전학 및 데이터 사이언스 분야의 연구자로서 의사들과의 상호 작용은 매우 중요하므로, 그들의 언어를 이해하고 대화 할 수 있을 때 그들의 믿음을 살 수 있고 더 재미있는 연구도 가능해진다.
또한 데이터 사이언스는 공급에 비해 수요가 큰 분야이므로 졸업 후 학계뿐 아니라 다양한 분야로 진출이 가능하다. 일례로, 구글이나 페이스북도 bioinformatics 분야 사람들을 뽑고 있고, 다양한 데이터 스타트업 및 금융권에 취직하는 친구들도 여럿 보았다. 나도 순수과학을 사랑하기는 하지만, 옵션은 많을 수록 좋다. 5년 후에는 판도가 어떻게 변해 있을지 모르겠지만, 현재는 이 분야만큼 추천하고 싶은 분야는 거의 없다.
5. 연구활동과 관련된 앞으로의 계획이 있으시다면?
현재는 학계를 잠시 떠나 산업 쪽에서 경험을 쌓고자 한다. 앞서 언급했듯이 정부 뿐만 아니라 회사들도 genomics 및 bioinformatics 연구에 큰 관심을 가지기 시작 했고 나는 이 틈에서 클라우드 컴퓨팅을 이용한 genomic analysis와 제약 타겟을 찾는 연구를 하고자 한다.
지금까지는 큰 클러스터 컴퓨터가 없으면 대규모 분석을 할 수가 없기에 대부분의 센터들은 개별적으로 클러스터를 구입하고 유지하는데 큰 돈을 들여왔다. 하지만 이런 형태의 데이터 관리는 더이상 scalable 하지 않다. 특히나 공동연구가 활발해지고, 데이터 공유가 보편화되고 있는 현재의 환경에서는 유전정보도 결국에는 클라우드로 이동할 것이라 생각한다. 그에 더하여, 앞에서 언급한 21st Century Cures Act에 의해 Precision Medicine, Cancer Moonshot 등 엄청난 양의 정부예산이 투입되고 FDA승인의 문턱도 낮춰지면서, 비록 올바른 방향인지 확실치 않지만, 제약업계 측면에서는 긍정적인 효과가 예상된다.
6. 다른 하시고 싶은 이야기들....
먼저, 이 연구가 가능하게 샘플 제공에 동의해주신 환자들께 감사 드린다. 이런 정보들이 근 시일 내에 직접적으로 환자들의 치료에 쓰이게 될 가능성 보다는, 해당 질환에 대한 지식을 조금씩 쌓게 되어 후대에 다른 누군가를 돕게 될 가능성이 높다. 많은 환자들이 직접적으로 자신의 치료에 쓰일 가능성이 적다는 것을 알고 있음에도 불구하고 서슴없이 자신의 샘플을 후대를 위해 제공한다는 사실에 매우 놀랐다. 이런 이타적인 환자들 덕분에 현재의 의료 연구가 가능하며 그들의 공헌을 더욱 강조할 필요가 있다고 생각한다.
그리고 나의 박사과정을 서포트 해준 재단들에게 감사드린다. 관정 이종환 교육재단과 Wellcome Trust의 기초과학을 위한 투자에 존경을 표한다. 그리고 과학자로의 꿈을 키울 수 있게 도와주신 한국의 강린우, 이상규, 그리고 이인석 교수님들께 감사의 말씀 전하고 싶다.