1. 논문관련 분야의 소개, 동향, 전망을 설명, 연구과정에서 생긴 에피소드
30억개쌍의 염기서열변이 정보는 차세대염기서열분석(NGS, next-generation sequencing)으로 그 실용화가 가속화 되고 있고, 이와 결합된 유전체 빅데이터와 인공지능 기술의 발달은 암, 희귀질환 같은 질병의 개인 맞춤의학의 가능성을 보여주고 있습니다. 이를 위한 기초작업으로 개인의 염기서열변이를 정확하게 추출하는 기술은 정밀의료와 불가분한 관계입니다. 현재 많은 종류의 범용 염기서열변이정보 추출 (variant calling) 알고리즘이 존재하나, 각 방법마다 특정한 생물학적 모델(예, 암유발변이)과 통계학적 알고리즘을 사용하므로, 유전학적 연구가 비교적 미흡한 질병의 경우 (예, 치매 및 파킨슨병 같은 퇴행성 질환), 관련된 염기서열변이의 추출이 어려운 실정입니다.
본 연구는 기존의 알고리즘과는 다른 방식으로 체세포 염기서열변이를 찾아내는 에디스캔(ADIscan, Allelic Depth and Imbalance Scanning)을 개발하고자 진행되었습니다. 에디스캔은 다량의 축적된 염기서열 분석 결과를 기반으로 모델을 설정, 결과의 패턴을 비교하여 질병관련 모델이 확립되지 않은 체세포 염기서열변이를 찾아냅니다. 이 방법을 통해 기존의 염기서열변이 추출 알고리즘(GAKT, Genome Analysis Toolkit, 미국 브로드연구소)이 발견한 모든 (약 400만) 염기서열변이를 높은 정확도로 찾아 내었고, 약 70만개의 변이를 추가적으로 찾아 낼 수 있었습니다.
에디스캔의 정확도를 검증하기 위해 일란성 쌍생아들 사이의 염기서열을 비교하였습니다. 일란성쌍생아들의 경우 배아가 분리되기 직전까지는 유전자 염기서열이 동일합니다. 분리가 일어나기 직전, 유전자가 복제되는 동안 발생되는 변이들은 향후 두 사람의 체세포 염기서열의 차이로 나타나게 됩니다. 전통적으로 약 300개 정도 염기서열 차이가 있는 것으로 추측되고 있었는데, 2017년도에 차세대염기서열분석 결과 약 10개 미만일 것이라는 결과가 네이처(Nature)지에 발표되었습니다. 신테카바이오에서 개발한 애디스캔을 이용하여 분석 한 결과, 일란성 쌍생아 사이에 500개 정도 염기서열에 차이가 있는 것으로 나타났습니다. 이들 중 30여개를 실험적으로 검증하여 애디스캔을 이용한 분석 방법이 높은 신뢰도와 정확성을 가짐을 간접적으로 증명하였습니다. 국내특허로 등록되어 있는 애디스캔은 향후 인공지능 신경망모델과 연계하여 퇴행성 질병 (치매 및 파킨슨병)과 관련된 체세포 염기서열 변이를 찾는데 활용될 수 있습니다.
2. 연구를 진행했던 소속기관 또는 연구소에 대해 소개 부탁 드립니다.
저는 신테카바이오의 BI팀에 소속되어 정종선 박사님 지도하에 유전체 관련된 바이오 알고리즘의 연구개발을 진행하고 있습니다. 신테카바이오는 한국전자통신연구원 (ETRI) 연구소 기업으로, 유전체 빅데이터 플랫폼 (PMAP)과 인공지능 딥러닝 신약개발 플랫폼을 보유하고 있습니다. 이를 활용하여 질병의 정밀한 진단과 신약개발의 효율성 향상에 크게 기여하는 것을 목표로 하고 있습니다.
3. 연구활동 하시면서 평소 느끼신 점 또는 자부심, 보람
기초에서의 연구 결과가 실제 임상에 활용되기까지는 수많은 장벽을 넘어야 합니다. 연구활동을 하면서 개발한 알고리즘 또는 파이프라인을 실제 임상에 계시는 연구자 분들이 활용 하실 때 환자의 진단에 조금이나마 도움이 될 수 있다는 느낌을 받아 이 분야의 연구자로서 자부심을 가지게 되는 것 같습니다.
4. 이 분야로 진학하려는 후배들 또는 유학 준비생들에게 도움이 되는 말씀을 해 주신다면?
자신의 주 전공 외에 타 분야에 대한 열린 마음이 중요하다고 생각합니다. 특히, 융합학문인 Bioinformatics 의 연구자들은 바이오, 컴퓨터, 수학 등 다양한 백그라운드를 가지고 계시고, 그 관심분야도 매우 상이합니다. 타 분야에 대한 열린 마음으로 지속적으로 공부하고 경험하면 사고의 폭을 넓히고 성장하는데 큰 도움이 될 것이라고 생각됩니다.
5. 연구활동과 관련된 앞으로의 계획이 있으시다면?
유전체 상의 염기서열변이와 질병과의 상관관계에 대한 연구는 꾸준히 진행되어 왔고 많은 성공사례가 보고되었습니다. 그에 비해 환자에게 직접적으로 도움을 줄 수 있는 맞춤형 약물처방에 대한 연구는 상대적으로 미흡합니다. 저희 연구팀은 약 1,000개에 이르는 암세포주와 265개 약물에 대한 약 23만개의 약물 반응성 (drug response, IC50) 정보로부터 염기서열변이와 약물에 대한 상관관계를 연구 중이고, 이를 활용하여 각 환자의 변이특성에 따른 맞춤 약물 처방을 최종 목표로 하고 있습니다.
6. 다른 하시고 싶은 이야기들....
컴퓨터공학을 전공한 저에게는 생물학은 먼 나라 이야기였습니다. 이러한 저에게 Bioinformatics 의 재미를 알려주시고 항상 연구를 지지해주시는 정종선 박사님과, 본 연구를 이끌어주시고 연구자로서 성장하는데 많은 조언을 주신 조양래 박사님께 진심으로 감사 드립니다. 또한 항상 유용한 DB를 제공해 주시는 홍종희 팀장님, 그 외 본 연구 분석에 도움을 주신 분들 모두 감사합니다. 마지막으로 항상 저를 지지해주는 아내 현정과 딸 다혜 너무 사랑합니다.