한빛사인터뷰
서울대학교
1. 논문관련 분야의 소개, 동향, 전망을 설명, 연구과정에서 생긴 에피소드
이번 연구는 인간 형질의 유전성과 환경성, 즉 ‘이 특성이 얼마나 유전되는가?’를 밝히는 고전적인 질문에서 출발합니다. 이 질문은 흔히 ‘heritability(유전력)’이라는 개념으로 정리되며, 유전학에서 가장 핵심적인 개념 중 하나입니다. 기존에는 일란성/이란성 쌍둥이를 비교하거나, 유전체 정보를 활용해 SNP 단위로 유전력을 추정하는 방식이 주로 사용돼 왔습니다.
하지만 이런 방법들은 각각 한계를 가지고 있습니다. 쌍둥이 연구는 표본 수가 적고, SNP 기반 분석은 유전체 데이터 수집 비용이 높으며, 특히 X 염색체나 가족 간 공유 환경처럼 구조적으로 복잡한 분산 요소들은 분석 대상에서 아예 제외되는 경우도 많았습니다. 저희가 개발한 BIGFAM은 바로 이러한 점들을 보완하고자 유전체 없이, 가계도 정보와 건강검진 같은 표현형 데이터만으로 유전 분산과 공유 환경 분산을 정밀하게 추정할 수 있도록 설계된 분석 모델입니다.
특히 BIGFAM은 기존 분석에서는 사실상 다뤄지지 않던 X 염색체의 유전력까지 유전형 데이터 없이 표현형 수준에서 안정적으로 추정할 수 있습니다. 실제로 저희는 이 모형을 통해 남성과 여성 간의 X 염색체 기여도 비율(DCR)이 생물학적으로 기대되는 값(약 2:1)을 잘 추정되는 것을 확인할 수 있었고, GREML이나 LDpred2 등 기존 유전체 기반 방법과 비교해도 상당히 높은 일치도를 보였습니다.
이를 통해, 본 연구는 향후 유전체 없이도 유전 연구가 가능하다는 새로운 가능성을 보여주었다 생각합니다. 특히 건강검진, 보험, 병원 기록처럼 일상적으로 수집되는 데이터에서도 의미 있는 유전 분석이 가능해졌다는 점에서, 정책이나 공중보건 연구 등 다양한 분야에 응용될 수 있을 것으로 기대하고 있습니다.
가장 기억에 남는 순간은 첫 번째 major revision을 받았을 때였습니다. 리뷰어들의 피드백이 단순한 수정 수준이 아니라, 기존 분석의 틀을 뿌리부터 다시 봐야 할 정도로 본질적인 내용이었기 때문에, 당시에는 솔직히 이 논문을 끝까지 가져갈 수 있을지 자신이 없었습니다. 제출 마감일이 다가오고 거의 포기 직전까지 갔던 순간, 우연히 한 가지 아이디어가 떠올랐습니다. 이를 검증하기 위해서 급하게 마감일을 연장했고, 아이디어를 새로 구현하면서 동시에 다른 코호트 데이터를 받아 검증을 진행했습니다. 결과적으로는 거의 1년에 가까운 시간을 들여 논문을 처음부터 다시 쓴 셈이지만, 그 덕분에 첫번째 revision을 받은 후 1년이 가장 기억에 남는 순간이라고 생각합니다.
2. 연구를 진행했던 소속기관 또는 연구소에 대해 소개 부탁드립니다.
저는 서울대학교 공과대학 바이오엔지니어링 소속으로, 의과대학 의과학과 소속 한범 교수님이 이끄시는 유전체 생물정보학 연구실(Genomics & Bioinformatics Lab)에서 석박사 통합과정을 진행하고 있습니다. 저희 연구실은 GWAS(전장유전체연관분석), 다양한 오믹스 데이터, 단일세포 전사체 분석 등 고차원 생명정보 데이터를 다루는 통계 기반 분석 방법 개발을 중심으로 연구하고 있습니다. 유전체 데이터뿐 아니라 건강검진, 병원 기록 등 다양한 비유전체 데이터와의 통합 분석도 활발히 이루어지고 있고, BIGFAM 연구도 그 연장선상에 있습니다.
연구실은 dry lab으로, 통계 모델링, 딥러닝, 바이오인포매틱스에 관심 있는 학생들이 다양한 프로젝트를 수행하고 있습니다. 교수님께서는 학생들과 함께 주제를 논의하고, 연구 기획과 분석 과정에 깊이 관여하시면서 늘 밀도 있게 지도해주십니다. 보다 자세한 연구 분야나 최근 프로젝트에 대해서는 연구실 홈페이지(https://hanlab.snu.ac.kr)에서 확인하실 수 있습니다.
3. 연구 활동 하시면서 평소 느끼신 점 또는 자부심, 보람
저는 무엇보다도, 연구를 통해 인간 형질의 다양성을 만들어내는 복합형질(complex traits)의 생물학적 메커니즘을 하나씩 밝혀가는 과정에서 큰 보람을 느낍니다. 키, 체중, 혈압처럼 단순해 보이는 형질도 사실은 수많은 유전적·환경적 요소가 얽혀 만들어지는 복잡한 결과물이기 때문에, 그 속에서 어떤 요인이 어떤 방식으로 작용하는지를 조금씩 파악해 나가는 과정이 저에게는 매우 흥미롭고 의미 있는 일입니다.
물론 연구라는 게 언제나 순조롭지만은 않습니다. 수개월 동안 붙잡고 있던 모델이 전혀 작동하지 않거나, 데이터에서 아무런 신호를 찾지 못할 때도 많습니다. 그래서 오랜 시간 고민하며 설계한 분석이 실제로 돌아가고, 복잡하게 얽혀 있던 형질의 기저 구조가 하나씩 드러날 때 느끼는 성취감은 다른 어떤 일보다도 크다고 느낍니다.
이번 연구에서도, 처음에는 가족 간 표현형 정보만 가지고 유전 분산과 환경 분산을 분리한다는 게 가능할까 반신반의했지만, 가설을 검증해 나가는 과정에서 실제로 안정적인 분산 구조가 나타났고, 기존의 유전체 기반 방법들과도 높은 일치도를 보였을 때 굉장히 깊은 만족감을 느꼈습니다. 단순히 모델을 만든다는 차원을 넘어서, 복합형질을 이해하는 새로운 도구를 하나 더 보탰다는 생각이 들어 지금도 큰 동기를 받고 있습니다.
4. 이 분야로 진학하려는 후배들 또는 유학준비생들에게 도움이 되는 말씀을 해 주신다면?
Bioinformatics 분야에 있는 수많은 주제들이 생물학적 뿐만 아니라 통계적 원리가 얽혀있습니다. 그래서 진학을 고민하는 후배들에게 가장 먼저 하고 싶은 말은, ‘기초가 중요하다’는 것입니다. 통계학, 생물학, 계산과학 중 어떤 쪽을 주로 하든, 서로의 언어를 어느 정도 이해할 수 있어야 복합적인 문제에 접근할 수 있습니다. 당장은 조금 느릴 수 있지만, 기초에 투자한 시간은 결국 연구실에서의 속도를 결정짓는 것 같습니다.
5. 연구 활동과 관련된 앞으로의 계획이 있으시다면?
앞으로는 복합형질(complex traits)의 생물학적 메커니즘을 더 깊이 이해하기 위한 다양한 분산 성분 분석(variance component analysis) 방법론 개발에 집중할 계획입니다. 이번 BIGFAM 연구에서는 표현형 기반으로 유전성과 환경성, 그리고 X 염색체 분산까지 분리해내는 가능성을 확인했는데, 이를 출발점 삼아 이후에는 더 정교한 분산 구조를 다룰 수 있는 다변량 모형(multivariate model)으로 확장하거나, 형질 간 유전적/환경적 **공분산 구조(covariance structure)**를 함께 추정할 수 있는 모델을 통해, 개별 형질을 넘어서 복합질환의 시스템적 메커니즘에 접근할 수 있을 것으로 기대하고 있습니다.
6. 다른 하시고 싶은 이야기들.....
이번 연구는 저에게 단순한 논문 작성이 아니라, 하나의 연구를 처음부터 끝까지 완성해 가며 정말 많은 것을 배울 수 있었던 소중한 시간이었습니다. 분석 방법을 고민하고, 데이터를 설계하고, 결과를 해석해 나가는 과정 하나하나가 연구자로서의 시야를 넓혀주었고, 특히 혼자서 해결할 수 없는 문제 앞에서 오래 생각하고 돌아보는 연습을 많이 할 수 있었습니다.
그리고 그 모든 과정에서 가장 감사드리고 싶은 분은 한범 교수님입니다. 교수님께서는 진심 어린 조언뿐 아니라, 어떻게 보면 이 논문의 가장 첫 번째 리뷰어로서 본질적인 코멘트를 아끼지 않으셨고, 그 덕분에 매 단계에서 논문이 한층 더 깊어질 수 있었습니다. 단순히 논문을 고치는 것을 넘어, 연구를 대하는 태도, 질문을 정제하는 방식, 연구자로서의 방향성에 대해 정말 많은 것을 배울 수 있었고, 그 점이 제게는 가장 큰 자산으로 남아 있습니다.
또한 연구실에서 함께 연구 이야기를 나누고, 때로는 고민을 공유해주었던 동료들 덕분에 이 과정이 훨씬 덜 외롭고, 더 즐거운 시간이 될 수 있었습니다. 서로의 시선을 나누고, 관점을 교차하며 얻게 된 아이디어와 위로가 큰 힘이 되었고, 그 점에 대해서도 진심으로 감사드립니다.
앞으로도 이 경험을 바탕으로, 복합형질의 생물학적 메커니즘에 대한 질문을 계속 품고 탐색해나가며, 더 나은 연구자가 되어가고 싶습니다.
등록일 2025.07.07