한빛사 인터뷰
1. 논문관련 분야의 소개, 동향, 전망을 설명, 연구과정에서 생긴 에피소드
Single-cell RNA sequencing (scRNA-seq)은 단일 세포 수준에서 유전자 발현 프로파일을 측정하는 기술입니다. 이 기술은 단일 세포의 다양성 및 유전자 발현의 특정 패턴을 분석하는 데 유용합니다. scRNA-seq 데이터를 분석하기 위해서는 첫 번째 단계로 해당 세포들이 어떤 종류의 세포인지 판별을 해야합니다. 마커 유전자 기반 세포유형 판별의 일반적인 방법은 클러스터링을 수행한 후 이미 잘 알려진 마커를 기반으로 특정 클러스터에 세포유형을 할당하는 방법입니다. 이 방법을 적용하여 T cell, Myeloid cell, Epithelial cell 과 같은 세포의 주요 유형들은 (Major-type) 쉽게 식별될 수 있습니다. 하지만, Tregs, Th1, 2, 9, 17 및 22와 같은 하위 집합 분류시 해당 세포들은 일반적인 마커를 공유하기 때문에, 몇 가지 마커에만 의존해서 쉽게 식별하기는 어렵습니다. 예를 들어 SELL(CD62L)은 단핵구, naive CD4 T 및 Tregs의 공통 마커입니다. HiCAT은 면역세포를 비롯한 다양한 세포 유형들을 Major-type, Minor-type, Subset으로 나누는 3 단계 분류 체계를 사용합니다. 차원 축소 기법을 이용하여 Major-type들을 우선적으로 식별한 후 Major-type 내에서 Minor-type과 Subset을 나누어 각 하위 유형을 분류하는 방법을 사용합니다. HiCAT은 marker counting, gene set analysis scoring, Gaussian mixture model-based correction, rejecting unclear cells, kNN-based correction 등을 사용하여 보다 정확한 세포의 하위 유형을 식별합니다.
2. 연구를 진행했던 소속기관 또는 연구소에 대해 소개 부탁드립니다.
저는 단국대학교 기계학습및생명정보 연구실에서 윤석현 교수님의 지도하에 연구를 수행했습니다. 기계학습및생명정보 연구실은 다양한 바이오 데이터 (DNA-seq., Bulk RNA-seq., scRNA-seq., Microbiome등)를 분석할 수 있는 역량과 Tool 개발을 할 수 있는 역량을 보유한 연구실이며, 특히 인공지능에 강점이 있는 연구실입니다. 기계학습및생명정보 연구실에서 연구를 수행하면서, 암 환자의 아형 분류, 약물의 반응성 예측 등 국내 메이저 대학병원들 및 연구소들과 협업하여 연구를 수행할 수 있었습니다. 연구실 구성원들은 생물 또는 공학을 전공한 학생들이며 각자의 장점을 활용하여 “바이오와 인공지능 융합”이라는 방향으로 지도교수님과 함께 연구를 수행하고 있습니다.
3. 연구 활동 하시면서 평소 느끼신 점 또는 자부심, 보람
지금까지의 전통적인 과학적 발견의 패러다임은 관찰(1), 가설(2), 검증(3)이라는 단계들을 순차적으로 이용합니다. 즉, 특정 유전자가 어떤 질환에 어떻게 작용을 하는지 알아내기 위해서는 ‘A 유전자가 B라는 질병에 C라는 작용을 한다’와 같은 가설을 먼저 세우고 생물학적인 실험과 검증을 하는 것이 일반적인 방법입니다. 하지만, 방대한 양의 유전체 정보들을 사람이 모든 실험을 하면서 가설을 세우는 것은 합리적인 방법이 아니며, 굉장히 많은 시간과 비용을 소모하게 됩니다. 인공지능을 이용하면 모형이 몇 가지 의미 있는 가설을 사람에게 제공할 수 있습니다. 무수히 많은 유전체 정보와 특정 약물에 대한 반응 결과를 이용하면 ‘A 유전자가 B 약물 반응을 예측하기 위한 중요한 유전자다.’와 같은 결과를 얻을 수 있으며, 변수의 중요도를 기준으로 특정 약물과 작용할 수 있는 유전자 후보군들을 만들 수 있습니다. 이처럼 바이오 도메인에서 특정 Task를 해결하기 위한 인공지능 기술을 적용할 때 많은 보람을 느낍니다.
4. 이 분야로 진학하려는 후배들 또는 유학준비생들에게 도움이 되는 말씀을 해 주신다면?
최근 암 및 다양한 질환에 대한 연구들은 다중오믹스 데이터를 기반으로 인공지능 기술을 융합하여 연구가 진행되고 있으며, 기계학습및생명정보 연구실도 이러한 트렌드를 따라가고 있습니다. 제가 연구를 하면서 중요하다고 느낀 3가지 역량은 생물학적인 지식, 인공지능 알고리즘, 프로그래밍 역량입니다. 하지만 이 3가지 역량을 한 사람이 모두 보유하기는 어렵습니다. 저도 공학을 베이스로 했기 때문에 생물학적인 지식이 많이 부족했고, 생물을 전공하고 있는 학부생에게 기본적인 질문을 많이 한 것이 기억납니다. 기계학습및생명정보 연구실에는 생물을 전공한 연구자, 공학을 전공한 연구자들이 있으며, 서로 협력을 통해 본인들이 부족한 부분을 보완하여 연구 능력을 향상시켜 나가고 있습니다. 따라서 특정 역량이 조금 부족하더라도 책임감을 갖고 꾸준히 협력한다면, 좋은 결과를 얻을 수 있다고 생각합니다.
5. 연구 활동과 관련된 앞으로의 계획이 있으시다면?
바이오와 인공지능을 융합한 서비스를 제공하는 회사를 운영할 계획입니다. 기존 의료 현장의 문제점에 대한 더 나은 솔루션을 만들어 보고 싶고, “연구를 위한 연구”가 아닌 “실증 및 사업화”로 이끌어 가고 싶습니다.
6. 다른 하시고 싶은 이야기들.....
열정적으로 지도해주시는 윤석현 교수님, 그리고 연구실 후배들에게 감사의 말씀을 드리고 싶습니다. 특히, 회사를 그만두고 박사과정을 시작하겠다고 할 때 응원해준 가족들에게 감사의 말을 전합니다.
#Machine Learning
#scRNA-seq
#Cell-type annotation tool
관련 링크
연구자 키워드
관련분야 연구자보기
소속기관 논문보기
관련분야 논문보기
해당논문 저자보기