한빛사 인터뷰
1. 논문관련 분야의 소개, 동향, 전망을 설명, 연구과정에서 생긴 에피소드
유전체 DNA는 각 개체가 가진 고유 정보일 뿐만 아니라 생명체의 모든 형질과 진화의 기원을 담고 있는 유전자원입니다. 각 종을 대표하는 참조유전체(Reference genome)는 한 생명체의 DNA 염기서열을 잘게 잘라 해독하고 조립하여 만들어집니다. 이렇게 완성된 참조유전체는 다른 종과의 차이를 규명하는 비교유전체 분석이나 해당 종의 다양한 조직이나 발달과정 등에서 차이를 규명하는 전사체, 후성유전체 등 다양한 차원의 후속 연구를 수행하는 데 기반자료로 활용됩니다.
참조유전체 구축에서 오류는 치명적인 생물학적/유전학적 해석오류로 이어지기 때문에 정확도와 해상도 높은 참조유전체 구축은 매우 중요합니다. 따라서 유전체 해독 및 조립 기술은 오류를 최소화하고 유전체 특성을 그대로 반영해내는 방향으로 계속해서 발전 중입니다.
저는 올해 초, 유전체 분야에서 가장 큰 학회인 Plant and Animal Genomes 30에 참석했는데 제가 박사 과정을 시작할 시점에는 존재하지 않았던 많은 새로운 분석 방법을 접했습니다. 그 중에서도 이제 세계적으로 통용되기 시작한 척추동물 유전체 프로젝트(Vertebrate Genomes Project, VGP)의 파이프라인 (그림 1)으로서 전무한 정확도와 연결성을 가진 고품질 참조유전체를 구축하는 방법을 목격했습니다.
그림 1. VGP genome assembly pipeline 2.0
Delphine Lariviere, Alex Ostrovsky, Cristobal Gallardo, Anna Syme, Linelle Abueg, Brandon Pickett, Giulio Formenti, Marcella Sozzoni, Anton Nekrutenko, VGP assembly pipeline (Galaxy Training Materials). https://training.galaxyproject.org/training-material/topics/assembly/tutorials/vgp_genome_assembly/tutorial.html Online; accessed Thu Dec 14 2023
Hiltemann, Saskia, Rasche, Helena et al., 2023 Galaxy Training: A Powerful Framework for Teaching! PLOS Computational Biology 10.1371/journal.pcbi.1010752
Batut et al., 2018 Community-Driven Data Analysis Training for Biology Cell Systems 10.1016/j.cels.2018.05.012
이번 연구에서 VGP와 협업을 통해 태평양 서식 참고등어의 참조유전체를 세계 최초로 구축했습니다 (그림 2, 3, 4). 고등어 중 가장 대표적이며 경제적으로도 생태계적으로도 한국에 중요한 종이지만 개체수 급감으로 유전자원이 위협받고 있었기 때문입니다. 또한 참조유전체 구축 각 단계에서 완성도를 평가하는 품질관리 체계도 도입해 모든 단계를 꼼꼼히 검증했습니다.
그림 2. 본 연구 파이프라인
Lee, Y.H., Abueg, L., Kim, JK. et al. Chromosome-level genome assembly of chub mackerel (Scomber japonicus) from the Indo-Pacific Ocean. Sci Data 10, 880 (2023). https://doi.org/10.1038/s41597-023-02782-z
그림 3. 참고등어의 신체적 형태와 서식지(●) 및 수집 위치(★)
Lee, Y.H., Abueg, L., Kim, JK. et al. Chromosome-level genome assembly of chub mackerel (Scomber japonicus) from the Indo-Pacific Ocean. Sci Data 10, 880 (2023). https://doi.org/10.1038/s41597-023-02782-z
그림 4. 완성된 고등어 유전체의 특징 (반복서열, 텔로미어 서열, Gap, GC비율, 메틸화상태(과메틸화, 중메틸화, 저메틸화), CpG 섬, 유전자, 트랜스포존 인자)
Lee, Y.H., Abueg, L., Kim, JK. et al. Chromosome-level genome assembly of chub mackerel (Scomber japonicus) from the Indo-Pacific Ocean. Sci Data 10, 880 (2023). https://doi.org/10.1038/s41597-023-02782-z
이번에 구축된 참조유전체는 염색체 단위의 3차원적 구조적 특징을 반영하는 높은 품질의 서열 정보와 3만여 개의 유전자를 포함하고 있습니다. 또, 유전체상의 DNA 메틸화 (Methylation) 여부를 데이터의 형광신호에서 머신러닝 기법으로 바로 읽어내는 새로운 방법으로 유전체 전장에 걸쳐 해독했습니다. 기존에는 메틸체 (Methylome)를 얻기 위해서는 NGS 데이터 생산과 별개로 주로 아황산처리 (Bisulfite treatment) 등의 실험실 작업을 해야 했지만, 본 연구에서는 PacBio HiFi 서열 데이터 상에서 형광신호의 길이와 간격을 분석하여 DNA서열 중 하나인 시스테인이 메틸화 (Methylation)되었을 확률을 계산했습니다.
이렇게 완성된 메틸체를 사용해 고등어의 여러 유전자에 새겨진 후성유전학적 각인을 읽어볼 수 있었는데, 특히 오메가-3 체내생성에 관여하는 Fads2 유전자의 발현량에 영향을 줄 수 있는 열린 염색질 접근성 (Open chromatin accessibility)을 가진 것을 확인했습니다.
2. 연구를 진행했던 소속기관 또는 연구소에 대해 소개 부탁드립니다.
저는 서울대학교 농생명공학부 김희발 교수님의 ‘생물정보 및 집단유전학’ 연구실(Laboratory of Bioinformatics and Population Genetics, BIOPOP)(http://biopop.snu.ac.kr)에서 박사과정을 수학 중입니다 (사진 1).
사진 1. 바이오팝 연구실 홈페이지(http://biopop.snu.ac.kr/gallery/)
저희 연구실은 다양한 수준의 집단 (분류군, 종, 품종, 환자, 병원체 등)이 가지는 고유한 형질이나 표현형이 달라지는 원인을 밝히기 위해서 유전체를 포함하는 다중체학적 (multi-omics) 특성을 탐구하고 있습니다. 유전체 구축, 가계도 구축, 전사체 비교, 연관분석, 분자 구조 등 다양한 접근 방법을 적용하여 연구를 수행하고 있습니다.
저희 연구실은 국내에서 유일한 척추동물 유전체 프로젝트 (Vertebrate Genomes Project, VGP) 콘소시움의 일원입니다. VGP는 2017년, 미국 록펠러대학의 Erich D. Jarvis 교수님의 주도하에 생물 자원의 보존과 복원을 목적으로 지구상에 현존하는 7만여 종의 모든 척추동물의 참조유전체를 고품질로 구축하는 것을 목표로 시작된 국제 협업 연구입니다.
세계적인 프로젝트에 참여하며 많은 것을 배우고 있으며, 이것을 개인 연구에도 적용하고 다른 공동 연구로도 확장할 수 있어 항상 감사하고 있습니다.
3. 연구 활동 하시면서 평소 느끼신 점 또는 자부심, 보람
생물정보 연구는 생물다양성을 지속 가능하게 증진시키기 위한 모든 작업의 기반이 됩니다. 그런데, 참조유전체는 대표적인 디지털 서열 정보(Digital sequence information, DSI)로써 나고야의정서에서 논의된 ‘국가 소유의 유전자원’에 포함되어야 하는지가 세계적으로 매우 심도 깊게 논의되고 있습니다. 크게 두 가지 대립되는 의견이 있는데, 유전체 서열 정보를 모두에게 공유되어 원활한 국제 협업을 촉진해 생물다양성을 높이는 데 기여해야 한다는 의견과 각 생물을 보유하고 있는 국가에 소유권을 귀속시키고 경제적 이익을 보장해야 한다는 의견이 대립되고 있습니다.
저 역시도 이번 연구를 통해 유전체 서열정보의 공유에 대한 문제를 인식하게 되었고, 정보 공유를 통한 연구 활성화를 통해 인류 차원에서 더 큰 이익들이 창출되었으면 하는 개인적 바램을 가지게 되었습니다.
DSI에 대한 유전자원 규정은 앞으로 논의되어야 할 부분이 많지만 이번 연구를 통해 향후 참고등어 유전 서열 주권 확보에 기여할 수 있다는 점, 국제 협업의 힘과 현장에서 제기되는 문제들을 체감해 볼 수 있었던 점, 개체수 급감을 겪고 있는 종인 고등어를 보전하는 데에 기여할 수 있었던 점에서 큰 보람을 느꼈습니다.
4. 이 분야로 진학하려는 후배들 또는 유학준비생들에게 도움이 되는 말씀을 해 주신다면?
생물정보학은 지금 이 순간에도 바뀌고 성장하고 있는 분야이기 때문에 준비하는 데에 부담을 가지기보단 끊임없이 배우려는 마음으로 도전한다면 즐겁게 연구하실 수 있을 거라고 믿고 추천합니다.
5. 연구 활동과 관련된 앞으로의 계획이 있으시다면?
이번 연구로 보여준 가장 차별화된 방법이 메틸체 구축이라고 생각하는데 비슷한 방법으로 여러 계통의 종들의 메틸체를 비교분석하는 연구를 해보고 싶습니다. 이를 위해 아직 부족한 생물학적 지식과 프로그래밍 능력을 쌓고 싶습니다.
6. 다른 하시고 싶은 이야기들.....
이번 연구를 가능하게 만들어 주신 많은 분들께 감사 인사를 전하고 싶습니다. 가장 먼저 부족함이 많은 저를 이끌어 주시는 서울대학교 김희발 교수님께 감사드립니다. BIOPOP 연구실 동료들, 록펠러 대학의 이철 선배님, Erich Jarvis 교수님, 그리고 VGL 연구팀, 참고등어 표본을 제공해주신 세보수산, 부경대학교 해양어류자원기탁등록보존기관의 김진구 교수님, 국립수산과학원의 남보혜 박사님과 노은수 박사님, 해양수산부 포스트 게놈 프로젝트 연구단을 이끌어 주신 생명공학연구소 김혜란 단장님께 감사드립니다. 또한, 연구가 원활히 진행될 수 있도록 지원해주신 해양수산과학기술진흥원 (KIMST)과 한국연구재단에 감사드립니다.
#Bioinformatics
# Reference genome
# Vertebrate Genomes Project
관련 링크
연구자 키워드
관련분야 연구자보기
소속기관 논문보기
관련분야 논문보기