국내외 바이오 관련 동향 뉴스를 신속하게 제공합니다.
뉴스 의학약학
암세포 분석 정확도를 높이는 유전자 검사법 개발
Bio통신원(과학기술정보통신부)
김상우 교수(연세대학교 의과대학) 연구팀이 환자의 암세포 시료를 분석할 때 외부요인을 줄여 분석의 정확도를 높이는 방법을 개발했다고 과학기술정보통신부는 밝혔다.
환자의 치료과정에서 유전자검사나 약물반응검사 등을 위해 종양조직을 여러 차례 분석하는 일이 불가피하다.
때문에 한 번 채취한 종양세포를 자연적으로 보존하고 충분히 증식시켜 여러 검사의 시료로 쓸 수 있도록 하는 환자유래모델(PDMS, patient-derived models)이 활용된다.
다만, 종양세포를 주로 생쥐(mouse)의 체내에서 증식시키거나, 생쥐의 세포와 함께 배양하기 때문에 쥐의 세포가 함께 분석되어 자칫 잘못된 결과가 나올 수 있다는 문제점이 있다.
이러한 가능성에 대해 꾸준히 제기되었지만 발생빈도나 예방방법에 대해서는 알려진 바 없다.
연구진은 환자유래모델에서 있을 수 있는 돌연변이 분석 오류를 찾아내고, 나아가 미연에 오류를 방지하는 방법을 개발하였다.
우선, 쥐와 사람에게서 나타나는 모든 유전자 서열 차이를 찾고 이를 ‘하마’(HAMA, human-genome aligned mouse allele)라고 명명하였다.
분석과정에서 이러한 ‘하마’가 나타난다면 질병 관련 유전 변이로 오인할 수 있는데, 생쥐의 유전체 정보로 인한 오류가능성을 한 번 더 확인하도록 안전장치를 제안한 것이다.
특히, 잘 알려진 암 관련 돌연변이 데이터베이스의 정보 중 생쥐를 이용한 실험모델에서 비롯된 경우 유독 ‘하마’의 관찰빈도가 높게 나타난 것도 확인하였다.
나아가 연구진은 유전체 검사 데이터를 통해 나오는 ‘하마’의 비율을 토대로 환자유래모델에 섞여 있는 쥐 세포의 비율까지 계산할 수 있는 방법을 제시하였다.
또한 150가지가 넘는 가상의 오염 데이터를 기반으로 비교 분석을 수행하여 최적의 오염 배제 방법을 밝혀내었다.
실제 이를 토대로 최적 유전자분석법을 적용한 결과 기존 분석 대비 정확성을 약 58% 가량 높일 수 있었다는 설명이다.
김상우 교수는 “본 연구는 체외에서 보존, 증식된 환자 암세포 시료(Specimen)의 유전체 분석과정에서 발생할 수 있는 오류를 바로잡아 향후 더욱 정확한 정보에 기초하여 환자를 치료할 수 있는 실마리가 될 것”이라고 밝혔다.
과학기술정보통신부 개인기초연구(중견연구) 사업의 지원으로 수행된 이번 연구의 성과는 유전체학 분야 국제학술지 ‘지놈 바이올로지(Genome Biology)’에 11월 11일 자로 게재되었다.
< 논문명, 저자정보 >
논문명
Impact of mouse contamination in genomic profiling of patient-derived models and best practice for robust analysis
주저자
김상우 교수(교신저자/연세대학교 의과대학 의생명시스템정보학교실)
조세영 박사과정 (제1저자/연세대학교 의과대학 의생명시스템정보학교실)
김은영 박사과정 (제1저자/연세대학교 의과대학 의생명시스템정보학교실)
< 연구의 주요내용 >
1. 연구의 필요성
○ 환자의 종양을 연구하려면 충분한 양의 종양 세포가 필요하지만, 검체로 취득할 수 있는 암세포의 양은 한정적이다. 따라서 PDX나 organoid와 같은 환자유래모델 (patient-derived model)을 제작하여, 암세포를 실험실 수준에서 증식시켜 분석에 활용하는 실험 방법이 널리 쓰이고 있다.
○ 하지만 이렇게 제작된 환자유래모델은 살아있는 쥐의 몸속에서, 혹은 쥐에서 추출한 가상 세포질에서 배양된 인간의 종양 세포이기 때문에, 필연적으로 약 10%, 극단적인 상황에서는 70%까지 쥐의 정상 세포가 함께 자랄 수밖에 없다는 사실이 밝혀졌다.
○ 따라서 환자유래모델에서 환자 특이적인 유전변이를 분석하고자 한다면, 쥐의 정상 세포에서 유래한 변이가 분석에 미치는 영향을 파악하고, 이를 구별하고 제거할 수 있는 분석법의 표준이 필요한 상황이다.
2. 연구내용
○ 먼저 쥐의 정상 세포가 인간 유전 변이 분석에 미치는 영향을 분석하기 위하여, 세 가지 계통의 정상 실험 쥐 5마리에게서 얻은 간 조직의 유전자 서열을 읽어 들이고, 인간 유전체 분석법을 적용하여 보았다. 그 결과 인간 유전체의 49%에 달하는 영역에 쥐의 유전자 서열 조각들이 성공적으로 정렬됨을 확인하였고, 그중에는 409개의 암 관련 유전자도 포함되어 있어, 인간 암 연구에 혼란을 초래하고 있었다.
○ 다음으로 쥐의 유전체가 인간 유전체 분석에 포함되었을 때 유전 변이로 검출되는 120만 개의 모든 서열을 찾아내었고 이를 하마 (HAMA, human-genome aligned mouse allele) 라고 명명하였다. 공신력 있는 암 관련 체성 유전 변이 데이터베이스인 COSMIC (Catalogue Of Somatic Mutations in Cancer)에 등록된 유전 변이를 변이의 발견 출처별로 분류하여 살펴보았더니, 쥐를 이용한 실험모델을 출처로 하는 분류에서 유독 하마의 관찰 빈도가 높다는 사실도 확인하였다.
○ 이 연구에서 생산한 쥐의 유전체 서열 데이터를 인간 유전체 서열 데이터와 다양한 비율로 혼합한 뒤 모든 하마 위치의 변이 서열 발생빈도를 계산하여, 미지의 시료에 포함된 쥐 유전체의 오염도를 예측할 수 있는 공식을 도출하였다.
○ 가장 효과적인 쥐 유전체 제거 방법을 제시하기 위하여 현재까지 개발되고 알려진 인간과 쥐의 유전체를 분리하는 프로그램과 방법들의 성능을 비교 분석하였고, 분석 목적별로 가장 높은 성능을 가진 프로그램을 제시하였다.
○ 하지만 이와 같은 프로그램을 통해 쥐의 유전 서열을 분리/제거하는 과정을 거치더라도 쥐 유전체에서 유래한 유전 변이가 여전히 소량 검출 됨을 확인 하였고, 이때 연구팀이 밝혀낸 하마 리스트와 일치하는 유전 변이를 추가로 제거하여야만 정확도 향상을 이루어 낼 수 있다는 사실도 확인하였다.
○ 위의 연구 결과를 토대로 환자유래모델에서 검출되는 쥐 유전 서열들을 제거하기 위한 최적 분석법을 제시하였고, 최적 분석법 미적용 결과 대비 최대 58%의 정확도 향상을 확인하였다.
3. 연구성과/기대효과
○ 연구팀은 이 연구를 통해, 1) 환자유래모델을 이용한 인간 암 연구에서 쥐의 유전자가 혼동을 초래할 수 있는 점들을 밝혀내었고, 2) 미지의 시료에 포함된 쥐 유전체의 오염도를 예측하는 방법을 제시하였으며, 3) 환자유래모델의 최적 유전자 분석법을 제시하였다.
○ 인간 암 연구 분야에서 환자유래모델은 널리 쓰이고 있는 실험 방법이고, 이 과정에서 쥐 유전체의 오염은 빈번하게 일어나고 있다. 이 오염은 인간 암 분석에 치명적인 거짓 정보를 주게 되므로, 연구팀이 개발한 최적 분석법을 통해 연구 결과의 신빙성을 크게 향상 시킬 수 있으리라 기대한다.
(그림1) 하마(HAMA)의 정의
환재유래 모델을 통해 배양된 환자의 암 조직에는 필연적으로 쥐 유전체의 오염이 발생할 수 밖에 없으며 이때 인간 유전서열과의 차이 때문에 검출되는 쥐 유전체 유래의 위양변이를 하마(HAMA, Human genome Aligned Mouse Allele)라고 정의하였다.
(그림2) 최적 분석법의 성능 분석
기존에 알려진 쥐 유전체 분리 툴의 성능 분석을 통해 조건별 최적의 성능을 나타내는 분리 툴을 규명 하였으며, 종래 분석법 대비 54.99%의 쥐 유전체 제거 정밀도 향상을 확인하였다. 이 과정에 하마 제거 과정을 추가로 수행할 경우 최종적으로 99.65%의 정밀도로 쥐 유전체 제거가 가능함을 밝혔다.
연구이야기
□ 연구를 시작한 계기나 배경은?
환자유래모델을 이용한 유전체 분석 진행시, 예상보다 훨씬 많은 양의 쥐 유전체가 포함되어 있음을 발견하였고, 인간 유전체 분석에 큰 혼란을 주고 있음을 알게 되었다. 이를 계기로 쥐 유전 서열의 분리/제거에 대한 최적 분석 표준이 있어야겠다는 생각을 하게 되었다.
□ 연구 전개 과정에 대한 소개
처음 연구를 시작할 당시에는 환자유래모델를 위한 분석 방법들이 조금씩 제시되기 시작할 때로, 분석법이 정립되지 않은 상태였기에 기존의 제시된 방법들을 바탕으로 최적 유전자 분석법을 만들고자 하였다. 연구를 진행하면서 쥐 유래의 위양 변이를 인간의 변이와 구분할 수 있는 ‘하마’의 개념을 정의하였고 이를 이용하여 기존의 방법보다 정확도를 높일 수 있는 환자유래모델에 대한 최적 유전자 분석법을 제시할 수 있었다.
□ 연구하면서 어려웠던 점이나 장애요소는 무엇인지? 어떻게 극복(해결)하였는지?
쥐의 유전체와 암 환자의 유전체를 비교 분석시 외부 요인으로 인한 오차를 최소한으로 하기 위해 동일한 환경에서 제작된 유전체 데이터가 필요하였다. 그러나 기존에 발표된 연구 데이터에서는 해당 조건에 맞는 데이터를 구할 수가 없어 직접 쥐의 조직을 채취하고 암환자 데이터 분석 시와 동일한 환경을 구축하여 쥐의 유전체 데이터를 제작하여 비교 분석 연구를 진행하였다.
□ 이번 성과, 무엇이 다른가?
차세대 염기서열 분석법(NGS)을 이용한 인간의 유전서열 연구과정에 쥐의 유전체가 섞이면 어떠한 영향을 초래하는지를 처음으로 제시하였다.
더불어 쥐 유전 서열을 분리·제거하기 위한 방법들이 발표되어 있기는 하지만, 각각의 방법들이 얼마나 성공적인지, 그중 어떤 방법이 최적인지, 제거에 실패한 쥐의 유전 서열을 추가로 제거할 방법은 없는지에 대한 대답을 제시함으로써 차별성 있는 연구 성과를 거두었다.
□ 실용화된다면 어떻게 활용될 수 있나? 실용화를 위한 과제는?
이번 연구 내용에서 관찰된 ‘하마‘와 정상 대립유전자 간의 비율을 이용하여 쥐 유전체의 오염도를 예측할 수 있는 공식을 도출해 내었다. 이를 근거로 쥐 유전체의 오염도를 간편하게 예측 할 수 있는 분석도구를 개발 중에 있으며, 실용화 된다면 환자 유전체 분석팀과 연구실에서 널리 쓰일 것이라고 예상한다.
□ 꼭 이루고 싶은 목표나 후속 연구계획은?
이번 연구를 통해 정립한 ‘하마‘를 바탕으로 암 환자의 유전체 데이터에서 쥐의 유전체의 오염 비율을 환자 개인에 맞추어 정확히 계산할 수 있는 분석 도구를 개발하고자 한다. 또한 보다 정확한 유전체 분석을 위해 앞에서 언급한 쥐의 유전체 오염비율을 계산하는 도구를 응용하고, 쥐의 유전체를 환자의 유전체 데이터에서 제거하여 순수 인간 유전체 데이터를 얻을 수 있는 도구를 개발하여 환자유래모델을 이용한 개인 맞춤 치료에 도움이 되는 연구를 후속 연구로 진행하고자 한다.
□ 기타 특별한 에피소드가 있었다면?
우리 연구팀은 직접 동물 실험을 수행하는 것이 아니라 생명정보학을 바탕으로 컴퓨터를 이용한 분석만을 수행하기에 실제 쥐 시료를 얻는 부분에서 어려움이 많았다. 주변 교수님들을 수소문하여, 쥐를 희생(sacrifice) 하는 날을 알아내고 그 쥐에서 간을 얻을 수 있는지 여쭤보는 데에 시간이 걸렸다. 다행히 한 교수님께서 흔쾌히 이를 허락하셨고 시료를 얻어 연구를 시작할 수 있게 되었다.
본 기사는 네티즌에 의해 작성되었거나 기관에서 작성된 보도자료로, BRIC의 입장이 아님을 밝힙니다. 또한 내용 중 개인에게 중요하다고 생각되는 부분은 사실확인을 꼭 하시기 바랍니다.
[기사 오류 신고하기]