최신 연구동향 정보를 제공하기 위해 생명과학관련 정보제공자를 모집합니다.
Bio리포트 동향리포트
NGS를 활용한 새로운 분석 방법 및 활용 사례
이시영(지니너스 주식회사)
목 차
1. NGS (Next Generation Sequencing) 기술 및 정밀의료 시대의 도래
2. NGS을 활용한 새로운 응용 기술
2.1. Single cell sequencing
2.1.1. Single cell DNA sequencing
2.1.2. Single cell RNA sequencing
2.2. Spatial transcriptome
2.3. Proteomics
2.3.1. Proximity Extension Assay (PEA)
3. 새로운 NGS기술의 적용사례 및 한계점
4. 결론
5. 참고문헌
1. NGS (Next Generation Sequencing) 기술 및 정밀의료 시대의 도래
2003년 10여 년이 넘는 기간 동안 수조 원에 달하는 비용을 들여 인간의 모든 염기서열을 확인하는 전 세계적인 프로젝트인 ‘Human genome project’가 완성되어 세계에 발표되었다. 이렇게 완성된 염기서열 분석이 인간의 질병을 개선할 수 있을 것으로 수많은 과학자들을 비롯하여 대중들 또한 많은 기대를 하게 만들었다. 그러나, 하나의 개체의 유전정보를 가지고 있는 것으로는 질병 및 기전을 비교하기가 어려웠고 당시의 기술 및 비용으로는 각 인간의 개체의 차이를 구별하거나 질병 관련 변이를 찾는다는 것이 쉽지 않았다.
Human genome project에서 사용된 염기서열 분석방법은 1977년 Fredrick sanger 연구진에서 개발한 직접염기서열분석방법 혹은 생어 시퀀싱(sanger sequencing)과 1988년 Craig Venter 연구진에서 사용한 샷건 시퀀싱(Shotgun method)으로 나눌 수 있다. 생어 시퀀싱 방식은 DNA를 구성하는 dNTP와 ddNTP의 비율을 섞어주어 전기영동으로 조각의 크기를 구분하는 방식이다. 이 방식으로 염기서열을 결정하는 데는 중간에 이루어지는 PCR 증폭 과정으로 인해 소요되는 시간이 비교적 높았으며, 인력 및 소모적인 비용을 고려할 때 비용 효율적인 부분을 고려하기 어려웠다. 반면 샷건 시퀀싱 방식은 DNA를 무작위로 커다란 절편화를 만들고 그에 대하여 겹치는 부분들을 이어나가는 방식이기 때문에 시간면에서 매우 빠른 분석이 가능하도록 만들었다 [1].
샷건 시퀀싱 방법에서 나온 효율성을 바탕으로 다양한 연구기관과 회사에서 노력을 시작하면서 차세대 염기서열 분석법(NGS)이 개발되었고, 직접염기서열분석방법처럼 염기서열의 하나하나를 확인하는 것이 아닌, 유전체를 무작위적으로 절편을 만들어 일정 fragment를 통째로 읽고 매칭 할 수 있는 방식이 가능해지게 되었다.
이를 기반으로 2004년부터 NGS 장비가 상용화되면서 범국가차원에서 진행하는 프로젝트의 스케일을 기관별, 연구소별 연구가 가능한 상황이 되었고, 2010년 Illumina사에서 HiS-eq을 이용한 개인의 전장유전체 해석에 1,000만 원가량이 필요했다면 2017년에는 Illumina No-vaSeq 6000 등의 장비가 출시되면서 개인 DNA 분석비용이 10만 원까지 도달하는 상황이 되었다 [2-3].
이러한 가격 비용의 절감으로 인하여 현재는 수많은 개인의 유전체 분석이 가능해졌고, 개개인의 유전정보에 따른 특징을 규명하여 수많은 질환에서 유전변이와의 상관관계를 밝혀내고 있다. 특히 유전적인 차이를 확연하게 확인할 수 있는 암과 같은 질환의 경우 이미 변이 정보별로 암의 성질을 분류하고, 이러한 정보를 각 연구자들이 공유할 수 있도록 TCGA라는 플랫폼을 만들어 공개적으로 사용하도록 하였다. 이에 따른 맞춤형 항암제 투여가 이루어지고 있으며 개별적인 차원의 mutation을 시스템적인 변이 지수로 확인하는 방법 등이 개발 및 보완되고 있다. 전체 코딩 게놈에서 발생하는 체세포 변이(SNV 또는 INDEL)의 총개수를 카운팅 하여 메가베이스(megabase) 단위로 계산한 Tumor Mutation Burden (TMB)의 지표나, MLH1, MSH2, MSH6, PMS2 등 mismatch repair (MMR) protein의 발현을 비교하는 IHC 또는 PCR을 통해 암과 정상 조직에서 나타나는 microsatellite의 길이 또는 발현의 정도를 측정하는 Microsatellite Instability (MSI) 지표 등이 계속해서 치료제의 반응성과 매칭이 되고 있고 그 외에도 세부적으로 정보가 확장되어 환자들에게 맞춤형 치료를 제공하는 정밀의료 시대가 본격적으로 도래하고 있다 [1-2].
2. NGS을 활용한 새로운 응용 기술
NGS를 방식을 활용하여 유전체 정보를 얻는 기본적인 방식에는 DNA, RNA 정보를 읽는 방식이 있다. DNA를 읽는 방식에는 전장유전체를 모두 확인할 수 있는 Whole genome sequencing (WGS), Protein coding 영역인 exome 영역만을 보는 Whole exome sequencing (WES), 확인하고자 하는 영역의 유전정보를 Panel 식으로 구성하여 보는 Panel sequencing, mRNA의 발현 총체를 확인할 수 있는 Whole transcriptome sequencing(WTS) 등이 있다. 이러한 정보를 Human 혹은 mouse에서 읽는 방법이 신약개발 및 연구목적으로 가장 많이 활용되고 있고 microbiome이나 bacteria 등에서도 다양한 목적을 가지고 사용되고 있다.
이러한 NGS 방식의 기본적인 내용을 활용한 응용기술들이 개발되고 있으며 이를 통해 기존방식으로 확인할 수 있는 범위를 비약적으로 향상시키거나, 기존방식으로 확인할 수 없었던 분석들을 진행할 수 있게 되었다.
2.1. Single cell sequencing
2012년 암에서 나오는 특이적인 변이에 따른 화학항암제의 저항성 및 암세포 타입별 차이에 대한 연구를 진행하기 위해 single cell 단위로 DNA sequencing을 한 사례가 Nature지에 대두되어 나오기 시작했다. 이것은 유전체 분석 기술의 향상과 더불어 데이터 처리속도 및 저장공간의 발달로 인하여 그동안 시도될 수 없던 부분이 현실화된 순간이었다.
본 사례를 필두로 2010년 이후로 single cell 단위의 분석이 늘어나게 되었다. 암과 같은 heterogeneity가 높은 질환에서 유전적 변이 차이를 확인하기 위한 Single cell DNA sequencing 기술이 나오게 되었고, 각 세포 단위의 RNA의 발현 양상을 확인하는 기술도 개발되기 시작하였다.
현재는 사람 및 동물, 미생물 등을 대상으로 한 NGS, FC, PCR, MS/MS, Microscopy 등 여러 기술에 사용되는 응용분석까지 사용되고 있으며, Science지에서는 최근 개발된 단일세포 시퀀싱 및 이미징 등 단일세포 분석기술이 새로운 과학적 발견을 가속화할 것으로 전망하고 있으며, 특히 단일세포 분석기술은 생물학, 면역학, 종양학에 매우 진보된 접근방식을 제공할 것으로 예상하고 있다 [4].
2.1.1. Single cell DNA sequencing
암과 같은 질환에서는 변이가 빈번하게 발생하기 때문에 세포 단위로 분리해서 유전체 분석을 진행한다면 진행 및 중요 변이에 대한 구체적인 정보를 얻을 수 있다. 단일 세포 단위로 분석을 하기 위해서는 분리 기술이 중요하게 작용하는데, 물리적으로 세포를 분리시키는 방법으로 고전적으로 직접 세포를 집어내 분리하는 방법부터 레이저를 통해 세포를 분리하는 방법(Laser capture microdissection, LCM) 등이 있고, 유세포 분석기(fluorescence-activated cell sorting, FACS)를 사용하거나 지정된 well에 세포를 분리해서 넣는 방식 등을 통해 각 세포별로 분리가 가능하다.
분리된 세포들을 바탕으로 DNA를 증폭시키는 방법에는 random priming 방식인 DOP-PCR과 MDA (multiple displacement amplification), MALBAC (multiple annealing and looping based amplification cycle) 등이 있으며, 이를 통하여 세포의 개별적인 DNA 변이 등을 검출할 수 있다 [5].
2.1.1. Single cell RNA sequencing
세포단위의 RNA를 측정할 수 있는 기술로 인해 세포 간의 고유한 차이를 확인할 수 있게 됨에 따라, 원하는 조직에서 각 세포단위의 특징을 예측하여 세포별 RNA 발현 양상을 확인할 수 있게 되었다. Single cell RNA sequencing도 세포의 분리 방식이 중요한데, 가장 많이 쓰이고 있는 방식은 microdroplet을 통해 만드는 방법과 microwell로 세포를 분리시키는 방식이다. 세포를 개별적으로 분리할 때 보통 수천 개~만개 단위의 세포가 분리되고 보통 이를 pooling 하여 시퀀싱 하기 때문에 각 세포별로 고유한 바코드를 붙여 식별이 가능하도록 한다.
Single cell RNA sequencing은 2014년부터 본격적으로 상용화되기 시작하여, 최근 연구 검증 방식에서는 빠지지 않고 등장하고 있다. 세포 각각의 발현의 차이를 알고리즘으로 구분하면 세포별로 clustering을 만들 수가 있게 되는데, 이러한 특징을 암 분야, 면역질환의 치료방안이나 발생학에서 주로 사용하고 있으며, 최근에는 3세대 항암제로 환자의 면역력을 높여 치료하는 면역관문억제제의 적응증을 높이는 연구로도 많이 사용되고 있다. 개인이 가진 유전적 특성 및 면역세포의 특성에 따라 효과의 차이를 보이는 면역관문억제제 특성상 일부 환자에게는 부작용이 적고 효과가 매우 좋으나, 면역세포의 불활성화 및 특정 유전적인 발현이 없는 경우는 효과가 듣지 않는 환자들도 있다. single cell RNA sequencing을 통해 환자의 T cell 분포 등의 면역세포의 특성을 세포 단위로 확인할 수 있기 때문에 어떤 환자가 약물에 대한 반응성을 가질 수 있을지 예측해볼 수 있다. 또한 약물에 대한 반응성이 없는 환자군을 대상으로 새로운 약물의 표적을 발견할 수도 있다. 이렇게 기존의 방식으로 확인하기 어렵던 것들의 분석을 가능하게 한 혁신적인 방법으로 2019년 Nature methods에서 올해의 기술로 선정되기도 하였다.
최근에는 single cell RNA sequencing의 단점을 보완하거나, Chromatin의 구조 정보까지 함께 볼 수 있는 기술들이 개발되고 있다. 일례로 central dogma에 의해 보통 단백질의 발현이 예측되는 것을 기본으로 RNA에서의 분석을 진행하지만, 세포 표면에 있는 단백질의 경우나 RNA수준에서 protein은 생성되지만 degradation이 많이 일어나는 경우에는 실제 RNA의 발현을 통해 측정한 값과 실제 protein의 양이 일치되지 않는 경우가 있다. 이러한 단점을 극복하기 위해 세포 표면에 고유 바코드가 있는 항체를 부착한 후에 각 세포별 분석 시 태깅 되었던 항체 바코드를 시퀀싱 하여 세포 표면에 존재하는 단백질의 발현을 보다 정밀하게 확인하는 CITE-seq (Cellular Indexing of Transcriptomes and Epitopes by Sequencing) 기술들이 있다. 또한 RNA의 발현과 chromatin의 구조 정보에 따른 상관관계를 밝히는 후생유전학적인 연구에서 기존에는 조직 전체에서 평균적인 chromatin 구조 정보만을 확인했다면, 최근에는 single cell 단위로 chromatin의 정보를 확인할 수 있는 single cell ATAC sequencing 등의 기술이 있으며, 하나의 세포에서 나타나는 유전 정보와 chromatin 정보를 함께 확인할 수 있는 multiome ATAC sequencing 등의 플랫폼도 사용되고 있다 [6-7].
2.2. Spatial transcriptome
세포단위로 분석될 수 있는 기술에 더불어 조직에서의 공간정보를 세분화해서 분석할 수 있는 기술이 발달되기 시작하였다. 공간정보를 확인할 수 있는 기술은 1982년 smFISH (single molecule Fluorescence In Situ Hybridization) 방식으로부터 시작된 오래된 기술이었으나, 본격적으로 상용화되어 플랫폼이 사용되기 시작한 것은 2020년 부근이다. 공간정보와 RNA 정보 혹은 protein 정보를 함께 매칭해서 정보를 확인하는 기술로 암 분야 및 발생학 분야에서 활발하게 사용되고 있으며, 뇌와 같은 구조적인 차이에 따른 기능을 하는 조직의 연구에서도 많은 활용이 진행되고 있다.
2020년 Nature methods에서 올해의 기술로 선정된 기술인 Visium은 10x genomics의 spa-tial transcriptome 플랫폼으로 2019년 개발되어 가장 상용화가 잘된 플랫폼이다. 최근 중국 China National GeneBank에서 만든 STOmicsDB (https://db.cngb.org/stomics/)에서 가장 활발하게 사용되는 플랫폼이며, single cell RNA sequencing에서 사용한 고유 바코드인 UMI를 슬라이드 바닥에 고정시키고 그 위에 조직 슬라이드를 얹어 위치 정보에 따른 RNA의 총 발현량을 확인할 수 있는 기술이다.
Visium은 6.5 mm x 6.5 mm의 정사각형 슬라이드에 약 5,000여 개의 원형 spot이 있으며, 지름 55 uM의 원형 spot에 있는 RNA들의 전체적인 발현량을 확인할 수 있다. Spot당 세포의 수는 대략 3-20개 정도의 발현을 확인할 수 있기 때문에 완전하게 세포단위로 분석을 하는 것은 어렵고, 대략적인 발현 양상을 통해 비교를 원하는 부위의 발현을 확인할 수 있다. 기본적으로 Fresh frozen tissue에서 분석을 진행하는 플랫폼이 선행되었으나, 현재는 FFPE block에서도 Visium이 가능하게 되었다. 이러한 공간정보의 활용은 발생학적으로 새로운 성질을 가진 세포를 분류할 목적으로 사용하거나, 공간 정보가 중요한 질환 등의 연구에도 사용할 수 있다 [8].
면역관문억제제 관련 연구에서도 면역세포가 암세포에 침투해있는 경우 더 효능을 보일 가능성이 높은데, Visium을 활용하면 암 영역에서 침투해있는 면역세포의 발현 양상을 구체적으로 확인할 수 있기 때문에 보다 정밀한 분석을 진행할 수 있다. 최근에는 spot의 사이즈를 더욱 정밀하게 만들어 지름을 5 um까지 줄여서 6.5 mm x 6.5mm에서 백만여 개 이상의 spot을 확인할 수 있는 Visium HD 플랫폼이 출시 예정에 있으며, Xenium이라고 하는 단일 세포 내에서의 RNA 발현을 probe 형식으로 확인할 수 있는 플랫폼도 이른 시일 내에 상용화될 예정이다.
또 다른 상용화된 플랫폼으로 Nanostring사의 spatial transcriptome GeoMX 플랫폼이 있다. GeoMX 또한 2019년 개발되어 많은 연구에 사용되고 있으며, Visium의 조직 분석범위인 6.5 mm x 6.5 mm인 사이즈에 비해 36 mm x 14 mm 이상으로 더 넓은 영역을 확인할 수 있으며, protein의 발현까지 쉽게 확인할 수 있다는 장점이 있다 [9]. 차이점으로는 전체 사이즈에서 12~24개의 ROI (Region of Interest) spot을 선정해야 하며 spot의 지름이 대략 200 um으로 visium에 비해서 상당히 큰 부분의 영역을 확인하는 부분이 있다. 또한 probe를 기반으로 한 분석이기 때문에 RNA의 총발현을 확인하지 못하는 부분은 Fresh tissue에서 확인할 수 있는 Visum에 비해 단점으로 작용할 수 있다. Spatial traiscriptome 기술 관련해서는 플랫폼별로 장단점이 있기 때문에 사용자의 목적에 따라 적절한 플랫을 사용하는 것이 필요하다.
2.3. Proteomics
최근에는 NGS의 기술을 통해 증폭시키는 기술을 기반으로 proteomics를 분석할 수 있는 기술이 개발되었다. Proteomics는 신약개발 및 기능을 가진 단백질을 마커로 하여 연구하는 분야로, 제약회사에서 개발하는 가장 직접적인 타깃으로 예로부터 수많은 연구가 되어있는 주요한 타깃 중 하나이다. 가장 주요한 기능을 함에도 불구하고 시간적인 증명과정에 대한 소요나 분석에 필요한 비용적인 부분의 한계로 많은 마커를 한 번에 확인하는 것이 어려웠기 때문에, 현재까지의 분석기술로는 RNA의 총 발현량을 확인하는 것이 단백질의 발현을 대신해서 확인할 수 있는 효율적인 기술이었다. 하지만 proteomics에서도 NGS방식을 이용하여 단백질 자체를 넓은 범위에서 정밀하게 도출할 뿐만 아니라 매우 적은 용량으로도 측정할 수 있는 방식이 개발됨에 따라 다양한 가능성이 열리게 되었다.
2.3.1. Proximity Extension Assay (PEA)
PEA 방식은 Olink사에서 개발한 방식으로 개별 단백질마다, 상호작용할 수 있는 고유한 염기서열을 가진 항체 2개를 붙여 단백질이 존재하는 경우 염기서열이 이중나선을 이루게 되어 해당 이중나선을 증폭시켜서 확인하는 기술이다. 기존에도 단백질에 대한 분석 기술은 상당히 많은 방식으로 존재해왔으나, NGS를 활용하는 방식으로 적은 양의 샘플에서도 넓은 범위의 단백질을 확인할 수 있으며 신뢰도와, 정밀도도 높게 확인할 수 있게 되었다.
10 ul의 작은 볼륨으로도 많은 단백질을 한 번에 볼 수 있다는 장점을 가지고 있으며, 현재까지 약 3,084개의 단백질을 한 번에 확인할 수 있고, 계속해서 확인할 수 있는 단백질의 양을 늘려가고 있다. 이러한 단백질의 발현 패턴 확인을 통해 약물 개발을 위한 단백질 표적을 검출해낼 수 있으며, 극미량의 검체량에서도 특정 단백질을 검출할 수 있기 때문에 분자진단 영역에서도 새로운 시도를 해볼 수 있게 되었다. 또한 새로운 바이오마커의 확인용으로 high-throughput screening이 가능하기 때문에, 기존 유전체 분석 정보에 proteomics 정보를 매칭 하여 새로운 마커 발굴 및 검증이 가능하다 [10].
3. 새로운 NGS 기술의 적용사례 및 한계점
새로운 NGS 기술은 이미 실생활에 조금씩 적용되고 있다. Single cell DNA sequencing의 경우 태아의 유전자 검사 등을 위해서 활발하게 사용되고 있으며, Single cell RNA sequencing은 현재 면역질환 및 암 질환, 발생학 영역의 심층 연구에서 기본적으로 활용해야 하는 학문으로 점차 자리매김하고 있다. 발생학적인 연구에서 기존에 알려진 세포 타입을 넘어 새로운 세포들이 해당 플랫폼을 활용해서 발견하고 있으며, 또한 제약사의 임상시험에서도 최근 single cell RNA sequencing에 대한 접근이 2015년 이후로 증가 추세를 보이고 있으며, 면역항암제에 대한 예후 예측에 대한 바이오마커 발굴 관련 결과들을 ASCO, ESMO, AACR 등의 학회에서 중요한 주제로 선보이고 있고 최근에는 국내 제약사에서도 이러한 접근을 시작하고 있다.
Spatial transcriptomics의 경우 이미지 관련 AI 기술 발달과 더불어 최근 관심이 높아지고 있으며, 최근 이미지 정보만을 가지고 각 spot에서 특정 유전자 발현을 예측할 수 있는 알고리즘이 개발되어 발표되었다. Spatial transcriptomics의 데이터들이 점차 축적되어 이미지 정보만을 가지고 특정 질환이나 유전변이를 예측할 수 있게 된다면, 환자군을 더 세분화해서 분류하는 것이 가능해지고, 구체적인 분류에서 새로운 신약 타깃을 발굴하는데도 사용될 수 있다.
또한 NGS를 활용한 proteomics기술과 관련해서도 위에 기술하였던 PEA를 이용한 방식 등이 UK biobank 등에서 데이터를 수집하는데 기본적인 플랫폼 중 하나로 자리 잡고 있으며, 이를 통해 국가적인 차원에서 이미 데이터를 수집하는 것을 확인할 수 있다.
NGS 신기술은 이와 같이 기존 NGS 방식에 비해 광범위한 영역의 검출을 한 번에 해내거나 기존에 분류하지 못한 세포별 특성을 고려해서 심층적인 분석을 해낼 수 있다는 큰 장점이 있다. 하지만 기술의 활용도에도 불구하고 아직까지는 비용적으로 접근하기 어렵다는 한계가 있다. 기본적으로 Bulk RNA sequencing에 비해 single cell RNA sequencing은 가격이 15배 이상 차이가 나기 때문에 여러 샘플에서 확인하기 어려운 단점이 있으며, single cell RNA sequencing 등은 최대한 세포 상태로 보존 상태를 유지하기 위해서 조직을 관리해주는 데 상당한 어려움이 있는 것도 한계점 중 하나다. 이러한 단점들은 플랫폼별로 계속해서 보완을 하고 있으나, 아직까지는 그 한계를 극복하는 데 시간이 걸릴 것으로 생각된다. 다만 새로운 플랫폼들의 발전 속도로 미루어볼 때 새로운 플랫폼으로 기존 방식의 한계를 극복하는 시간이 계속 줄어들 것으로도 보인다.
4. 결론
현재까지 기술한 NGS 방법들은 기존 NGS를 활용한 유전체 분석방식에 비하여 세포단위까지 확인할 수 있는 심층적인 분석 결과를 전달해줄 수 있거나 적은 양으로도 광범위한 결과를 제공해 줄 수 있다는 장점이 있다. 다만, 아직까지는 새로운 기술의 사용에 대한 비용적인 부분과 기존 분석법에 비해 시간적으로 소요되는 부분에 대한 보완이 필요하며, 해당 분석 결과를 얻을 수 있는 장비나 분석에 필요한 인력 수급 역시 필요하다.
NGS를 활용한 신기술들은 신약개발이나, 환자 진단 관련 임상에서 이미 활용되는 사례들을 확인할 수 있으며, 분석 기술 및 저장 기술, 분석 기술의 발전 속도에 따라 매년 눈에 띄는 속도로 발전할 것이다. 시대적 변화에 맞추어 신약개발, 분자진단에 해당 기술들이 접목되어 개인 맞춤형 치료, 정밀의료 시대가 더 가까이 다가올 것으로 기대한다.
4. 참고문헌
==>첨부파일(PDF) 참조
|
|||
본 게시물의 무단 복제 및 배포를 금하며, 일부 내용 인용시 출처를 밝혀야 합니다.
자료열람안내
본 내용은 BRIC에서 추가적인 검증과정을 거친 정보가 아님을 밝힙니다.
내용 중 잘못된 사실 전달 또는 오역 등이 있을 시 BRIC으로 연락(view@ibric.org) 바랍니다.