최신 연구동향 정보를 제공하기 위해 생명과학관련 정보제공자를 모집합니다.
Bio리포트 동향리포트
오믹스가 열어가는 정밀의료의 세계(Omics Illuminating the Path of Precision Medicine)
이훈석(시클리드)
목 차
1. 서론
2. 본론
2.1. 암과 오믹스(Cancer and Omics)
2.1.1. 대장암(Colon Cancer)
2.1.2. 유방암(Breast Cancer)
2.1.3. 폐암(Lung Cancer)
2.1.4. 전립선암(Prostate Cancer)
2.2. 암 외 질병에 대한 오믹스의 응용(Application of Omics in Other Human Diseases)
2.2.1. 감염성 질환(Infectious Diseases)
2.2.2. 염증성 장 질환(Inflammatory Bowel Diseases)
2.2.3. 노화(Aging)
3. 결론
4. 참고문헌
1. 서론
오믹스(omics)는 빅데이터를 활용하여 분자 수준에서 질병 발달을 모니터링할 수 있는 “고처리량(high-throughput) 실험 기술”을 의미한다. 특히, 2001년 인간 유전체 서열 분석(human whole genome sequencing)은 오믹스 연구에 있어 획기적인 전환점이 되었다 [1]. 접미사 ‘ome’은 “염색체(chromosome)”에서 유래하였으며, 유전체학(genomics), 전사체학(transcriptomics), 단백질체학(proteomics), 대사체학(metabolomics) 등 다양한 생물학 분야를 포함하고 있다. 특히 정밀의학(precision medicine)은 정확한 예방, 진단 및 치료 옵션을 제공하는 임상적 접근 방식이 중요한데, 고처리량 분석 방법을 기반으로 하는 오믹스 분석은 전통적인 방법에 비해 더 정확하고 효율적인 것으로 입증되었고 과학자들이 질병의 유전적 구조를 더 잘 이해할 수 있기에, 정밀의학의 중요한 도구로 간주되고 있다 [2].
유전체학은 전체 유전체에 오믹스를 적용한 것으로 모든 오믹스 기술 중 가장 성숙한 분야라고 말할 수 있는데, 생물체의 모든 유전자를 특성화하고 정량화하고, 유전자 간의 상호 관계를 밝히고, 생물체에 미치는 영향을 파악하는 것을 목표로 한다. 이를 위해 전체 유전체 서열과 그 안의 DNA 서열 변이 단일 염기 변이(single nucleotide variations), 삽입-결실(insertion-deletions), 구조적 변이(structural variations), 복제 수 변이(copy number alterations) 등)를 연구한다 [3]. 2000년 초기 인간 유전체 서열 분석에 수십억 달러가 소요되었던 비용은 2022년 기준으로 단 100달러로 감소했다. 처음 인간 유전체를 분석하는 데 13년이 걸렸던 것과 달리, 현재는 롱리드 시퀀싱(long-read sequencing) 기술을 통해 환자의 유전체를 단 5시간 만에 분석할 수 있어 유전적 진단과 치료 속도가 크게 향상되었다 [4]. NGS 기반 유전체학의 대표적인 사례로는 고속 대량 쌍말단 매핑(high-throughput and massive paired-end mapping)이 있는데, 이 기술은 인간 유전체 구조적 변이가 초기 가설보다 훨씬 더 크다는 것을 밝혀내며 표현형 변이와 유전 질환에 대한 이해를 크게 향상시켰다 [5]. 유전체 분석은 이미 의학에 큰 영향을 미치고 있으며, 질병 진단, 치료 반응 예측, 예후 평가 등에 활용되고 있다. 전사 단계는 유전자 발현의 핵심 조절 단계이기에, 전사체학은 포스트 유전자 시대에 분자과학 연구에 영감을 주는 분야로 등장하였다 [6]. 전사체는 특정 세포 유형이나 조직의 게놈에 의해 인코딩 된 메신저 RNA (messenger RNAs, mRNA), 리보솜 RNA (ribosomal RNAs, rRNA), 전사 RNA (transfer RNAs, tRNA)를 포함한 리보핵산(RNA)의 전체 세트라고 할 수 있다. 단백질을 인코딩하다는 mRNA와 인코딩하지 않은 비코딩 RNA (non-coding RNAs, ncRNA)로 구분할 수 있는데, ncRNA역시 microRNA와 긴 ncRNA로 구성되며 최근에는 유전자 발현과 단백질 기능을 포함하는 조절 기능이 있는 것으로 입증되는 등 중요한 역할을 한다 [7]. 프로테옴(proteome)은 특정 시간, 특정 조건, 세포, 조직 또는 생물체와 같은 한 장소에서 유전자에 의해 발현되는 모든 단백질의 집합으로 설명할 수 있는데, 단백질 구성, 구조, 기능은 물론 발현, 번역 후 변화, 다양한 단백질 간 및 다른 분자와의 상호 작용에 대한 연구를 포함하는 대규모의 광범위한 단백질 프로필 연구를 단백질체학이라고 한다 [8].
질량분석법(mass spectrometry, MS)을 기반으로 한 단백질체학은, 1990년대에 전기분무 이온화법(electrospray Ionization, ESI)과 매트릭스 보조 레이저 탈착 이온화법(matrix-assisted laser desorption Ionization, MALDI)과 같은 이온화 기술을 기반으로 시작되었다 [9]. 21세기 초반에는 액체 크로마토그래피(liquid chromatography, LC)와 MS 매개변수가 크게 개선되었으며, 특히 스캐닝 주파수와 질량 정확도가 향상되어 LC-MS/MS 기반 "차세대 단백질체학" 시대가 열렸다. MS 기반 단백질체학은 복잡하지만 예측 가능한 바이오마커의 특징을 성공적으로 밝혀냄으로써 임상적 의사결정을 개선하고, 머신러닝(machine learning, ML)을 통해 환자의 경과를 예측하는 데 기여하는 등 많은 가능성을 보여주고 있다 [10]. 대사체학은 생물학적 기질의 대사산물 프로파일링은 모든 분자 수준에서 발생하는 변형을 드러내는 가장 최신의 분야하고 할 수 있는데, 대사체 발현 패턴의 변화와 개별 대사체 농도 및 생화학적 경로의 변화를 발견하여 다양한 질병의 표현형을 결정하는 데 특히 중요하게 여겨진다 [11]. 특히 대사체학은 유전체학, 전사체학, 단백질체학의 결과적 단계로 간주되기도 하며, 잠재적으로 비침습적인 액체생검 접근법(noninvasive liquid biopsy approach)으로서의 가능성을 보여주기도 한다 [12]. 약물유전체학(pharmacogenomics)은 약물유전학(pharmacogenetics)의 확장된 분야로, 약물과 유전자 간의 상호작용을 연구하는 정밀의학의 주요 분야이다. 약물유전체학은 "약물 반응 및 부작용과 관련된 다중 유전자 변이를 연구”하는 학문으로, "단일 유전자 변이”에 초점을 맞추는 약물유전학과 구별된다 [13]. 질병에 대한 개인의 감수성은 유전적 구성과 대사 요인의 차이로 인해 다르기에, 악물유전체학을 기반으로 개인의 유전자 구조, 발현 및 기능에 적합한 약물을 투여함으로써 치료의 안전성과 효능을 개선하는 데 도움을 줄 수 있다 [14]. 약물유전체학의 목표는 정밀의학(precision medical science)을 위한 증거 기반을 만들고, 유전자 발현과 유전적 변이가 약물 반응과 안전성에 미치는 영향을 밝히며, 미래 약물에 대한 새로운 표적을 발견하는 것이다. 특히 암 분야에서 더 빠르고 비용 효율적인 방식으로 부작용(adverse drug reactions, ADR)이 적은 더 효과적인 약물을 개발함으로써 임상 시험과 약물 개발 프로세스의 기반을 바꾸고 있다 [15].
과거의 단일 오믹스 데이터는 주로 상관적(correlative) 성격을 가지며, 분자적 사건의 복잡성과 상호작용을 완전히 포착하지 못했다. 예를 들어, 광범위한 유전체 연관 연구(genome-wide association studies, GWAS)는 여러 질병에 대해 수천 개의 위험 유전자의 위치를 확인했지만, 원인 유전자를 식별하지 못하는 경우가 많아 임상적 활용도가 제한되었다 [16]. 최근 단백질체학, 대사체학 등 다양한 오믹스 기술과 컴퓨팅 역량의 발전은 다중 오믹스 통합 분석(multi-omics in-tegrated analysis)을 가능하게 하였는데, 다중 오믹스는 개별 데이터 유형의 강점을 결합함으로써 정밀의학의 발전을 가져오고 있다 [17]. 본 리포트에서는 오믹스 기술이 암을 비롯한 다양한 질병 연구와 임상 적용에서 어떻게 활용되고 있는지에 대한 동향을 분석하고, 다중 오믹스 통합 분석이 정밀의료(precision medicine) 실현에 있어 어떠한 가능성과 방향성을 제시하는지 살펴보고자 한다.
2. 본론
2.1. 암과 오믹스 (Cancer and Omics)
지난 20년간 종양이나 질병에 대한 분자적 분석은 암 발생의 근본적인 생물학을 이해하는 데 중요한 진전을 이루었다. 이를 통해 “암의 이질성(heterogeneity)”이 널리 인정받게 되었다. 이러한 결과로, 암 환자 치료에 대한 단일 접근 방식(one-size-fits-all approach)은 더 이상 통용되지 않으며, 대신 환자의 개별 상태에 따라 적절하게 치료하는 정말의학 분야가 대두되었다. 최근 표적 치료(targeted therapy)를 활용한 임상 시험에서 긍정적인 반응률 등이 보고되고 있지만, 환자 선택이 점점 더 정밀해진다는 것은 바이오마커를 가진 집단의 규모가 줄어든다는 것을 의미한다. 이로 인해 가장 효과적인 표적 치료법이 특정 암 유형을 가진 소수의 환자에게만 적용될 가능성이 높으며, 따라서 여전히 대다수의 환자는 이러한 치료 혜택을 받지 못하고 있는 실정이다 [18]. 이를 극복하기 위해 약물 개발과 환자 선별에 대한 새로운 접근법이 필요하다. 오믹스 기술은 암 DNA 서열, 유전자 발현 프로파일, 단백질 수준, 면역 레퍼토리 등 분자적 특징을 정밀하게 분석함으로써 암 생물학의 대한 깊은 이해를 제공했을 뿐만 아니라, 임상 실무에서 필수적인 도구로 자리 잡고 있다 [19]. 전임상 실험과 임상 시험을 바탕으로 생성된 다중 오믹스 데이터는 약물 발견을 가속화하고, 임상 진단을 지원하여, 암 환자의 치료 및 관리에 대한 의사결정을 돕는 등, 오믹스의 활용을 통해 암 환자의 치료 및 관리 방식을 혁신적으로 변화시키고 있다. 따라서 환자 개개인을 위한 정밀의료는 다중 오믹스 접근법을 바탕으로 포괄적이고 정밀한 데이터 분석을 통해 가능성을 보여주고 있다 [20].
2.1.1. 대장암(Colon Cancer)
대장암은 대장에서 발생하는 다양한 유전적 및 후성유전적 변화가 복합적으로 작용하여 발생하는 다면적인 질병이다. 이러한 복잡한 병태생리학적 특성으로 인해 환자의 예후와 치료 반응을 정확히 예측하기 어렵다. 오믹스 기술의 사용으로 대장암 발생 및 진행과 관련된 분자 변화와 경로에 대한 이해를 크게 향상시켰으며, 이러한 발전은 질병을 관리하기 위한 보다 개인화되고 정밀한 접근법의 개발을 가져왔다 [21]. 유전자 발현 프로파일링은 종양의 시작, 진행 및 전이와 관련된 차별적인 유전자를 밝혀냈으며, 전사체 분석을 통해 각각의 고유한 유전자 발현 프로파일링과 임상적 특징을 보이는 대장암의 다양한 분자 아형을 확인하였다 [22]. 또한 단백질체학 및 대사체학은 대장암에서 새로운 바이오마커와 표적을 식별하는데 유용한 도구로 부상하고 있다.
대장암은 대장의 상피세포에서 시작되며, 초기 단계는 정상 대장 상피 세포가 선종성 용종증 대장균 유전자(adenomatous polyposis coli gene)와 같은 특정 유전자의 돌연변이에 의하여 종양 세포로 변하게 된다 [23]. 이러한 종양 세포가 형성되면 증식하기 시작하고 사포 사멸(apoptosis) 및 면역 감시(immune surveillance)와 같은 정상적인 세포 제어 기작을 회피할 수 있는 유전적 변형(genetic alterations)을 축적하기 시작한다. 대장암에서 가장 빈번한 유전적 이상(genetic aberration)은 염색체 불안정성(chromosomal instability, CIN)으로, 이 아형(subtype)은 APC, KRAS, TP53, PI3KCA, SMAD4를 비롯한 주요 유전자의 돌연변이로 나타나게 된다. 또한 CpG 섬 메틸화 표현형(CpG island methylator phenotype, CIMP)과 같은 유전적 변이도 나타나는데, 이는 CpG 섬의 비정상적인 메틸화로 인해 종양 억제 유전자(tumor suppressor genes)가 침묵하는 현상을 초래한다 [24]. 특히 CIMP-high 종양은 독특한 분자적 아형으로, wild-type p53, 미세위성 불안정성(microsatellite instability, MSI) 및 BRAF 변이와 같은 유전적 특성을 보인다. 대장암의 진단에 있어 유전적 검사는 축적된 데이터를 기반으로 확립된 가이드라인에 따라 진행되고 있는데, 초기에는 환자의 가족력, 개인 위험 요인, 종양 특성과 같이 관찰 가능한 표현형(phenotype)을 중심으로 평가가 이루어 졌다 [25]. 이후, 차세대 시퀀싱(next-generation sequencing, NGS)의 도입으로 다중 유전자 패널 검사(multigene panel testing)로 전환되었으며, 이를 통해 관찰 가능한 특징 혹은 가족력만으로 발견되지 않는 생식세포 돌연변이(germline mutation)를 확인할 수 있게 되었다. 이외에도 메틸화된 SDC2 유전자를 활용한 “대변 DNA 검사(stool DNA testing)”가 대장암과 진행된 선종(advanced adenoma)을 탐지함에 있어, 약 83.8%의 민감도와 98%의 특이도를 기록하며 임상적으로 유망한 비침습적 진단 도구로 평가받고 있다 [26]. 또한, miRNA의 발현 조절 이상 및 작은 비암호화 RNAs (small non-coding RNAs)의 발현 패턴은 대장님의 진단 및 예후와 밀접한 관련이 있다. 최근 리뷰 연구에 따르면 순환 혈청 miRNA (circulating serum miRNA)와 대변 miRNA (fecal miRNA) 발현을 활용한 비침습적 바이오마커가 대장암 조기 진단에 효과적임을 입증했다 [27]. 특히 특정 miRNA 패널은 80% 이상의 민감도와 특이도로 높은 진단 성능을 보였고, 이를 바탕으로 혈장 miRNA가 재발 위험 및 예후 평가에서도 중요한 역할을 할 수 있다고 보고하였다. 또한 혈장 및 조직 단백질체(proteome) 바이오마커는 대장암의 조기 발견과 진단에 있어 유망한 가능성을 보여주고 있다. 대표적인 혈장 바이오마커로는 암태아성 항원(carcinoembryonic antigen, CEA)과 상피세포 부착 분자(epithelial cell adhesion molecule, Ep-CAM)가 있다 [28-29]. CEA는 대장암 진행 단계와 예후가 좋지 않은 경우와 연관이 있으며, Ep-CAM은 암 치료의 잠재적 표적일 뿐만 아니라 환자의 예후를 예측하는 데 활용될 수 있다. 또한 대장암의 조직 바이오마커로는 열충격 단백질 27(heat shock protein 27, HSP27), 구아닌 뉴클레오타이드 결합 단백질 베타-2 유사체 1(guanine nucleotide-binding protein subunit beta-2-like, GNB2L1) 및 과산화환원효소-1(peroxiredoxin-1, PRDX1)이 있다 [30-31].
한편, 대사체학 분석은 대장암의 발생과 진행 과정에서 나타나는 대사적 변화를 종합적으로 이해하는 데 중요한 도구로 활용될 수 있는데, 대장암 환자의 혈장 대사체 분석 결과, 아미노산, 지질, 탄수화물 대사에서 변화가 관찰되었으며, 이러한 대사적 변화는 암세포의 증식, 침윤, 전이와 밀접하게 연관되어 있음이 보고되었다 [32]. 또한, 대장암 종양 조직에서는 해당작용(glycolysis), 트라이카복실산(tricarboxylic acid cycle, TCA) 회로, 오탄당 인산 경로(pentose phosphate pathway)와 같은 주요 대사 경로에서 유의미한 차이가 발견되었다. 이러한 발견은 암세포가 에너지와 생체 구성 요소를 생성하기 위해 대사 경로를 재프로그래밍한다는 사실을 보여준다. ‘Deng 연구팀’은 혈장 대사체 프로파일링이 좌측 대장암과 우측 대장암을 구별하는 데 유용할 수 있음을 보고하였고, 이는 대장암의 위치에 따라 대사적 특징이 달라질 수 있음을 시사한다 [33]. 트립토판 대사 이상(tryptophan metabolism dysregulation)은 대장암 발병과 밀접하게 연관되어 있으며, 트립토판 대사산물과 인돌 유도체(indole derivatives)의 변화는 면역 반응 조절, 염증 유발, 장내 미생물 균형 변화 등을 통해 종양 발생을 촉진할 수 있다 [34]. 연구에 따르면, 트립토판 수준은 대장암 위험과 역상관 관계를 보이며, 특정 트립토판 유도체는 종양 미세환경에서 면역 억제를 유도할 수 있는 것으로 나타났다. 단백질체학 연구 또한 대장암의 분자적 특성을 이해하는 데 기여하고 있는데, ‘Vasaikar 연구팀’은 높은 당분해(glycolysis) 활동이 MSI-H 종양에서 CD8+ T 세포 침투 감소와 연관이 있음을 밝혔다 [35]. 이는 당분해를 표적으로 삼음으로써 면역 관문 억제제에 대한 MSI-H 종양의 저항성을 극복할 수 있는 잠재적 전략이 될 수 있음을 시사한다. 또한 ‘Tang’의 연구에서는 TFR1, SAHH, HV307과 같은 단백질이 대장암 환자에서 차별적으로 발현된다는 사실을 확인했으며, ‘Zhong’의 연구에서는 SPARC와 LRG1을 포함하는 세포 외 소포가 건강한 사람과 비교하여 대장암 환자에서 차별적으로 발현되며 종양 위치에 따라 달라짐을 보여주었다 [36-37]. 대장암의 약물유전체학을 이해하는 것은 개인 맞춤형 치료 계획을 수립하는 데 있어 매우 중요하며, 대장암에서 가장 잘 알려진 약물유전체학적 바이오마커 중 하나는 KRAS 돌연변이다. KRAS 유전자는 대장암에서 빈번하게 돌연변이를 일으키며, 이는 세툭시맙(cetuximab)과 파니투무맙(panitumumab)과 같은 EGFR 억제제에 대한 저항성과 연관되어 있다 [38]. 이들 약물은 전이성 대장암 치료에 흔히 사용되지만, KRAS 돌연변이를 가진 환자에서는 약물의 효능이 크게 감소함에 따라, 이 돌연변이의 존재 여부를 확인하는 검사는 적절한 치료법을 선택하기 위한 필수 단계로 자리 잡았다. 또 다른 중요한 약물유전체학적 바이오마커는 디하이드로피리미딘 탈수소효소(dihydropyrimidine dehydrogenase, DPD)인데, DPD는 대장암 치료에 널리 사용되는 항암제인 5-플루오로우라실(5-fluorouracil, 5-FU)의 대사를 담당한다. DPD 활성이 감소된 환자는 5-FU 치료 시 심각한 독성을 경험할 위험이 높으며, 이러한 이유로, 5-FU 치료를 시작하기 전에 DPD 결핍 여부를 검사하는 것이 권장된다. 이외에도 대장암 화학요법 약물의 효능과 독성과 관련된 여러 유전적 변이가 보고되었는데, 예를 들어 UGT1A128 대립유전자는 이리노테칸(irinotecan) 치료 시 심각한 독성 위험 증가와 연관되어 있고, TPMT 유전자 변이는 아자티오프린(azathioprine)이나 머캅토퓨린(mercaptopurine)과 같은 티오퓨린 약물 치료 시 골수억제(myelosuppression) 위험을 높이는 것으로 알려져 있다 [39-40].
2.1.2. 유방암(Breast Cancer)
유방암은 전 세계적으로 여성에게 가장 흔히 발생하는 악성 종양 중 하나로, 높은 사망률로 인해 의료 시스템에 큰 부담을 주고 있다. 2020년 기준, 전 세계적으로 약 230만 건의 유방암이 새로 진단되었으며, 약 6.6%에 해당하는 67만 명이 유방암으로 사망한 것으로 보고되었다 [41]. 유방암은 조직학적(histologic), 유전적, 분자적으로 다양성을 보이는 복잡한 질병으로, 주로 40-64세 여성에게 발생하며, 진행성 유방암의 경우 5년 생존율이 30% 미만에 불과하다 [42]. 오믹스 기술의 발전은 유방암의 유전적 원인과 병리학적 변화를 밝히는 데 많은 도움을 주었으며, 특히 유전체, 후성유전체, 전사체 및 단백질체 데이터를 통합 분석하는 “다중 오믹스 접근법”은 환자 계층화와 조기 예후 예측을 가능하게 함으로써 정밀치료 개발에 중요한 도구로 활용되고 있다 [43].
유전적 변이와 후천적인 유전체 이상은 비정상적인 세포 증식을 유발하며, 이는 유방암 발암 과정의 주요 원인으로 작용한다. 특정 유전자의 돌연변이는 모든 암의 분자적 기초를 형성하지만, 악성으로의 변환은 체세포 돌연변이, DNA 복제 수 이상, DNA 복구 결함, 후성유전학적 변화 및 염색체 구조 재배열(결실, 증폭, 역위, 전좌 등)과 같은 과정을 거친다. 이러한 변화들을 명확히 분석하기 위해서는 전체 유전체 시퀀싱(whole genome sequencing, WGS)이 필수적이며, 이는 유방암 진행을 연구하는 데 있어 표준 연구 도구로 자리 잡고 있다 [44]. 유전체학은 고위험군 개인에서 가족력을 분석하여 조기 진단과 질병 위험 평가를 가능하게 하는 강력한 접근법으로, 이를 통해 유방암의 선별 검사를 사전에 수행할 수 있다 [45]. 대규모 유방암 코호트의 전체 유전체 프로파일링을 통해 각 아형에서 독특하게 나타나는 변이 과정을 확인할 수 있었는데, 이를 "유전체 돌연변이 서명(genomic mutational signatures)"이라고 한다 [46]. 이러한 돌연변이 과정에는 비정상적인 DNA 편집, 복제 이상, 염기 치환, 연속 중복/결실, DNA 복구 결함, 불일치 복구 결핍(mismatch repair deficiency) 및 발암 물질 노출로 인한 돌연변이가 포함된다. 특히, 각 유방암 아형은 하나 이상의 돌연변이 서명을 포함할 수 있으며, 이는 환자 분류(patient stratifica-tion)와 맞춤형 치료 전략 수립에 중요한 역할을 한다. 유방암의 유전체적 특징은 질병의 복잡성을 더 잘 이해하기 위해 필수적인데, 이를 위해 “The Cancer Genome Atlas (TCGA)”는 유방암의 유전체 불안정성(genomic instability)을 설명하는 데 기초가 되는 여섯 가지 정보를 제시하고 있다 [47].
이러한 접근법은 유방암의 분자적 메커니즘과 이질성을 이해하고, 환자 맞춤형 진단 및 치료 전략을 개발하는 데 중요한 기여를 하고 있다. 단백질체학을 기반으로 300개 포르말린 고정 파리핀 포매(formalin-fixed paraffin-embedded, FFPE) 조직 표본으로부터 4,214개의 단백질을 정량화한 연구를 진행했다 [48]. 이 연구는 유방암의 복잡한 이질성을 단백질 수준에서 분석함으로써 임상적으로 활용가능한 새로운 바이오마커를 제시했다는 점에서 의미가 있다. 또한 ‘Meimei 연구팀’은 새로운 잠재적인 혈장 바이오마커를 탐색하기 위해 액체 크로마토그래피(liquid chromatography)와 탠덤 질량 분석법(tandem mass spectrometry) 기반의 단백질체학 연구를 통해 루미날 A (luminal A) 유방암의 조기 진단 바이오마커 3개를 식별했다 [49]. 한편, 유전적 변이는 약물 대사와 치료 결과에 중대한 영향을 미치기에 약물유전체학 연구에서 중요한 영역으로 자리 잡고 있다. 예를 들어, 단일 뉴클레오티드 변이(single nucleotide polymorphism, SNP)는 약물동태학 (pharmacokinetics, PK) 및 약물동력학(pharmacodynamics, PD)에 관여하는 단백질의 활성과 발현에 큰 영향을 미치기도 한다 [50]. 예를 들어, CYP2D6 다형성(polymorphism)은 에스트로겐 수용체 양성 유방암 치료제인 타목시펜(tamoxifen)의 대사에 영향을 미치는데, CYP2D6의 효소 활성이 감소된 환자는 타목시펜에 대한 반응률이 낮아지고 재발 위험이 증가할 수 있다 [51]. 약물유전체학은 궁극적으로 특정 환자의 SNP 및 기타 유전자 변이를 식별하고, 선택한 약물의 표적을 결정함으로써 임상 환경에서 약물의 효능과 안전성을 개선하는 것을 목표로 하고 있다 [52].
2.1.3. 폐암(Lung Cancer)
폐암은 유전적 요인과 환경적 요인이 복합적으로 작용하는 다인성 질병(complex disease)으로, 최근 암의 분자 기작 및 임상 연구의 발전으로 진단과 치료가 크게 향상되었다 [53]. 특히 유전체학, 전사체학, 단백질체학, 대사체학 등의 오믹스 접근법은 폐암의 분자적 기작을 이해하고 새로운 바이오마커와 치료 표적을 식별하는 데 유용한 도구로 부상하고 있다.
유전체학의 발전으로 체세포 돌연변이, 융합 유전자, 염색체 재배열 등을 식별할 수 있게 되었으며, 발암성 변이를 유발하는 드라이버 돌연변이의 확인은 암 환자를 위한 표적 치료법 개발을 촉진했다. 이러한 유전자 변이는 폐암에서 흔히 발생하며 종양 발생과 진행에 기여하는데, 폐암에서 확인된 다양한 유전적 돌연변이 중 EGFR, KRAS, TP53의 돌연변이가 대표적이다. 특히, EGFR 돌연변이는 비소세포폐암(non-small cell lung cancer, NSCLC)의 특정 아형과 연관되어 있으며, EGFR 티로신 키나제 억제제(tyrosine kinase inhibitors, TKIs)와 같은 표적 치료제로 치료가 가능하다 [54]. 반면, KRAS와 TP53 돌연변이는 보다 공격적인(more aggressive) 형태의 NSCLC와 관련이 있으며, 표적 치료에 대한 반응성이 낮은 것으로 알려져 있다. 폐암 종양의 유전적 구성을 이해하는 것은 치료 전략을 결정하는 데 중요한 정보를 제공하며, 환자의 치료 결과를 개선하는 데 기여할 수 있다. 예를 들어, EGFR 돌연변이를 가진 환자는 TKIs를 통해 더 나은 치료 반응을 보일 가능성이 높지만, KRAS 또는 TP53 돌연변이를 가진 환자에게는 보다 정교한 치료 접근법이 필요하다. 이러한 유전체 분석은 개인 맞춤형 치료를 가능하게 하며, 폐암 관리의 새로운 방향을 제시하고 있다. 순환 종양 DNA (circulating tumor DNA, ctDNA)는 세포 사멸(apoptosis) 또는 괴사(necrosis)를 겪는 암세포에 의해 혈류로 방출되는 조각난 DNA로서, 폐암의 진단 및 모니터링을 위한 유망한 바이오마커로 떠오르고 있다. 실제로, 액체생검(liquid biopsy)을 이용한 ctDNA 분석은 비침습적으로 질병 진행을 추적하고 표적 치료 선택에 도움을 준다. 비소세포폐암 환자에서 EGFR 돌연변이와 ALK 재배열과 같은 유전적 변화를 식별하는 데 있어 ctDNA의 잠재력을 입증했으며, 이를 통해 표적 치료 선택을 안내하고 환자 결과를 개선할 수 있음을 보여주었다 [55].
폐암의 진단 및 모니터링 가능성 외에도 ctDNA는 치료 반응 예측 및 질병 재발 예측에서도 유망한 가능성을 보였다. 연구에 따르면, 치료 후 ctDNA 수준이 감소한 환자는 긍정적인 치료 반응을 보일 가능성이 더 높은 것으로 나타났다 [56]. 또한 ctDNA 분석은 최소 잔존 질환(minimal residual disease, MRD)을 탐지할 가능성도 가지고 있는데, MRD는 치료 후에도 몸에 남아 질병 재발을 일으킬 수 있는 소량의 암세포를 의미한다 [57]. 시간이 지남에 따라 ctDNA 수준을 모니터링함으로써, 임상의는 재발 위험이 높은 환자를 식별하고 이에 따라 치료를 조정할 수 있어 환자 결과를 개선할 가능성을 보여주었다. 단백질체학은 혈장 및 조직을 기반으로 하여 폐암 바이오마커의 발견과 검증을 위한 유망한 도구로 떠오르고 주목을 받고 있다. 혈장 단백질체학은 순환 단백질(circulating proteins) 분석을 통해 폐암 관련 병리학적 변화를 밝혀내는 데 기여하는 반면, 조직 단백질체학은 폐암의 발생 및 진행에 관여하는 분자적 메커니즘에 대한 통찰을 제공하고 있다. 다수의 연구에서 혈장 및 조직 단백질체 바이오마커가 폐암의 진단, 예후, 치료 모니터링에 있어 잠재력을 가지고 있음을 입증했다 [58]. 예를 들어, 2019년 발표된 ‘Chen 연구팀’의 연구에서는 높은 민감도와 특이도로 폐암 환자와 건강한 대조군을 구별할 수 있는 혈장 단백질 패널을 확인했으며, ‘Tang 연구팀’은 폐암의 예후 및 치료 반응과 연관된 조직 단백질체 바이오마커를 발견했다 [59-60]. 폐암 치료에서 약물유전체학은 환자의 유전적 특성에 따라 특정 치료에 대한 반응이 없거나 부작용을 경험할 가능성이 높은 환자를 식별하는 데 도움을 줄 수 있다. 특히, NSCLC 환자에서 EGFR 및 ALK 유전자 변이는 표적 치료의 예측 바이오마커로 잘 알려져 있는데, 이러한 바이오마커는 치료 반응성을 예측하고, 불필요한 치료를 피하며, 효율적인 치료 전략을 수립하는데 기여하고 있다 [61].
2.1.4. 전립선암(Prostate Cancer)
전립선암은 폐암에 이어 남성에게 두 번째로 흔히 발생하는 악성 종양으로, 전 세계 사망률을 높이는 주요 요인 중 하나로 꼽히고 있다. 과학적으로 입증된 위험 요인으로는 고령, 인종, 유전, 가족력뿐만 아니라 비만, 신체활동 부족 등 다양한 건강 상태가 원인으로 작용한다 [62]. 특히 일반적으로 초기에는 증상이 없기 때문에 현재 사용되고 있는 진단법으로는 종종 오진이나 과잉 진단을 초래하여 부적절한 치료로 이어지는 경우가 많다 [63]. 따라서 효과적인 바이오마커와 진단기술이 임상 현장에서 전립선암 환자를 더 잘 관리하기 위해 절실히 요구되고 있으며, 다중 오믹스 데이터의 사용으로 진단 및 예후 평가뿐만 아니라 치료 계획에도 적용하여 개인 맞춤형 정밀의학으로의 적용을 시도하고 있다.
대다수의 원발성 및 전이성 전립선암 환자들은 AR, WNT, PI3K-PTEN과 같은 체세포 유전자(somatic gens) 및 세포 주기 신호 전달과 DNA 복구 경로에서의 돌연변이와 연관되어 있다. 전이성 거세저항성 전립선암(metastatic castration-resistant, mCRPC)과 전립선암 간의 연관성을 조사하기 위해 대규모 유전체 연구가 진행되었으며, 이는 유전자 돌연변이, 유전자 융합, DNA 복제 수 변이 및 유전자 재배열과 관련이 있는 것으로 나타났다 [64]. 세포유리 DNA (cell free DNA, cfDNA)는 전립선암 환자가 건강한 사람에 비해 더 많은 수의 긴 cfDNA 조각을 가지고 있으며, 이는 질병의 진행 단계와 심각도에 따라 증가한다는 사실이 밝혀졌다 [65]. 따라서 전립선암에서 cfDNA를 활용하여 종양의 이질성과 치료 저항성을 동적으로 모니터링할 수 있음이 강조되고 있다. 전립선암의 진행은 전사체학 연구를 통해 mRNA 수준의 변화로 예측할 수 있으며, 이를 통해 정상 상태와 전이 상태 간의 차이를 구별할 수 있게 되었다. 전립선암 진행과 관련된 9개의 단계별 후보 유전자로는 GSTP1, TP63, MYC, CENPA, EZH2, PIK3CB, HEATR5B, DDC 및 GABPB1-AS1이 포함된다 [66]. 최근 연구에 따르면, 단백질체 분석에서 나타나는 변화 중 단지 10~20%만이 전사체 변화에 기인한다고 보고되었는데, 단백질체학은 세포의 기능적 상태를 즉각적으로 분석하고, 치료 가능성이 높은 생물학적 구성 요소의 변화를 밝혀내는 데 유용하기 때문에 전립선암 바이오마커 연구에 널리 활용되고 있다 [67]. 조직을 바탕으로 한 유전체 데이터와 단백질체 데이터를 통합하면 바이오마커를 발견하고 잠재적인 치료 표적을 식별할 수 있으며, in situ 병리학(histopathology)을 통해 암의 발생 및 진행의 유전적 기초를 더 깊이 연구할 수 있다. 전립선암의 단백질 바이오마커로 UBE2N, Ser/Thr-단백질 인산화효소 PP1β (ser/tre-protein phosphatase PP1, PPP1CB) 및 PSMB6과 같은 여러 단백질이 연구되었으며, 특히 SMAR-CA4 결실은 특정 안드로겐 수용체(androgen receptor, AR) 유전자의 염색질 접근성과 유전자 조절에 영향을 미치며, 거세저항성 전립선암의 발달과 확산에도 중요한 역할을 하는 것으로 보고되었다 [68-69]. 전립선암 조직과 정상 조직 간의 단백질체 비교는 발암 과정에 대한 통찰을 제공하는데, 서로 다른 조직학적 패턴을 가진 전립선 조직을 분석함으로써 개인 간 차이를 배제할 수 있으며, 연구 결과 전립선암 종양 기질(tumor stroma)은 정상 기질보다 칼슘 결합 단백질, 세포 간 기질(interstitial) 단백질 및 평활근 수축 관련 단백질이 더 많이 포함되어 있는 것으로 나타났다 [70]. 더불어 전립선특이항원(prostate specific antigen, PSA)은 전립선암 진단에서 가장 널리 사용되는 바이오마커로 초기 발견에 기여하지만, 과잉 진단 및 과잉 치료의 주요 원인으로 지적되기도 한다 [71].
2.2. 암 외 질병에 대한 오믹스의 응용(Application of Omics in Other Human Diseases)
현재 의료 시스템은 질병을 예방하기보다는 질병이 발병한 후 이를 치료하는 데 중점을 두고 있기에 만성 질환 및 후기 단계 질환의 치료에 높은 비용을 초래하고 있다. 또한, 일반적으로 행해지고 있는 "일률적(one-size-fits-all)" 접근법은 유전적 배경, 환경 및 생활습관과 같은 개인 차이를 고려하지 않기 때문에 혜택을 받을 수 있는 사람의 수가 제한된다. 오믹스 기술은 RNA나 대사체와 같은 다양한 생물학적 분자의 포괄적인 평가를 가능하게 하기에, 건강과 질병에서 분자적 복잡성을 이해하는 데 혁신적인 기여를 하고 있다 [72]. 암의 유전자 분석과 같은 개별 오믹스 접근법은 임상 환경에서 점차적으로 사용되고 있으며, 질병 진단과 바이오마커 식별을 통해 질병 추적이나 효과적인 치료법 추천을 용이하게 하고 있다. 복잡한 질병은 종종 시간이 지남에 따라 점진적으로 발생하며 개인 간 이질성이 크기 때문에, 다중 오믹스를 활용한 종단 샘플링(longitudinal sampling)과 통합 분석은 건강에서 질병으로의 경로를 심층적으로 이해하고 조기 또는 더 효과적인 중재를 위한 정밀건강(precision health) 접근법을 가능하게 하고 있다. 정밀건강은 개인의 유전적 배경, 환경, 생활습관 등을 종합적으로 고려하여 질병을 예측하고 예방하며 치료하는 것을 목표로 한다. 이는 기존의 일률적이고 반응적인 접근법에서 벗어나 개인화된 의료로 전환하는 것을 의미한다. 또한, 환자의 세부 아형에 기반하여 보다 효과적인 치료를 가능하게 함으로써 의료 서비스의 효율성과 품질을 향상시킬 수 있다.
2.2.1. 감염성 질환(Infectious Diseases)
오믹스 기술의 발전은 COVID-19와 관련된 생물학적 및 임상적 문제를 해결하는 데 중요한 역할을 했다. 예를 들어, 유전체 시퀀싱(genome sequencing)은 눈에 보이지 않는 중증급성호흡기증후군 코로나바이러스 2(severe acute respiratory syndrome coronavirus 2, SARS-CoV-2)를 식별하는 데 중요한 역할을 했다. 특히 SARS-CoV-2 바이러스 감염과 백신 반응에 대한 세포 반응을 분석하는 데 있어 대량 및 단일 세포 다중 오믹스가 핵심적인 도구로 활용되었다. ‘Bernardes 연구팀’은 COVID-19 환자의 말초 혈액 단핵세포(peripheral blood mononuclear cells, PBMC)를 대상으로 종단적 다중 오믹스 분석을 수행하여 질병 경과와 관련된 세포적 특징을 규명했다 [73]. 인터페론 활성화 순환 거핵세포와 적혈구 생성 증가가 중증 질환과 일치했으며, 거핵세포 및 적혈구 유래 공동 발현 모듈은 치명적 질병 결과를 예측하였다. 이러한 다중 오믹스 접근법은 면역 세포의 표현형 분석을 넘어 SARS-CoV-2 감염이 후성유전학적(epigenetic) 및 전사 수준에서 미치는 광범위한 세포 효과를 보여줌으로써, COVID-19 환자를 위한 바이오마커 개발과 정밀 치료 설계에 대한 통찰을 제공하기도 했다. 유사한 연구로써, ‘Sacco 연구팀’은 소아 COVID-19와 소아 다기관 염증 증후군(multisystem inflammatory syndrome in children, MIS-C) 간의 면역병리학적 특징을 식별하기 위해 용해성 바이오마커 분석, 프로테오믹스, 단일 세포 유전자 발현 및 면역 레퍼토리 분석을 포함하는 종단적 다중 오믹스를 적용했다 [74]. 소아 COVID-19는 강력한 1형 인터페론(interferon, IFN) 반응이 특징인 반면, MIS-C에서는 순환 스파이크 단백질 증가, 매트리솜 활성화(matrisome activation) 및 2형 IFN 또는 NF-kB 의존적 특징이 두드러지게 나타났다. 또한 다른 연구에서는 인간의 폐를 대상으로 단일 세포 다중 오믹스 프로파일링(integrated single-cell multi-omics profiling)을 통해, 19개 세포 유형에서 심각한 COVID-19와 관련된 1,000개 이상의 위험 유전자를 발견하고 검증했다 [75]. 심각한 COVID-19의 유전적 위험은 자연 살해(natural killer, NK) 세포에서 특히 풍부하게 나타났으며, 더 나아가 “Ref-Map”이라는 머신러닝 알고리즘을 통해 GWAS 및 단일 세포 오믹스를 기반으로 비고령 환자의 심각한 질병 유무를 민감하게 예측할 수 있도록 했다.
다중 오믹스는 또한 백신 개발을 가속화하고 있으며, 백신 접종 동안 발생하는 복잡한 면역 반응의 글로벌 맵을 구축 하여 백신 효능과 관련된 세포 및 분자 지표를 식별하는 데 도움을 주고 있는데, MS 기반 단백질체학은 빠른 처리 속도와 높은 처리량으로 COVID-19 감염 분류자를 밝혀내는 데 중요한 역할을 하고 있다. 최근 ‘Messner 연구팀’은 초고속 혈청 및 혈장 단백질체학을 위한 저비용 플랫폼을 개발했으며, 이 플랫폼은 역학 연구에서 27개의 잠재적 마커를 식별하여 COVID-19의 중증도를 평가할 수 있었다. 이러한 플랫폼은 COVID-19 팬데믹과 같이 신속한 대응이 필요한 상황에서 MS 기반 대규모 단백질체학이 임상 의사결정을 지원할 수 있는 강력한 도구임을 보여주었다 [76].
일부 COVID-19 환자들은 초기 증상이 사라진 후에도 전신에 걸쳐 장기적으로 지속되는 “장기 코로나 증상(long-term COVID syndromes)”을 경험하며, 질병에 걸리기 전과 같은 정상적인 삶을 사는데 어려움을 느끼고 있다 [77]. 이러한 장기 코로나는 사회 및 인구학적, 임상적 요인(예를 들면 감염 이전 정신 건강 상태에 따라)과 연관이 있기 때문에, 오믹스 기반 연구들을 통해 장기 코로나의 기저 메커니즘을 규명하고자 하는 노력들이 진행되고 있다. 2022년 보고된 ‘Su 연구팀’의 연구는 300명 이상의 환자를 대상으로 한 “종단적 다중 오믹스 연구”에서, 장기 코로나의 위험 요인으로 제2형 당뇨병(type 2 diabetes), 잠복성 앱스타인-바 바이러스(latent Ep-stein-Barr virus, EBV) 재활성화, 순환 SARS-CoV-2 RNA 조각, 특정 자가항체(specific autoantibody) 등을 확인했다 [78]. 특히 급성 질환 중 CMV 특이적 T세포의 비특이적 활성화가 장기 코로나와 연관되어 있다는 것을 보고하였다. 또한 ‘Vijayakumar 연구팀’은 유세포 분석(flow cytometry)과 단백질체학 분석을 통해 장기 코로나 환자의 기도(airways)에서 조직 손상 및 복구와 관련된 단백질의 수준이 증가하고, CD8+ T세포의 지속적인 활성화가 관찰된다고 보고했다 [79]. 더불어 다른 연구에서는 단일세포 전사체 분석(single-cell transcriptomic analysis)과 CT 영상 분석을 통해 폐 기능 손상과 관련된 면역세포 아형을 식별하였다. 더불어 장기적인 임상 결과를 평가한 연구에서는 심장-신장 염증(cardio-renal inflammation), 폐 침범(lung involvement), 지혈 경로 활성화(hemostatic pathway activation) 및 정신 건강 기능(psychological function)이 COVID-19 이후 장기 증후군으로 발전할 수 있는 “질병 증거(evidence of disease)”가 될 수 있음을 보여주었다 [80].
2.2.2. 염증성 장 질환(Inflammatory Bowel Diseases, IBD)
다중 오믹스 기술은 2000년대 중반부터 장염성(intestinal inflammation) 질환 연구에서 주목받기 시작했으며, 최근 대규모 코호트 연구와 인공지능(artificial intelligence, AI) 기반 분석 기술의 융합으로 임상적으로 유의미한 성과를 도출하고 있다 [81]. 또한 IBD의 다중 오믹스 연구를 위한 글로벌 워킹 그룹을 구성하려는 노력이 진행되고 있다. 그 대표적인 예가 1000IBD 프로젝트로, 다양한 IBD 환자들을 모집하여 환경오믹스(exposome), 유전체, 전사체(transcriptome), 메타유전체(metagenome), 약물 반응(drug response) 등 여러 오믹스 데이터를 수집하고 추적 관찰한다 [82]. 1000IBD 프로젝트는 장 염증이 장 유전자 발현에 미치는 영향, 식이 패턴과 장내 미생물군 (gut microbiota)의 특정 특성 간의 연관성, 약물이 장내 미생물군의 구성과 기능에 미치는 영향, IBD 발병과 관련된 환경 요인 등 다양한 주제에 관한 논문을 발표하고 있으며, 다중 오믹스 데이터의 활용 가능성을 검토한 리뷰와 IBD 병태생리학(pathophysiology)의 여러 측면을 다룬 연구도 진행하고 있다. 이와 유사한 또 다른 주요 이니셔티브로는 “ImmUniverse 컨소시엄”이 있는데, 이 유럽 기반 프로젝트는 IBD를 포함한 면역 매개 염증성 질환(immune-mediated in-flammatory diseases, IMID)에 대해 개인 맞춤형 의학(personalized medicine)을 구현하기 위해 다중 오믹스를 통합적으로 활용하려는 목표를 가지고 있다 [83].
IBD 중, 다중 오믹스의 적용으로 궤양성 대장염(ulcerative colitis, UC)과 크론병(Crohn’s dis-ease, CD)의 기초(basic), 중개(translational) 및 임상적 요소를 발견하는 데 도움이 될 수 있다는 연구가 지속적으로 발표되고 있다. UC와 CD 환자 평가에 사용되는 C반응성 단백질(C-reactive protein, CRP)과 대변 칼프로텍틴(fecal calprotectin)은 염증 정도를 반영할 뿐 특정 질병에 특이적이지 않기에 실제 질병 바이오마커라고 보기 어렵다 [84]. 또한 “Study of a Prospective Adult Research Cohort (SPARC)”에서는 IBD 환자 수백 명의 유전체학, 장 생검 샘플을 바탕으로 한 전사체학, 혈장을 사용한 단백질체학을 통합하여 UC와 CD를 구분하는 머신러닝 모델을 개발하였으며, 이를 통해 UC와 CD를 구별할 수 있는 잠재적인 바이오마커를 발견하였다 [85]. 여러 연구가 진행 중이지만, 아직까지 UC와 CD를 명확하게 구분할 수 있는 결정적인 바이오마커는 발견되지 않고 있다 [86]. 궁극적인 목표인 정밀의료 구현을 위해, 다중 오믹스를 활용한 바이오마커 발견을 하고자 “유럽 크론병 및 대장염 기구(European Crohn’s & colitis organ-ization, ECCO)” 등에서 활발한 노력이 진행되고 있다 [87].
2.2.3. 노화(Aging)
노화는 DNA 돌연변이, 후성유전학적 변화(epigenetic alterations), 비정상적인 단백질 응집, 자가포식 장애(autophagy disturbances), 면역 손상(immune impairment), 미토콘드리아 기능 장애(mitochondrial dysfunction), 텔로미어 짧아짐(telomere shortening) 등 다양한 분자적 변화로 특징지어지는 시간 의존적인(time-dependent) 생리적 과정이다 [88]. 이러한 변화는 세포의 정상적인 기능을 저하시킴으로써 노화 관련 질병 발병에 기여하며, 특히 많은 만성 질환의 가장 큰 위험 요인일 뿐만 아니라 기능 저하의 주요 원인이기 때문에, 개개인의 노화 속도를 측정할 수 있는 방법 개발이 요구되고 있다. 종단적 다중 오믹스 프로파일링은 노화 과정에서 발생하는 분자적 변화를 규명하는데 활용되고 있다. 또한 새로운 마커뿐만 아니라 인슐린 저항성(insulin-resistant) 및 인슐린 민감성(insulin-sensitive)을 가진 개인 간의 독특한 노화 분자 패턴을 식별했다 [89]. 즉, 각 개인에서 시간에 따라 변화하는 분자 경로는 서로 다른 연령형(ageotype)을 반영하며, 이는 궁극적으로 노화 과정을 모니터링하고 적절한 조치를 취하는 데 유용할 수 있다. 이와 유사한 연구로, ‘Nie 연구팀’은 임상 검사, 면역 레퍼토리(immune repertoire), 타깃 대사체학(targeted metabolomics), 장내 미생물군(gut microbiome), 신체 적합성 검사, 얼굴 피부 검사 등의 다중 오믹스 데이터를 활용하여 생물학적 나이를 추정하고 노화의 다양성을 확인했다 [90]. 이 연구는 연구 대상자들 간에 서로 다른 노화 패턴이 존재함을 밝혔으며, 노화의 영향을 줄이기 위해 정밀한 조치가 필요할 수 있음을 시사했다. 또한, 다른 연구에서는 다중 오믹스 분석을 통해 섬유아세포(fibroblast)를 유도 만능 줄기세포(induced pluripotent stem cells, iPSC)로 재프로그래밍하는 과정에서의 변동성을 확인하고 이를 연령형과 연결했다 [91]. 이 접근법은 나이 든 쥐에서 유래한 섬유아세포 배양물이 염증성 사이토카인(inflammatory cytokines)을 분비하는 "활성화된 섬유아세포(activated fibroblasts)"를 포함하고 있고, 각 세포 배양물에서 활성화된 섬유아세포의 비율이 재프로그래밍 효율성과 상관관계가 있음을 밝혔다. 이러한 결과를 바탕으로 iPSC 세포 생성 및 고령자의 상처 치유를 개선하기 위한 맞춤형 전략 개발에 도움을 줄 수 있다고 보고했다. 궁극적으로 다중 오믹스 통합 응용을 통해 노화와 밀접하게 관련된 분자들이 발견되었는데, 예를 들어 전사인자(transcription factor) E2F4, TEAD1 및 AP-1은 전사체와 후성유전체 데이터를 통합하여 노화를 조절하는 주요 인자로 확인되었다 [92]. ‘Song 연구팀’은 ATAC-seq, RNA-seq 및 ChIP-seq 데이터를 통합한 다중 오믹스 분석을 통해 NAT1, PBX1 및 RRM2가 노화 및 노화 관련 질병의 잠재적 바이오마커라는 가능성을 제시했다 [93]. 노화와 관련된 빅데이터 연구를 촉진하기 위해 “Aging Atlas”와 같은 다중 오믹스 데이터베이스가 구축되었는데, 이 데이터베이스는 나이에 따른 유전자, RNA, 단백질의 발현 변화를 탐구하는데 도움을 준다 [94]. 또한 “AgingBank”는 다양한 생물 종에 걸친 실험적으로 검증된 다중 오믹스 데이터를 제공함으로써 노화 연구를 돕는 분석 플랫폼이다 [95].
3. 결론
다중 오믹스를 활용한 정밀의료는 유전체학, 전사체학, 프로테오믹스 및 대사체학 분야의 지속적인 기술 발전에 의해 진행되고 있다. 예를 들어, 롱리드 시퀀싱 (long-read sequencing)은 텔로미어-투-텔로미어(Telomere-to-Telomere, T2T) 시퀀싱 방법을 통해 인간 유전체를 완전히 해독하여 유전적 변이와 병원성 변이를 탐지하는데 중요한 도구로 자리 잡았다 [96]. 더불어, 2010년 시작된 인간 단백체 기구(the human proteome organization, HUPO)의 “인간 단백체 프로젝트(human proteome project)”는 단백질의 기능 해석(annotation)과 조직 특이적 단백질 식별에 큰 진전을 이루었다 [97]. HUPO의 일환으로 수행된 연구에서는 32개의 정상 인간 조직에서 12,000개 이상의 유전자에서 유래한 상대적 단백질 수준을 정량화하고, 조직 특이적 및 조직-강화형 단백질(tissue-specific and tissue-enriched proteins)을 식별하여 이를 전사체 데이터와 비교했다 [98]. 이를 통해 RNA와 단백질 수준 간의 불일치는 단백질 합성과 분비 단백질의 작용 부위를 나타낼 수 있는 잠재적인 위치임을 밝혀냈다. 특히, 본 연구는 단백질 조직-강화 정보가 전사체 정보만으로는 설명할 수 없는 유전 질환의 표현형을 설명할 수 있음을 입증했으며, 단백질 수준 패턴을 이해함으로써 유전자 조절(gene regulation), 분비단백체(secretome), 대사 및 질병에 대한 통찰을 제공할 수 있음을 보여주었다. 또한, 인간 대사체 프로젝트(human metabolome pro-ject)에 의해 생성된 인간 대사체 데이터베이스(human metabolome database, HMDB)는 인간 신체에서 발견되는 소분자 대사물(small molecule metabolites)에 대한 상세한 정보를 정리함으로써, 대사체학 연구를 위한 최신 참조 데이터베이스로 활용되고 있으며, 이러한 데이터베이스는 대사 경로와 질병 간의 연결성을 연구하는 데 중요한 자원을 제공하고 있다 [99].
하지만 다중 오믹스 데이터는 서로 다른 정밀도 수준을 가지고 있는 이질적인 데이터셋 특성으로 인해, 결과를 통합하고 해석하기 위한 엄격한 통계 도구가 요구된다 [100]. 또한 다중 모달(multimodal) 데이터이기에 복잡성과 테라바이트 사이즈를 초과하는 방대한 규모는, 강력한 데이터 관리 시스템을 필요로 한다 [101]. 이를 해결하기 위해 머신러닝 또는 딥러닝(deep learn-ing) 기반의 방법이 다중 오믹스 데이터를 통합하는 데 적용되고 있으며, 이를 바탕으로 시스템 생물학(systems biology)의 복잡한 작동 원리를 밝혀내는 시도들을 하고 있다. 머신러닝은 빅데이터와 데이터 마이닝(data mining)을 기반으로 한 “정밀의료의 완성”이라는 측면에서 점점 더 중요한 역할을 하고 있으며, 이러한 기술은 질병의 분자적 원인을 식별할 수 있는 새로운 오믹스 바이오마커(biomarker)를 발견하는 데 기여하고 있다 [102].
다중 오믹스 데이터는 정밀의료의 핵심 요소로 자리 잡을 것이다. 특히 딥러닝, 인공지능, 클라우드 컴퓨팅 시스템(cloud computing systems)의 통합은 오믹스 데이터뿐만 아니라 영상, 임상, 웨어러블 기기 및 역학 데이터를 분석하고, 해석하며, 시각화하는 데 필수적인 역할을 할 것이다. 이러한 기술 발전은 궁극적으로 “자동화된 실시간 플랫폼”으로 거듭나는 과정을 통해, 질병 진단, 치료 전략 수립 및 예후 평가를 지원하는 “정밀의료의 강력한 도구”로 자리 잡을 것이다.
4. 참고문헌
==>첨부파일(PDF) 참조
본 게시물의 무단 복제 및 배포를 금하며, 일부 내용 인용시 출처를 밝혀야 합니다.
자료열람안내
본 내용은 BRIC에서 추가적인 검증과정을 거친 정보가 아님을 밝힙니다.
내용 중 잘못된 사실 전달 또는 오역 등이 있을 시 BRIC으로 연락(view@ibric.org) 바랍니다.