[DEBUG-WINDOW 처리영역 보기]
즐겨찾기  |  뉴스레터  |  오늘의 정보 회원가입   로그인
BRIC홈 동향
스폰서배너광고 안내  배너1 배너2
전체보기 뉴스 Bio통신원 Bio통계 BRIC이만난사람들 웹진(BioWave)
BRIC View
최신자료 동향리포트 학회참관기 리뷰논문요약 BRIC리포트 외부보고서
희귀유전질환 관련 유전자 변이의 데이터베이스화 동향
희귀유전질환 관련 유전자 변이의 데이터베이스화 동향 저자 권민석 (하버드 의과대학)
등록일 2019.04.11
자료번호 BRIC VIEW 2019-T11
조회 903  인쇄하기 주소복사 트위터 공유 페이스북 공유 
요약문
칩과 시퀀싱에 기반한 유전체 분석기술의 발전으로 개인의 유전체 분석이 저렴한 비용으로 빠른 시간 내에 가능하게 됨으로써 개개인의 유전적 정보에 기반한 맞춤 의학(Personalized Medicine) 혹은 정밀 의학(Precision Medicine)이 점차 실현화 단계에 이르게 되었다. 특히 이러한 기술의 발전은 희귀유전질환의 연구에 큰 영향을 주어 희귀유전질환의 진단 및 치료법 개발의 성공사례가 점차 증가하고 있는 추세다. 희귀유전질환은 낮은 유병률로 인해 일반적 질환과 달리 데이터베이스를 통한 정보의 축적, 국가 혹은 국제 단위의 연구 협력 네트워크 구축, 이를 통한 관련 연구기관의 협업이 필수적이다. 이러한 요구에 부합하기 위해 유럽과 미국뿐만 아니라 국내에서도 다양한 형태의 희귀유전질환 관련 데이터베이스들을 개발하고 있으며, 지속적으로 갱신하고, 전문가 네트워크의 검증을 통해 자료의 신뢰성 확보를 위한 노력을 기울이고 있다. 희귀유전질환 데이터베이스에 신뢰성 있는 정보가 축적되고, 이를 통한 조기 진단과 빠른 치료법의 개발이 함께 이루어져 희귀유전질환 환자의 생존율과 삶의 질을 높일 수 있게 되기를 기대한다.
키워드: Rare (orphan) disease, Variant-phenotype database, Precision medicine, Personalized medicine, Clinical genomics
분야: Genomics, Bioinformatics
목차

1. 서론
2. 본론
  2.1 희귀유전질환의 정의
  2.2 희귀유전질환 데이터베이스의 필요성 및 필요 요소
  2.3 희귀질환 관련 기관 및 단체와 희귀질환 데이터베이스 현황
  2.4 질환명 데이터베이스
  2.5 희귀유전질환 데이터베이스 현황
3. 결론
4. 맺는 말
5. 참고문헌


1. 서론

매해 2월 마지막 날은 유럽 희귀질환환자연맹(EURORDIS)의 주도로 세계희귀질환의 날(International Rare Disease Day)로 지정되어 기념을 하고 있다. 올해(2019년)에도 2월 28일에 한국, 미국, 영국 등 주요 선진국을 포함한 세계 88개국이 참가하여 366개의 학술회의, 사진전 등 각종 모임 및 이벤트 등이 계획되어 있다. 이 날의 목적은 일반 대중들 사이에서 희귀 질병에 대한 인식을 변화시키고, 관심을 유도하며, 지식을 향상시키는 동시에 연구자들과 정책 의사 결정권자들에게 희귀 질병에 걸린 환자들의 요구를 해결하도록 장려하는데 있다 [1].

이처럼 희귀질환이 점차 전 세계적인 관심이 증폭되고 있는 이유는 개별 희귀질환의 발병환자 수는 매우 적으나 희귀질환을 앓고 있는 전 세계 환자의 수는 약 3억 5천만 명에 이를 정도로 많기 때문이다 [2]. 특히, 최근 차세대 시퀀싱 기술(Next Generation Sequencing technology, NGS)이라 불리며 각광을 받고 있는 HTS 기술(High Throughput Sequencing technology)의 발전과 이를 기술적으로 뒷받침해 줄 수 있는 고성능 컴퓨터를 통한 서열 정렬(alignment) 알고리즘의 발전으로 개인의 유전자 염기서열의 분석 비용과 시간이 급속히 감소함에 따라 개인의 맞춤형 의학(Personalized medicine)과 정밀의학(Precision medicine)이 현실화되어 가면서, 이와 함께 희귀유전질환의 진단 및 치료법 개발이 가능해지고, 성공 사례들이 점차 늘어가고 있는 추세이다.

본 보고서에서는 희귀유전질환의 연구에 필수적인 희귀유전질환 관련 유전자 변이 데이터베이스의 동향에 대해 살펴보고자 한다.

2. 본론

2.1 희귀유전질환의 정의

희귀질환(rare 또는 orphan disease)은 미국의 경우 유병인구 200,000명 미만이거나 인구 1,500명당 1명, 유럽의 경우 인구 2,000명당 1명 미만, 일본의 경우 유병인구 50,000명 미만이거나 인구 2,500명당 1명으로 발병하는 질환으로 정의를 하지만, 정확히 세계적인 합의가 이루어진 정의는 아직 없다. 물론 경우에 따라 말라리아와 같이 북유럽에서는 희귀질환이지만, 아프리카와 같은 지역에서는 흔한 질환인 경우도 있을 수 있다. 전 세계적으로 희귀질환의 수는 대략 6,000~8,000개가 될 것으로 추정하고 있으나 정확한 수는 알려져 있지 않다. 다만, 희귀질환 포털인 Orphanet에 등록된 희귀질환은 2017년 기준 9,408개이며 이들 중 3,739개 질환에 대해 3,898개의 유전자가 보고되어 있다(실제 등록된 질환명은 상위개념, 하위개념으로 구분되어 있어 중복된 자료들을 포함하고 있다.) [3]. 이와 같이 다양한 종류의 희귀질환으로 전 세계적으로 약 3억 5천만 명의 환자가 고통을 받고 있다고 알려져 있다 [2]. 우리나라에서는 질병관리본부에서 조사된 107종 희귀질환의 경우 48만여 명의 환자가 있을 것으로 추정하고 있다 [4].

희귀유전질환이란 희귀질환 중에 그 원인이 유전변이에 의해 발병하는 질환을 말한다. 대부분의 희귀질환이 유전적 원인에 의해 발생하는 것으로 여겨지고 있으나, 정확한 수나 비율은 조사된 바가 없다.

2.2 희귀유전질환 데이터베이스의 필요성 및 필요 요소

희귀유전질환은 그 발병빈도가 희귀하여 발병원인이 되는 유전변이뿐만 아니라 진단 및 치료방법 또한 알려지지 않은 경우가 많아 기초적인 유전 연구 및 역학연구가 필요한 질환이 대부분이다. 그러나 낮은 유병률로 인해 각 개별 희귀질환의 연구를 개인 및 단일 연구그룹에 맡기기에는 역부족인 측면이 많다. 따라서 국가 및 국제 차원의 연구 네트워크를 구축하고, 국제적인 공조를 통한 발병 사례, 증상, 유전변이 등 자료의 축적이 필요하며, 이를 기반으로 하는 자료의 데이터베이스화를 통해 희귀질환연구자 및 환자에게 제공하는 것이 필요하다. 특히 희귀유전질환의 유전변이 정보는 진단뿐만 아니라 치료기술 개발에 핵심적인 정보를 제공하기에, 이를 통해 환자들의 신속, 정확한 진단과 보다 나은 치료를 받을 수 있도록 할 수 있다는 점에서 데이터베이스의 필수적인 정보 중 하나이다.

희귀유전질환의 데이터베이스는 그 사용자를 일반인 및 환자로 하느냐 혹은 의사 및 연구자로 하느냐에 따라 구성 정보의 수준의 차이를 보이기도 하지만, 기본적으로 관련 유전변이의 종류와 증상, 치료방법 등의 정보들이 포함되며, 경우에 따라서 지원기관 및 연구기관의 목록도 함께 제공하여 환자와 연구자의 연계를 도울 수도 있다.

희귀유전질환 데이터베이스는 기술의 발전에 의한 관련 연구가 증가하고 있기 때문에 지속적인 자료의 갱신과 전문가 그룹에 의한 자료 정확도의 평가가 필수적이다. 따라서 단순 구축에 끝나는 단기 프로젝트가 아닌 주기적인 관리 및 갱신을 지속할 장기간에 걸친 프로젝트로 기획되어야 하며, 정부와 병원, 그리고 연구기관 및 지원단체의 꾸준한 협업이 반드시 필요하다.

2.3 희귀질환 관련 기관 및 단체와 희귀질환 데이터베이스 현황

희귀질환 관련 데이터베이스는 희귀질환 관련 기관 및 단체의 주도로 개발되어 유지되는 경우가 많다. 특히 7,000여 개에 이르는 다양한 질환 종류와 그 증상 때문에 적절한 진단과 치료 시기를 놓치는 경우가 많다. 따라서, 환자의 질병에 대한 이해를 높이고, 빠른 진단과 치료의 적용, 그리고 치료법 개발로 이르게 하기 위해서는 질환 데이터베이스는 필수적이라 할 수 있다. 이 장에서는 전 세계 대표 희귀질환 관련 기관 및 단체와 그 데이터베이스의 특징을 살펴보고자 한다.

(1) 미국 국립희귀질환기구(NORD; National Organization for Rare Disorders)

1982년 희귀 질환 치료법 개발에 대한 재정적 인센티브를 지원하는 것을 골자로 한 희귀질환의 약물에 관한 법률(Orphan drug act)이 미 국회를 통과하여 시행된 후, 이를 주도적으로 이끌었던 희귀질환 환자 지원 단체들이 연합하여 1983년에 NORD로 조직되어, 현재까지 희귀 질환 환자, 치료법 관련 기업, 임상의학자 및 연구자들을 지원하는 기구로 꾸준한 활동을 펼치고 있다. NORD 웹사이트(https://rarediseases.org)에는 약 1300여 개의 희귀질환의 목록을 유지하고 있으며, 지원 기관들과 치료법, 특히 현재 개발되고 있는 치료법 등에 대해 자세한 정보를 포함하고 있다 [5].

(2) 미국 유전병 및 희귀질환정보센터 (Genetic and Rare Diseases Information Center; GARD)

GARD는 미국 국립보건원(NIH)과 미국 국립인간게놈연구소(NHGRI)에서 지원받아 운영되는 센터로써 희귀질환 환자의 지원, 희귀질환 진단 및 치료 지원, 연구자 연결, 연구 및 치료 자금 지원 연결, 희귀 질환에 대한 교육 등을 주된 활동으로 하고 있다 [6]. GARD 사이트 (https://rarediseases.info.nih.gov/)내에 희귀질환의 정보를 서비스하고 있으며, 질환 정보, 유전여부, 진단 및 치료정보뿐만 아니라 환자를 지원하기 위한 지원 기관, 전문가 목록, 질환 관련 컨퍼런스 및 이벤트 일정 등을 제공하고 있다. 또한 각 질환별로 Genetics Home Reference (GHR) [7], The Screening, Technology And Research in Genetics (STAR-G) Project [8], Monarch Initiative [9], New England Consortium of Metabolic Program [10], Online Mendelian Inheritance in Man (OMIM) [11], Orphanet [12], PubMed [13]의 외부 링크를 지원한다.

(3) Global Genes (https://globalgenes.org/)

Global Genes는 희귀유전질환 환자와 그 가족을 위한 국제 비영리단체이다. 이 기구는 희귀유전질환의 의식을 고양하기 위한 공공교육을 제공하고, 소셜 미디어를 통한 지역사회 지원 체계를 구축하며, 치료와 치료법을 찾기 위한 연구 자금 지원 등을 그 임무로 하고 있다. 해당 사이트 내에는 RARE List 라는 7,000개 이상의 희귀질환 목록을 운영하고 있다. GARD 등에서 유전정보를 참고하여 정보를 제공하고 있으며 희귀유전질환 환자나 그 가족을 위해 질환의 진단 및 치료 등을 지원받을 수 있는 기관의 목록을 함께 제공한다는 점에서 차별성을 가지고 있다.

(4) 유럽희귀질환환자연맹 (European Organization for Rare Diseases, EURORDIS)

EURORDIS는 유럽연합 내에 있는 70개국 837개 희귀병 환자 조직을 대표하는, 1997년에 설립된 비영리 기구이다. EURORDIS는 환자, 가족 및 환자 그룹을 연결하고 모든 이해당사자들을 모아 질환의 연구 및 정책, 환자 서비스를 제공하는 것을 주 임무로 하고 있다. 특히 EURORDIS에서는 세계희귀질환의 날을 제정하여 국제적인 관심과 이해를 촉구하고 있다 [14]. 자체적인 질환 데이터베이스는 보유하고 있지 않으며, 해당 정보는 Orphanet [12]으로 유도하고 있다.

(5) 스웨덴 희귀질병정보센터 (Swedish Information Centre for Rare Diseases)

스웨덴에서는 질병이 인구 1만 명당 1명 미만에 영향을 미쳐 장애를 일으킬 때 희귀하다고 정의한다. 스웨덴 희귀질병정보센터는 이러한 정의를 기반으로 희귀하게 발병하는 질환을 중심으로, 2019년 2월 현재 440여 개의 희귀 질병에 대한 정보를 제공하고 있으며, 스웨덴 국립 희귀질환연구소(NFSD)와 스웨덴 대학병원 및 다양한 의료 전문 센터 등과 연계되어 환자의 진단 및 치료를 지원하고 있다 [15].

(6) 질병관리본부 희귀질환 헬프라인

질병관리본부에서도 2012년부터 일부 희귀질환에 대해 전국 단위의 전문가 네트워크를 구성하여 환자 임상자료 및 생체자원을 모으고 있다. 이를 통해 희귀질환의 진단, 치료 및 예후 등에 대한 임상정보와 시료를 수집·분석하여 한국인의 임상적 특성을 규명하고 국내외 관련 전문가들과 정보 공유를 통해 해당 질환의 진료지침 개발, 치료기술 개발로 이어질 수 있도록 하여 환자들의 조기진단 및 진료의 질 향상에 기여할 것으로 기대하고 있다 [17]. 국내 6개 질환(시신경척수염, 아밀로이드증, 유전성 부정맥, 전신홍반성루푸스, 조직구증식증, 크론병)에 대한 전문가 네트워크를 운영하고 있으며, 2019년 2월 현재 927개의 질환에 대한 증상, 원인, 진단, 치료 등의 정보를 한글로 제공하고 있다 (표 1). 또한 관련 임상시험의 정보를 제공하기 위해 ClinicalTrials.gov [17]로 외부링크를 제공하며, 국내 의료비 지원 여부에 대한 정보도 제공하고 있다 [18].

표 1. 질병관리본부 헬프라인 [18]에서 제공하는 희귀질환 분류와 해당 질환수
질병관리본부 헬프라인 [18]에서 제공하는 희귀질환 분류와 해당 질환수


2.4 질환명 데이터베이스

희귀질환의 데이터베이스를 구축하는데 있어서 우선적으로 직면하는 문제는 질환의 정의이다. 희귀질환의 경우 다양한 이름들이 존재하거나 서로 다른 질환명들을 혼동하여 사용되는 경우들이 많다. 이러한 복잡한 명명으로 인한 혼동을 줄이고자, 여러 기관에서 표준화된 질환명을 정하고, 각 질환명의 동의어 목록을 만들려는 노력을 기울이고 있다. 따라서, 이러한 표준화된 질환명을 기반으로 희귀유전질환 데이터베이스 구축 작업을 하는 것이 필수적이며 실제 Orphanet [12], OMIM [11] 등 대표적 희귀유전질환 데이터베이스에서는 이러한 표준화된 질환명을 사용하고 있다. 이 장에서는 주로 사용되는 Medical Subject Heading (MeSH), Human Phenotype Ontology (HPO), International Classification of Disease (ICD)에 대해 살펴보고자 한다.

(1) Medical Subject Headings (MeSH)

미국 국립의학도서관(National Library of Medicine)에 의해 작성된, 통제 어휘(controlled vocabulary)를 사용한 논문 색인어 및 동의어 모음집이다. 모든 어휘는 계층적 구조를 가지고 있으며, 가장 상단에는 16개의 범주(Anatomy; Organisms; Diseases; Chemicals and Drugs; Analytical, Diagnostic and Therapeutic Techniques, and Equipment; Psychiatry and Psychology; Phenomena and Processes; Disciplines and Occupations; Anthropology, Education, Sociology, and Social Phenomena; Technology, Industry, and Agriculture; Humanities; Information Science; Named Groups; Health Care; Publication Characteristics; Geographicals)가 되는 단어가 정의되어 있는데, 이중 ‘Disease’ 범주에 각종 질환명들이 계층적 구조를 가지고서 체계적으로 정의되어 있다 [19].

(2) 인간 표현형 온톨로지 (Human Phenotype Ontology, HPO)

NIH의 지원을 받는 국제 컨소시움인 Monarch Initiative [9]에서 개발한 HPO는 인간 질병에서 발생하는 표현형(phenotype) 이상 현상에 대한 표준화된 어휘를 제공한다. HPO는 의학 문헌, Orphanet [12], OMIM [11] 등을 참고하여 개발되고 있으며, 현재 13,000개 이상의 용어와 156,000개 이상의 유전 질병에 대한 주석을 포함하고 있다 [20].

(3) 국제질병분류목록 (International Classification of Diseases, ICD)

1893년 국제통계연구소에 의해 최초의 국제질병분류목록(당시에는 국제사망원인목록이라는 이름이었다.)이 배포되었다. 이후 세계보건기구(The World Health Organization, WHO)가 창설되고 ICD-6 버전부터 WHO에서 배포하기 시작했고, 현재 ICD-10이 1990년 제43차 세계 보건 회의에 의해 승인되어 전 세계 100여 개국에서 사용되고 있다. 또한 개정판인 ICD-11 버전은 2018년 6월 18일에 영문판이 출시되어 있으며, 회원국의 각국 언어로 번역된 후 각 회원국의 승인을 거쳐 2022년 1월 1일부터 공식 사용될 예정이다. ICD는 국제적인 건강 동향과 질병에 대한 통계를 파악하고 보고하는데 국제 기준이 됨과 동시에 모든 임상 및 연구 목적에 대한 진단 분류의 세계적 표준을 제시하고 있다 [21].

2.5 희귀유전질환 데이터베이스 현황

(1) Orphanet

Orphanet은 1997년 프랑스 국립보건의학연구소(French National Institute for Health and Medical Research, INSERM)에 의해 개발되어 현재는 유럽의 40개국의 재정적 지원을 받고 있다. Orphanet은 희귀질환의 진단 및 치료에 관한 지식을 수집 및 개선하여 고품질의 정보를 제공하고, 희귀질환에 ID(ORPHAnumber)를 발급하여 체계적으로 질환명을 관리하는 등 실질적 희귀질환과 관련된 정보를 제공하는 것을 목적으로 하고 있다 [12].

매년 리포트를 발간하여 희귀질환 목록과 각 질환의 유병률을 지속적으로 갱신 및 공유하고 있다. 2019년 1월 기준으로 5,959개 희귀질환에 대해 유병률을 제공하고 있다. Orphanet에서는 주기적으로 Medline의 키워드 검색과 전문가 집단의 조언을 바탕으로 희귀질환정보를 갱신하고 있으며, 현재 공개된 2017년 리포트 [3]에 의하면 희귀질환정보는 ICD-10 [21], OMIM [11], UMLS [22], MedDRA [23], MeSH [19], GARD [6]와 같은 데이터베이스에 링크되어 있으며, 3,739개의 희귀질환의 원인으로 밝혀진 3,898개 유전자 정보가 등록되어 있고, 해당 유전자는 HGNC [24], OMIM [11], Genatlas [25], UniProtKB [26], Ensembl [27], IUPHAR-DB [28], Reactome [29]의 데이터베이스에 연결 되어 있다 (표 2). 등록된 5,300여 개의 질환에는 유전과 관련한 정보가 등록되어 있으며, 5,600여 개의 질환에는 발병나이가 입력되어 있다. 또한 1,600여 개의 희귀질환 진단을 할 수 있는 의료 연구실이 제공하는 4,500여 개의 희귀질환에 대한 44,000여 가지의 진단 테스트 결과가 등록되어 있어, 환자나 가족 및 연구자들이 필요로 하는 정보를 쉽게 구할 수 있도록 되어 있다.

Orphanet은 질환명을 명명하는데, 표 3에서와 같이 33개의 범주를 기반으로 계층형 구조로 이루어져 있어서 하위 질환명을 가지고 있는 중간 질환명과 하위 질환명이 없는 말단 질환명이 존재한다 [30].

표 2. Orphanet의 등록된 희귀질환과 관련 유전자 자료 현황
Orphanet의 등록된 희귀질환과 관련 유전자 자료 현황


표 3. 각 희귀질환 카테고리별로 Orphanet에 등록된 질환명의 수
각 희귀질환 카테고리별로 Orphanet에 등록된 질환명의 수


Orphanet에서는 단백질을 코딩하는 유전자, 단백질을 코딩하지 않는 non-coding RNA, 그리고 질환과 연관성이 밝혀진 locus를 모두 유전자로 정의하고 있으며, 이 유전자와 희귀질환과의 관계를 다음과 같이 분류하였다 [31].

Disease-causing germline mutation(s) in: A gene mutation in a germ cell that is sufficient to produce the disorder and that can be passed on to offspring.
Disease-causing germline mutation(s) (gain of function) in: A gene mutation in a germ cell that provides a new function of the corresponding protein that is sufficient to produce the disorder and that can be passed on to offspring.
Disease-causing germline mutation(s) (loss of function) in: A gene mutation in a germ cell that impairs the function of the corresponding protein and that is sufficient to produce the disorder and that can be passed on to offspring.
Disease-causing somatic mutation(s) in: A gene mutation in a somatic cell that is sufficient to produce the disorder but that cannot be passed on to offspring.
Major susceptibility factor in: A gene mutation in a germ cell that predisposes to the development of a disorder, and that is necessary but not sufficient to develop the disorder.
Modifying germline mutation in: A gene mutation in a germ cell that modifies the clinical presentation of the disorder and that can be passed on to offspring.
Part of a fusion gene in: A coding or regulatory DNA sequence from a gene that has fused with another coding and/or regulatory DNA sequence from a different gene.
Role in the phenotype of: A gene included in a chromosomal rearrangement, and proved to have a major influence in the phenotype of the chromosomal rearrangement.
Biomarker tested in: A gene in which a variation is used to monitor disease activity and/or patient outcome.
Candidate gene tested in: A gene in which a mutation is suspected, but not yet proven, to be responsible for a disorder, and that is tested for in a clinical setting.

Orphanet은 자료의 지속적인 관리와 업데이트를 위해 데이터베이스 관리자(database manager), 유전자 관리자(gene manager), 정보 과학자(information scientist)를 지정하여 해당 직책에 대한 역할을 문서화하여 지정해 둠으로써 객관적인 정보의 생산과 원활한 정보의 갱신을 위한 인력 체계를 구축하였다. 또한 질환명 정의 및 지정, 유전자의 연관성 정의, 역학 정보의 추가와 같은 모든 정보의 업데이트에 있어서 의사결정도표(decisional diagram)를 작성하여 각 구성원들 간의 결정의 일관성을 유지하고자 하고 있다. 최종적으로는 외부 혹은 내부의 전문가 자문위원단을 통해 정보의 검증을 실시하여 최종 업데이트되는 정보의 신뢰성을 확보하려는 노력을 수행하고 있다. Orphanet Orphadata(http://www.orphadata.org)와 깃허브 사이트(https://github.com/Orphanet/Orphadata.org)에서 전체 자료를 제공하고 있다.

(2) Online Mendelian Inheritance in Man (OMIM)

OMIM [11]은 Victor A. McKusick 박사의 Mendelian Inheritance in Man(MIM)의 온라인 버전의 연속물로써 유전자와 유전자 표현형(phenotype) 그리고 그들 사이의 관계에 대한 포괄적인 정보를 다루는, 이 분야에서는 가장 오래된 역사를 가진 데이터베이스이다. MIM은 1966년과 1998년 사이에 12개의 판본을 출판하였고, 온라인 버전인 OMIM은 1985년에 미국 국립 의학 도서관과 존스 홉킨스대학의 윌리엄 웰치 의학도서관과의 협업을 통해 만들어졌다. 1987년 이후 인터넷을 통해 OMIM에 접근 및 검색이 가능해졌다. OMIM은 단순 1차 데이터를 저장하는 기능에 치중하지 않고 생물의학 문헌에 대한 전문가의 검토를 바탕으로 새롭고 의미있는 정보를 종합하고 요약하였다는 점에서 그 가치를 인정받고 있으며, 현재도 꾸준한 업데이트를 통해 유전적 표현형의 명명 및 분류에 주도적인 역할을 수행하고 있다. 2019년 2월 현재, OMIM은 16,046개의 유전자와 8,801개의 표현형을 기술하는 24,847항목으로 구성되어 있다. OMIM.org로 미국 NCBI에서 따로 분리되어 나오면서 API(Application Programming Interface)와 FTP 다운로드 서비스를 새롭게 제공하고 있으며 거의 일간 단위의 업데이트를 통해 최신의 정보를 유지하고 있다.

OMIM의 자료구조는 크게 유전자 필드, 표현형 필드, 그리고 이 둘의 관계를 정의하는 유전자 맵 필드로 구성되어 있다. 이 3가지 필드에 수십 개의 외부 데이터베이스의 자료와 연결되어 있는 구조를 가지고 있다 (그림 1). 표현형 필드에는 해당 표현형을 효과적으로 기술하기 위해 임상적 개요(clinical synopsis)를 제공하고 있고, 임상적 특징, 생화학적 특징, 진단, 치료 방법, 분자유전학적 특징 등의 관련 사항을 문헌 중심으로 기술하여 자료의 신뢰성을 확보하고 있다. 유전자 필드에는 알려진 유전변이 리스트를 제공하고, 유전자의 기능과 물리적 위치, 분자유전학적 특징을 기술하고 있다. 이 두 필드 모두 유전자-표현형 관계 필드에 의해 연결된 형태로 구성된다. 유전자 필드와 표현형 필드 모두 다양한 외부 링크를 제공하고 있으며, 특히 각 자료의 생성, 업데이트에 관여하였던 사람과 날짜를 모두 보여줌으로써 자료의 신뢰성과 항상성을 확보하고 있다.

임상적 개요에 해당하는 단어를 수집하기 위해서는 Unified Medical Language System (UMLS)[22], Human Phenotype Ontology (HPO) [20], SNOMED CT [32] 그리고 Elements of Morphology (EoM) [33]에서 제공되는 통제 어휘(controlled vocabulary)를 참고하여 컴퓨터에 의해 혹은 전문가에 의해 검증되어 최종 자료 입력을 수행하게 된다.

유전자와 표현형의 관계를 OMIM에 추가하기 위해서는 그 관계가 다양한 기술로 확인되어 보고되어 있어야만 한다. 그러나 2013년부터 차세대 시퀀싱 기술에 의해 유전자 변형의 신속한 식별이 가능해짐에 따라, OMIM은 차세대 시퀀싱 기술을 사용하여 (i) 유전적 연관성이 없는 집단에서 동일한 유전자에 병원성 변이를 가진 개인들에게만 해당 표현형이 나타날 경우, (ii) 여러 가족 집단에서 변이의 유무에 의해 표현형의 유무가 나타날 경우, (iii) 통계적으로 유의한 수의 새로운 변이(de novo mutation)를 가진 개인에서만 표현형이 나타나는 경우에 한해서 유전자-표현형 관계를 자료에 포함시키고 있다. 하지만, 이러한 자료라도 이후 (i) 하나의 유전자 변형 만을 가지고 있는 한 가족에서 그 유전자 변형을 가지고 있는 가족 구성원만이 해당 표현형을 나타내거나, (ii) 모델 생물에서의 표현형 비교 실험, 체외/체내 효소 또는 유전자 활성 실험과 같은 유전자의 기능을 밝혀줄 실험결과에 의해 검증이 된 경우에 한해 해당 유전자-표현형 관계를 검증된 결과로 업데이트를 시키고 있다.

OMIM은 유전자와 그 표현형을 다루는 데이터베이스로 그 역사만큼이나 방대한 자료를 포함하고 있고, 각 자료에 대해 전문가의 검증이 수반되어 높은 신뢰성을 보이고 있다는 측면에서 희귀유전질환 연구에 필수적인 데이터베이스라고 볼 수 있다.


크게보기-OMIM에서의 표현형(왼쪽)과 유전자(오른쪽)의 필드 구성
그림 1. OMIM에서의 표현형(왼쪽)과 유전자(오른쪽)의 필드 구성


(3) 유전학 홈 레퍼런스(Genetics Home Reference, GHR)

GHR [7]은 유전자 변이가 인간의 건강에 미치는 영향에 대한 정보를 일반인을 대상으로 가능한 알기 쉽게 제공하는 미국 NIH에서 운영되는 사이트이다. 일반인을 대상으로 하고 있기 때문에 그림에서 보는 바와 같이 질환의 정보와 이를 이해하는데 필요한 기초적인 설명에 대한 링크가 항상 함께 제공된다. 희귀질환뿐만 아니라 모든 질환을 대상으로 하는 데이터베이스이므로 그 양이 방대하며, 각종 리소스에 대한 링크가 잘 연결이 되어 있어 좀 더 상세한 정보를 원할 경우 쉽게 접근할 수 있도록 구성되어 있다 (그림 2).


GHR에서의 Cockayne syndrome의 정보 중 진단 부분
그림 2. GHR에서의 Cockayne syndrome의 정보 중 진단 부분.
오른쪽 패널에 일반인의 이해를 돕기 위한 기본적인 내용에 대한 링크가 들어가 있다.


(4) ClinVar와 Clinical Genome Resource (ClinGen)

ClinVar [34]는 NIH의 지원으로 개발, 유지되고 있으며, 유전적 변이와 인간의 표현형(phenotype)과의 관계에 대한 정보를 집계하여 보관하는 데이터베이스이다. ClinVar는 기본적으로 사용자의 정보 제출을 기반으로 자료를 갱신 및 유지한다. 임상실험실, 연구자, 전문가 집단으로부터 1차 제출(primary submission)을 받기도 하고, 전문가의 의견이 포함된 제출(expert-curated submission)을 받기도 한다. 제출된 자료는 유전적 변이에 대한 임상적 중요성(clinical significance)과 용어의 표준화를 추가하는 과정을 거친다. 즉, 제출된 자료에서 유전 변이는 Human Genome Variation Society (HGVS) [35]에 함께 리포트되고, 레퍼런스 지놈에 맵핑되며, 표현형은 MedGen [36]의 개념에 맞추어서 작성되고, 임상용어는 American College of Medical Genetics (ACMG) [37] 의 기준에 따라 정보 수정의 단계를 거친 후 최종 데이터베이스에 기록이 된다. 모든 변이에 대해 리뷰 상태를 공개하고 있으며, 임상적 주요성(clinical significance)도 함께 제공되어 실제적인 유전변이를 이용한 연구에 도움이 될 수 있는 정보를 제공하고 있다 (그림 3).


크게보기-ClinVar의 검색 결과
그림 3. ClinVar의 검색 결과.
각 유전변이에 대해 리뷰 상태와 유전변이의 임상적 중요성(clinical significance)를 보여주고 있다.


ClinGen [38]도 역시 NIH의 지원으로 설립되었으며, 유전변이와 인간의 표현형과의 관계에 대한 정보를 수집하고 공유, 자료의 표준화를 하는 것은 ClinVar와 유사하나, 이 정보를 기반으로 정밀의학에 기반한 지식 데이터베이스를 작성하고, 변이 해석의 처리량을 향상시키기 위한 기계학습 알고리즘 개발, 유전자 및 변종의 임상적 중요성을 평가하여 임상진료시스템에 적용 지원, EHR (Electronic Health Record)과의 연계 분석을 목적으로 한다는 측면에서 ClinVar의 정보를 실제 의료기관과 환자 정보에 적용하는데 더 중점을 두고 있는 기관이다. 2019년 2월 현재 ClinGen은 33개의 전문가 그룹에 의해 1,590개의 유전자와 10,703개의 유전변이가 전문가의 검증을 마쳤다. 자체 데이터베이스를 운영하기보다는 전문가 검증을 거친 정보를 ClinVar에 제공함으로써 ClinVar와 유기적인 협력체계를 이루며 운영되고 있다.

(5) 유전자검사 등록소 (Genetic Testing Registry, GTR)

미국 GTR은 미국 국립보건원, 미국 국립보건자원서비스국, 미국 에너지부의 지원으로 운영되며 유전자 검사와 진단, 질병 관리, 유전적 상담에서의 사용에 대한 최신 정보를 제공하는 데이터베이스이다. 희귀유전질환뿐만 아니라 각종 질환에 대한 유전자 검사 방법에 대한 정보가 등록되어 있어서 희귀유전질환 유전자 검사에 대한 정보를 얻을 수 있다 [39].

GTR의 모든 정보는 표준화된 데이터베이스와 XML의 형태로 제공된다. GTR은 매일 자동으로 추가되거나 갱신된 기록을 확인하고 다시 인덱싱하며 Gene [40], NCBI Protein [41], dbSNP [42], GeneReviews [43] 및 OMIM [11]으로 갱신된 정보를 제공한다. 2019년 2월 현재 519개 기관에서 제출된 16,459개의 유전자와 11,462 표현형(conditions)에 대해 55,973개의 유전자 검사를 보유하고 있다. 표 4 및 표 5와 같이 GTR에서 다양한 검사 방법별 유전자 검사를 검색할 수 있다.

GTR에서의 유전 질환에 대한 설명은 GeneReviews [40]에 있는 내용을 인용하고 있다. GeneReviews에는 질환의 요약, 진단, 임상적 특징, 유전변이, 유전자 검사 카운셀링, 분자유전학적 특징 등의 정보를 제공한다. 해당 정보는 가능한 일반인이 이해할 수 있도록 기술하는 것을 목적으로 하고 있기 때문에, 비교적 쉽게 기술되어 있고, 전문용어의 경우 용어 풀이집이 함께 제공되고 있다.

표 4. GTR에서 제공하는 유전자 검사 수 (2019년 2월 기준)
GTR에서 제공하는 유전자 검사 수


표 5. GTR에 등록된 검사방법별 제공 기관수와 등록된 검사수 (2019년 2월 기준)
GTR에 등록된 검사방법별 제공 기관수와 등록된 검사수


(6) 한국인 유전변이 데이터베이스 (Korean Mutation Database, KMD)

KMD [44]는 질병과 관련된 한국인 유전자 변이를 정리, 분류, 저장, 공유하기 위해 국립보건원에서 2009년에 개발되었으며, 2019년 2월 현재 540개의 질환과 2,164개의 유전자 변이에 대한 정보를 제공하고 있다. KMD는 PubMed에서의 검색을 통한 자료 수집과 국내 주요 유전자 클리닉과 제휴한 유전자 진단 연구소에서의 자료를 수집하여 데이터베이스를 구축하였다. 해당 사이트 (https://kmd.nih.go.kr/kmd/kmd)를 통해 유전자 변이 검색과 등록이 가능하며, 정확한 유전자 변이 등록에 대한 가이드라인을 수록하고 있다. KMD는 국립보건원의 헬프라인의 희귀질환 데이터베이스 [18], dbSNP [42], OMIM [11], UniProtKB [25] 등의 외부 데이터베이스와의 링크를 제공한다.

3. 결론

희귀질환은 적은 수의 유병 인구로 인해 질병에 대한 임상적 이해가 부족하고, 대부분은 유전성 소인에 기인하여 임상적 진단조차 어려운 경우가 많으며, 의료기술의 발전에도 불구하고 적은 수의 환자로 인한 연구기관과 기업의 외면으로 적절한 치료방법과 대체의약품이 개발되지 아니하여 만성 진행성 경과로 인한 심각한 다장기 기능장애를 동반하게 되는 경우가 많다. 따라서 희귀유전질환의 경우 다른 질환보다 더더욱 환자나 연구자에게 그 데이터베이스의 필요성이 절실하다고 하겠다.

희귀유전질환 데이터베이스의 사용자는 환자나 환자의 가족, 그리고 연구자나 임상의로 크게 나누어 볼 수 있다. 연구자나 임상의를 위한 전문적인 수준의 정보를 제공도 해야 하지만, 관련 정보를 구하기 힘든 환자나 환자 가족과 같은 일반인을 위한 전문 정보의 해석이나 교육도 함께 제공되어야 한다. NIH의 GHR [7]은 일반인이 쉽게 접근할 수 있는 좋은 예라고 할 수 있겠다.

희귀유전질환 데이터베이스를 지속적으로 유지, 관리하기 위해 정부 및 관련 기관, 병원, 연구소의 유기적인 네트워크의 구성과 그 구성된 네트워크로부터 지속적인 정보를 받아 정보를 업데이트하는 것이 필수적이다. 유럽의 Orphanet [12]과 미국의 NORD [5], ClinVar [34] 및 ClinGen [38]의 사례는 전문가 집단 네트워크를 통한 지속적인 정보를 수집과 갱신, 그리고 자료의 검증을 보여주는 좋은 사례로 볼 수 있다. 특히 자료의 희귀성으로 인해 잘못된 자료가 입력되었을 경우 이후 미치는 영향력이 크기 때문에 각 자료에 대한 전문가 집단의 검증은 데이터베이스의 신뢰성 확보를 위해 반드시 필요한 절차라 할 수 있겠다.

희귀유전질환 데이터베이스는 자료의 신뢰성 확보를 위해 자료의 갱신 및 이전, 삭제에 대한 이력 정보 (history)를 유지해야 한다. OMIM [11]의 경우 각 정보의 최초 입력 및 수정이 일어날 때의 담당자와 시간을 모두 유지하고 있다. 이것은 차후 발생할 수 있는 자료 오류의 원천을 밝힐 수 있는 주요 근거가 될 수 있어서 차후 발생할 수 있는 오류를 사전에 예방할 수 있는 효과를 얻을 수 있다. 또한 각 자료의 최신성 및 해당 질환의 연구 빈도와 같은 추가적인 정보를 사용자에게 제공해 줄 수 있다.

지금까지 살펴본 것처럼, 국제적 혹은 국가적 노력으로 희귀질환의 연구에 필수적인 유전변이와 질환의 정보를 포함한 여러 형태의 데이터베이스가 구축되고, 신뢰성 있는 자료의 축적과 지속적인 정보의 검증 및 갱신이 이루어져 오고 있다. NORD의 보고서에 따르면 최근 10년간 FDA가 승인한 희귀질환 치료제(orphan drug) 수가 년간 기존 10~20건에서 년간 30~50건으로 증가추세에 있는 것도 이러한 노력의 일환일 것이다 [45].

4. 맺는 말

10만 명 중 2~4명만 걸리는 희귀유전질환인 배턴병(Battern disease)를 앓고 있는 6살 밀라(Mila)는 그 유전적 결함으로 인해 중요한 대사 효소의 결핍으로 뇌에 단백질과 지질의 유독성 증대로 인한 퇴행성 증상들이 빠른 속도로 진행되고 있었다. 별다른 치료법이 없는 이 병에 대해 보스톤 아동병원의 티모시 유 (Timothy Yu) 박사팀은 시퀀싱 기술을 이용해 유전적 결함이 있는 유전변이를 찾아내고, antisense oligonucleotide를 이용한 밀라센(Milasen)을 개발하여 몇 개월간 투여함으로써 병의 진행을 멈추는 데 성공했다. 즉 새로운 치료법이 임상실험에 성공하기까지 몇 년씩 걸리는 기존의 약물 개발 과정과 달리, 단 1년 만에 병의 진단과 치료제 개발까지 성공한 것이다. 이는 희귀유전질환을 앓고 있는 환자와 이를 연구하는 연구자에게 새로운 희망을 가져다 줄 수 있는 성공적 사례이다 [46].

물론 희귀유전질환의 원인이 다양하고, 그에 맞는 치료법들도 다양한 방법으로 접근해야 할 것이어서 이와 같은 방식으로 모든 희귀유전질환에 적용하기에는 무리가 있다. 하지만, 희귀유전질환의 데이터베이스의 신뢰성 있는 자료가 축적이 되고, 유전질환치료의 다양한 방법들이 함께 개발된다면, 각 희귀유전질환 환자의 특성에 맞는 진단과 치료제 개발이 빠른 시간 안에 이루어질 수 있는 시대가 곧 올 것으로 예상한다.

5. 참고문헌

==> PDF 참조
  추천 1
  
인쇄하기 주소복사 트위터 공유 페이스북 공유 
  
본 게시물의 무단 복제 및 배포를 금하며, 일부 내용 인용시 출처를 밝혀야 합니다.
Citation 복사
권민석(2019). 희귀유전질환 관련 유전자 변이의 데이터베이스화 동향. BRIC View 2019-T11. Available from http://www.ibric.org/myboard/read.php?Board=report&id=3203 (Apr 11, 2019)
* 자료열람안내 본 내용은 BRIC에서 추가적인 검증과정을 거친 정보가 아님을 밝힙니다. 내용 중 잘못된 사실 전달 또는 오역 등이 있을 시 BRIC으로 연락(member@ibric.org) 바랍니다.
 
  댓글 0
등록
목록
(주) 코리아바이오믹스
위로가기
동향 홈  |  동향FAQ  |  동향 문의 및 제안
 |  BRIC소개  |  이용안내  |  이용약관  |  개인정보처리방침  |  이메일무단수집거부
Copyright © BRIC. All rights reserved.  |  문의 member@ibric.org
트위터 트위터    페이스북 페이스북   유튜브 유튜브    RSS서비스 RSS
에펜도르프코리아