최신 연구동향 정보를 제공하기 위해 생명과학관련 정보제공자를 모집합니다.
Bio리포트 동향리포트
인공지능(딥러닝)을 활용한 신약 설계
이시영(지니너스 주식회사)
목 차
1. 신약개발과정에서 인공지능의 역할
2. 딥러닝을 활용한 신약 설계
2.1. 환자의 데이터를 활용한 타깃 설정
2.2. 타깃과 분자물질 간의 결합 모델 예측
2.3. 실제 임상시험과의 매칭을 통한 약물반응성 예측
3. 결론
4. 고찰
5. 참고문헌
1. 신약개발과정에서 인공지능의 역할
모든 생명체는 생명현상을 유지하기 위한 활동을 추구하며, 특히 인간은 지능을 이용하여 문제를 해결하도록 진화하였다. 생존의 욕구는 메슬로우(Maslaw)가 정의한 인간의 5대 욕구 중에서도 가장 근간이 되는 필수적인 욕구이다. 이에 환자의 생존과 건강을 위해 전 세계의 제약회사들은 신약을 개발하고 있으며, 전임상, 임상시험을 통해 10여 년 내외의 긴 시간 동안 수천억 원에서 수조 원의 돈을 각각의 제약회사에서 투자하고 있다. 이러한 제약업계의 연구 투자 규모는 전 세계 항공산업의 5배 규모, IT산업의 2.5배에 이르는 규모에 이른다 [1]. 그렇지만, 이러한 투자의 증가에도 불구하고 2023년 기준 신약으로 새롭게 인허가 받는 약의 수는 투자하는 비용에 비례해서 늘어나지는 않고 있으며, 대략 신약후보물질 수천 여 개 중 1개 정도 물질이 약 10년에서 15년의 기간을 거쳐 FDA에 허가를 받고 시판되고 있다 [1]. 이러한 어려운 조건에도 불구하고 혁신적인 블록버스터급 신약이 개발되면 의료, 제약 관련 산업의 판도자체를 바꿀 수 있으며, 수많은 환자들에게 희망이 될 수 있기 때문에 오늘도 어김없이 제약사들은 새로운 약을 개발하고 있다.
최근 신약개발의 동향은 기존의 전통적인 접근법을 넘어 새로운 플랫폼들을 도입하는 단계로 접어들고 있는데, 컴퓨팅 기술의 발전과 축적된 데이터의 양이 늘어남에 따라서 이를 활용해 다각도로 예측모델을 만드는 것이 가능해지게 되었다. 이러한 데이터 등을 분석하여 MIT technology Review에서는 기존 파이프라인에서 개선이 필요한 3가지 요인을 살펴보았는데, 그중 하나는 질병을 치료, 개선하기 위한 ‘바람직한 타깃을 도출’하는 것, 다른 하나는 ‘타깃 단백질과 약물 간의 결합을 예측’하는 것, 다른 하나는 약물이 ‘어떤 환자에게 적용’이 될지 아는 것이다 [2]. 이 3가지에 대한 접근방법에서 수십 년간 수많은 데이터가 축적되어 왔으며, 일부는 새롭게 쌓이면서 신약 설계에 있어서의 효율을 높여가려고 한다.
인공지능(Artificial intelligence, AI)이란 사람이 처리할 수 있는 연산에 비해 매우 짧은 시간에 무한에 가까운 데이터를 처리할 수 있기 때문에, 결국 정확하게 쌓인 데이터가 많아질수록 유용한 결과를 도출할 수 있다. 최근에는 신약개발 과정에서 환자의 정보들을 더욱 세밀하게 축적하고, 표적 외의 데이터들도 오믹스 차원에서 접근하고 있다. 결국 예전에는 정보가 많이 없던 상황에서 약물을 처방하고 예후를 확인했다면, 최근에는 수많은 데이터 속에서 어떤 처방을 내려야 최선의 선택이 될지 고민해야 하는 상황이 되었다. 인공지능의 범주 내에서도 머신러닝(Machine learning)은 이러한 많은 데이터들 속에서 학습을 하여 최적의 답을 내도록 도와주는데, 그중에서도 딥러닝(Deep learning)은 신경망 네트워크(Neural Network)를 통해 빅데이터를 분석해서 패턴을 발견하고 데이터가 포함한 내용의 특징까지 파악하여 데이터가 늘어남에 따라 더 정확한 결론을 낼 수 있도록 하고 있다 [3]. 즉, 신약개발 과정에 있어 인공지능을 활용하면 무수한 데이터 속 연산과정을 통해 환자에게 가장 적합한 처방을 내려주는 선택을 할 수 있을 뿐 아니라, 이러한 정보들을 기반으로 하여 신약개발 과정에 있어서의 정확도, 효율성, 시간 단축을 불러올 수 있을 것으로 기대하고 있다.
2. 딥러닝을 활용한 신약 설계
신약을 설계하는 과정은 크게 치료하고자 하는 질환 및 그에 해당하는 타깃을 설정하고, 타깃에 대한 후보물질을 탐색하여 전임상 단계 및 임상단계에서 효능을 확인하는 과정으로 이루어진다. 이 과정에서 인공지능을 활용하여 기존의 신약개발 방식에서 개선 가능한 3가지에 대해서 소개하고자 한다.
2.1. 환자의 데이터를 활용한 타깃 설정
목표하는 질환과 그를 개선하기 위한 타깃을 정확하게 아는 것은 신약개발 과정에서 가장 우선적으로 수행되는 과정이다. 이 과정에서는 질환으로 유도되는 수많은 바이오마커(Biomarker)들에서 허수가 아닌 핵심을 파악하는 것은 매우 중요하다. 현재까지 전통적인 접근방식을 통한 바이오마커 발굴은 이전 연구동향을 파악하고 마커의 후보를 추려서 in vitro에서 결합확인 및 효능 확인을 통한 개발 방식이었다. 인간의 유전지도가 밝혀지고 차세대 염기서열 분석(Next-Generation Sequencing, NGS)이 도입된 2000년대부터는 연구자가 보고자 하는 마커 외에 생명체에서 발현하는 대부분의 유전자의 발현이 확인될 수 있게 되었고, 이를 통해서 단일 샘플에서 수많은 정보가 나타나기 시작했다. The Cancer Genome Atlas Program (TCGA)을 통해서 수많은 암환자들의 생존, 투약정보와 환자들의 유전자 발현 정보 및 그 외 정보가 함께 매칭되기 시작하면서 환자군을 분류할 수 있게 되고, 어떤 환자에게서 어떠한 유전자가 발현되는지 알 수 있게 되었다. 이러한 접근법을 기반으로 정밀의료의 개념이 도드라지게 되었고, 오바마 대통령이 2015년 초 정밀의료계획(Precision Medicine Initiative, PMI)을 발표하면서 많은 연구진들의 집중을 이끌게 되었다 [4].
세간의 관심과 더불어 한계점들도 많이 확인되었는데, 이는 염기서열 분석을 하더라도 환자에게서 언제 조직 및 혈액을 얻었는지 매칭하는 것이 중요하고 설령 잘 분석된 샘플의 경우라도 각각의 조직에서는 다양한 세포군들이 커뮤니케이션을 하고 있기 때문에 이를 조직 전체의 RNA에서 확인할 수 있는 것에서는 분석법의 한계가 있었다. 이러한 한계를 극복하기 위해서 현재까지 단일세포 수준에서 세포의 발현을 확인할 수 있는 단일세포 전사체 분석(single cell RNA sequencing)이나, 조직에서 병리를 확인하면서 RNA의 발현을 볼 수 있는 공간전사체 분석(spatial transcriptomics) 기술들이 그 예로 볼 수 있다.
이런 최신 기법들을 활용해서 기존보다 더욱 정밀한 타깃 도출 및 해당 타깃을 적용할 적응증에 대한 선정 방법이 구체화되기 시작했는데, 단일세포 분석 기술 데이터를 가지고 있는 회사들의 경우 이를 활용해서 글로벌 제약사들과 협업 하에 타깃을 도출 및 신약개발의 과정에서 공동연구를 진행하는 협약을 맺기 시작하였다. 미국에서는 Immunai, Celcius와 같은 회사들이 환자의 임상정보와 매칭되는 단일세포분석 데이터를 가지고 신약에 대한 공동연구를 추진하고 있으며, Roche에서는 단일세포분석 결과를 활용하여 병용투여 약물을 개발하는데 공격적인 시도를 하고 있다. Immunai의 경우 단일세포 전사체 분석 데이터를 가지고 타깃 분석을 서포트 주는 플랫폼인 AMICA (Annotated Multi-omics Immune Cell Atlas)를 가지고 있으며, 20종 이상의 질환 및 25개 이상의 파트너 연구소 및 병원과 함께 연구하고 있는 회사이다. Merck, BMS와 같은 제약사와도 협력관계에 있으며, 대략 1000여 명 내외의 환자에 대한 데이터의 보유 및 분석 역량을 가지고 21년 10월 미국에서 $215M 규모의 Series B투자를 받아 $1B에 해당하는 기업가치를 가지는 것을 볼 때, 환자의 분석 데이터를 확보하는 것이 얼마나 가치 있는지 확인할 수 있다. 또한 Celsius의 경우 Immunai와 마찬가지로 단일세포 전사체 데이터를 가지고 있는 것이 주요 강점인데, 특히 CEL383이라는 파이프라인으로 과민성 대장염(Inflammatory bowel diseases)에 대한 타깃 발굴 및 신약개발을 공동으로 진행하여 $700M에 해당하는 마일스톤 별 계약을 Servier와 체결한 바 있어, 타깃 선별에 있어 데이터가 가지는 의미가 매우 크다고 볼 수 있다 [5].
이렇듯 환자의 데이터가 중요해진 것은 정밀하게 처리할 수 있는 데이터의 양의 증가 및 딥러닝 기술의 향상에 따른 결과로 볼 수 있다. 단일세포분석을 통해서 기존 대비 최소 수천-수만 배의 데이터의 양을 각각의 세포 수준에서 확인할 수 있게 되었으며, 여기에는 세포가 가지는 특성을 클러스터링 해주는 차원축소 과정에서의 머신러닝 과정을 활용한다. 단순한 바이오마커의 과발현을 저해하는 약물의 설계를 넘어 환자에게서 나타나는 복합적인 면역반응을 함께 확인할 수 있게 되었으며, 이는 결국 환자에게서 나타나는 특징을 광범위한 부분에서 세부 적응증으로 나눌 수 있게 되었다. 예를 들어 KRAS변이가 있는 고형암에서도 환자별로 약물에 대한 반응 결과는 다르게 나타나는데, 그러한 이유를 암 관련 섬유아세포(Cancer associated fibroblast)나 대식세포(Macrophage) 및 면역세포의 특징에 따라서 분류가 될 수 있음을 현재 기술로는 확인이 가능한 것이다. 또한 임상샘플에서 원하는 타깃 데이터를 발굴했다면 원하는 타깃을 가지고 있는 환자의 데이터들을 public data에서 비교하면서 타깃의 효능에 대한 정확도를 높일 수 있다. 이전에는 문헌조사 등의 고전적인 접근법을 활용하여 실제 in vitro에서 검증하는 과정으로 진행했다면, 이제는 오픈 소스를 활용해서 타깃에 대한 반응 혹은 연계된 특징을 미리 확인할 수 있는 것이다.
아직까지는 신약개발 및 기존 약물에 대한 병용투여에 대한 접근 방식은 아직은 걸음마 단계라고 볼 수 있지만, 분석기술에 대한 발전은 계속되어 정밀화 할 수 있는 접근방법들이 새로 나오고 있으며 데이터 또한 계속해서 쌓이고 연구진들에게 공개되고 있다. 이렇게 쌓이는 데이터에 대해 딥러닝 기술을 활용하여 타깃을 발굴한다면, 확인 가능한 적응증과 타깃이 구체화되어 신약개발의 성공률을 높여줄 수 있을 것이다.
2.2. 타깃과 분자물질 간의 결합 모델 예측
바이오마커 발굴 과정에서 정확한 타깃을 도출하게 된다면, 그다음으로 중요한 것은 해당 타깃에 대해 억제 혹은 기능을 촉진하는 분자물질을 ‘어떻게 만들고 선별하는가’이다. 타깃이 하나로 설정되더라도 그 타깃에 대한 주축이 되는 분자구조를 만들거나, 그 기본 구조에서 파생되는 수천, 수만여 개의 화학구조를 설계하는 것은 많은 자본과 시간에 있어 노력을 필요로 한다. 최근에는 선진 기술을 가지고 있는 미국, 유럽뿐 아니라 국내에서도 타깃에 대한 저해제 정보를 이용해 약물에 대한 타깃 예측에 대한 모델을 진행하고 있다. 또한 최근 글로벌 제약사들은 모두 이러한 예측모델을 가지고 있는 회사와 협업 구조로 신약을 개발하고 있다. 얀센의 경우 BenevolentAI와, 화이자의 경우 IBM의 Watson, 머크의 경우 Atomwise의 AtomNet, 노바티스의 경우 Insilicomedicine의 geroscope를 활용해서 신약개발과정에서의 효율을 높이고자 노력하고 있으며, 국내에서도 스탠다임 및 디어젠, 신테카바이오, 파로스아이바이오 등이 해외 제약사 및 해외 인공지능 기반 신약개발 회사들과 협업을 하여 신약개발에서의 약물 후보군 예측을 하고 있다 [6].
단백질과 저분자화합물 간의 예측모델의 경우 예전부터 단백질 정보은행(Protein Data Bank, PDB)에서 얻어진 데이터를 활용해서 확인할 수 있었으나, 단순한 예측 모델링을 이용한 결과 예측은 그 정확도가 높지 않았기 때문에 결국은 in vitro에서 그 과정을 계속 확인하는 과정이 없이는 후속 연구의 진행이 어려웠다. 하지만, 약 20만여 건에 해당하는 단백질 정보은행에서의 데이터의 구조모델의 정보 증가와 ChemSpider, DrugBank를 비롯한 다양한 화합물에 대한 구조정보를 알 수 있게 되었다 [4].
약물과 타깃에 대한 구조적 예측은, 실질적으로 약물을 개발하고자 하는 특정 타깃이 설정된 상황에서는 인공지능 기술을 활용하여 가장 시간을 단축할 수 있도록 도울 수 있는 방법이다. 일반적인 기존 신약개발에서 타깃에 대한 후보물질을 발굴하는 것은 최대 5년까지의 기간이 소요되는 것으로 알려져 있지만 최근에는 획기적인 기간 단축사례들이 보도되고 있다 [1]. 가장 대표적인 단축사례로 46일 만에 약물에 대한 디자인부터 합성 및 테스트까지 진행된 사례가 있다. 인공지능 신약 개발 스타트업 중 하나인 Insilico Medicine에서는 딥러닝의 일종인 강화학습(reinforced learning) 모델을 활용한 GENTRL이라는 인공지능모형을 사용해서 21일 만에 3만여 개의 저분자 화합물을 디자인하고, 합성부터 in vitro에서 활성도에 대한 확인까지 까지 25일 정도를 포함해 46일 만에 선도물질(lead compound)을 도출하였다 [7]. 또한 Exscientia는 강박장애(obsessive compulsive disorder, OCD)에 대한 데이터들을 활용하여 딥러닝 기술을 활용한 DSP-1181 파이프라인의 임상 단계에 진입하여 글로벌 사례로도 가장 앞선 사례로 인공지능을 활용한 신약 개발 사례로 주목받고 있다 [8].
최근에는 화합물과 단백질의 예측뿐만 아니라 딥러닝 기술 기반 단백질의 설계까지 가능해졌는데, 이를 활용하여 새로운 항원에 대한 발견 후 대응할 수 있는 단백질 구조를 만들어 신약에 대한 정확도와 효율성을 높이고자 접근하고 있다. 또한 단백질과 단백질 간의 결합에 있어서도 기술의 발전이 빠르게 이루어지고 있는데, 구글의 알파폴드(Alpha-fold) 기술도 제한적인 구조 결합에 있어서는 매우 높은 예측률을 보이고 있고, 출시 후 약 2년 만에 후속 기술인 알파폴드2를 출시함으로써 기술이 매우 빠르게 발전하고 있음을 느낄 수 있다. 이를 수치로 환산하면 약 60년간의 시간 동안 17만 개의 구조를 밝혔던 것을 100만 종의 생명체에서 2억 개 이상의 단백질을 수개월 만에 모두 예측할 수 있게 된 것이다 [4]. 이러한 예측 모델의 발전으로 인해서 단백질과 화합물에 결합 예측 모델을 만드는 방법들이 개발되고 있으며, 큰 틀에서의 설계는 공개된 사용 가능한 단백질 구조들을 기반으로 가지고 있는 구조와 결합력을 예측하여 가장 대표적인 결합력을 보이는 리스트를 선별하고 그에 대한 결합력과 관련된 예측도를 기반으로 점수 기반 정량화하여 확인한다 (그림 1).
이렇듯 딥러닝 기술을 활용하여 타깃에 대한 정량적인 예측을 할 수 있는 구조 리스트를 선별하고, 신약 후보물질의 효능 및 부작용에 대한 예측 하는 방법은 현재까지 인공지능을 활용한 신약개발 과정에서 가장 많이 활용되고 있는 기술이며 가장 많은 인공지능 활용 신약개발회사들이 참여하고 있다. 기존 개발기간인 5년여의 기간을 획기적으로 단축하고 정확도를 높이는 과정을 넘어, 해당 약물들이 실제 임상 3상에서 효능을 입증하여 성공사례가 나오게 되면 인공지능을 이용한 신약개발 프로세스는 신약개발 회사의 보편적인 프로세스가 될 것으로 사료된다.
바이오산업 분야의 시장규모는 2020년 전 세계 기준으로 11조 3,183억 달러였으며, 연평균 6.1%의 성장률로 2026년까지 16조 1,919억 달러 규모로 증가할 것으로 예측하고 있다. 바이오산업은 기존 산업 분야 뿐만 아니라 의약품, 농업, 화학 및 에너지 등 다양한 분야에서 혁신적인 제품과 서비스를 개발하여 사회적, 경제적 가치를 창출할 수 있기 때문에 미래에 더욱 중요한 산업군으로 인식되어 시장규모가 크게 증가될 것으로 전망하고 있다. 한국의 바이오산업은 2020년에 전 세계 시장규모 대비 1.5%의 점유율을 가지며, 1,718억 달러 규모로 연평균 8%의 성장률을 기록하여 2026년에는 2,699억 달러로 글로벌 시장규모의 1.7%를 차지할 것으로 예상된다. 이는 한국 바이오산업 분야가 글로벌 시장에서 빠른 성장세를 나타낼 것으로 전망하고 있으며, 이러한 시장지표는 국내 바이오산업 분야의 발전 가능성을 나타내고 있다 (표 1) [2].
2.3. 실제 임상시험과의 매칭을 통한 약물반응성 예측
앞서 정확한 타깃을 도출하고, 타깃을 표적으로 한 약물 개발에 대한 시간을 단축하고 예측률을 높여 신약개발의 주요 과정들을 진행했다면, 실제로 예측한 환자에 대해서 약물이 어떻게 반응하는지 추적관찰하는 것은 매우 중요하다. 딥러닝 등의 기술이 효과를 발휘하기 위해서는 이 과정이 정확하게 들어맞아야 해당 입력 데이터(Input data)에 대한 출력 데이터(Output data)를 정확하게 예측할 수 있다.
글로벌 임상시험의 내용을 확인할 수 있는 Clinical trial.gov 사이트에서 검체를 이용한 유전체 분석 사례들을 확인하면, 2010년까지는 조직에서 RNA sequencing을 수행한 사례가 임상에서는 많지 않았다. 그렇지만 그 수는 2015년부터 증가하기 시작하여 관찰연구 (observentional study) 분석 및 중재연구(interventional study) 분석에 있어서 모두 높아지기 시작했다. 특히 2018년도부터는 single cell RNA sequencing을 활용한 임상연구가 급증하기 시작했으며, 국내에서도 이러한 분석 기법을 도입한 임상이 일부 바이오벤처기업 및 중견기업에서 진행되고 있다. 실제 임상시험에서 활용되는 사례 등을 바탕으로 약물 투여 전과 약물 투여 후의 유전체 정보 등을 이용해서 특정 DNA에 변이가 있는 환자들에게서 나타나는 특징적인 RNA 발현을 확인하거나, 단백체 관련 정보를 확인할 수 있다.
앞서 질환에 대한 타깃을 도출하는 과정에 있어서는 진행하고 있는 임상 데이터나 확보한 데이터가 아니더라도 public 한 데이터들을 확보해서 진행이 가능하지만, 약물에 대한 실제 정보는 해당 약물을 투여하기 전과 후에만 확보가 가능하므로, 이에 대한 임상샘플에 대한 심도 있는 분석은 임상시험의 다음단계로 넘어가기 위한 필수적인 요소가 되고 있다. 동반진단(Companion diagnostics, CDx)의 경우 처음에는 DNA단계의 변이를 확정하는 단계부터 시작하였지만, 최근에는 환자의 특정 시점의 조직에서의 RNA의 발현 패턴을 통한 체외진단다지표검사(Multivariate index assay, MIA) 등을 통한 상세 적응증을 확인할 수 있는 시험법의 공동개발을 FDA에서 먼저 권장하고 있다 [11].
현재는 후향적인 연구를 넘어서 전향적인 연구를 위해서도 임상시험계획 승인신청 (Investigational new drug, IND) 서류에 유전체 분석을 포함하는 방향으로 연구가 진행되고 있다. 임상 1상 및 2상에서 얻어진 데이터들을 바탕으로 약물 반응성과 매칭해서 특정 바이오마커를 가지고 있는 환자로부터 개발하고 있는 약물이 잘 반응할 것으로 예측하는 과정에도 딥러닝 기술을 사용하고 있는데, 기계학습에서 가장 고전적인 방법 중 하나인 랜덤포레스트(random forest) 방식을 통한 결정 트리(Decision Tree)를 활용해서 RNA 발현 마커 3-4만여 개의 옵션에서 약물 반응성과의 매칭을 통해 특정 환자군 선별에 활용하고 있다. 해당 예측 모델을 통해서 임상 1상, 임상 2a상에서 여러 가지 파이프라인을 가지고 있는 경우 가장 적합한 파이프라인을 선별하는데 도움을 줄 수 있으며, 약물이 잘 작용하지 않는 환자군들을 대상으로 특정한 양상이 확인된다면, 해당 환자군을 대상으로 한 병용투여 등의 약물 설계 등이 가능하다 [12].
3. 결론
인공지능의 발달로 인해 많은 수의 데이터에 대해서 정확하고 효율적으로 분석 가능한 속도가 점차 가속화되고 있다. 현재 가지고 있는 데이터는 앞으로의 축적될 데이터에 비하면 극소수의 정보라고 볼 수 있으며, 분석 플랫폼들의 발전도 점차 빨라져서 나날이 데이터의 양은 정밀하고 방대하게 축적되고 있다. 이미 많은 회사들이 유전체 정보를 활용해서 환자의 특성을 분류하는 방법을 병원의 의사들에게 전달하고, 의사들은 그에 따른 약물을 처방하고 있으며, 관련 결과가 연구진들을 통해 유의미한 분석으로 매년 학회에서 뜨거운 이슈로 발표되고 있다. 또한 분석 사례가 많아 짐에 따라 기존에는 같은 환자로 분류되던 경우에도 세부적으로 적용 가능한 적응증의 수가 점차 증가하고 있다.
위와 같은 세분화된 임상정보를 바탕으로 타깃의 정확도를 선별할 수 있는 데이터 들을 바탕으로 지금보다도 많은 인공지능 신약개발회사들이 데이터들을 활용하여 신약을 개발할 것이며, 예측 기술을 바탕으로 시간 단축과 정확도가 높아지게 되면 지금보다 더 낮은 장벽으로 많은 제약회사들이 생기고 신약개발의 수도 증가할 것으로 보인다. 또한 임상과정 동안의 약물 반응을 바탕으로 축적된 데이터를 인공지능을 통해 약물 투여 전 환자에게서 약물반응성이 예측모델을 통해 확인이 가능해질 것이며, 정확도가 점점 높아짐에 따라 최소한의 실험만 진행하여 활용도 높은 약물개발이 가능해질 것이다. 이는 정확한 환자 분류 및 약물반응성에 대한 분류를 세분화시키는 원동력이 될 것이며, 그에 적합한 약물을 처방하는 것은 저렴한 비용에 가능해지는 상황이 올 것이다. 이렇듯 신약개발의 접근 방법이 최신화되면서 제약회사뿐만 아니라 병원에서도 환자에게 정보를 제공할 수 있는 다양한 산업들이 증가할 것이다.
4. 고찰
다만, 아직까지는 인공지능을 활용한 신약개발에도 제한점이 존재한다. 환자의 정확한 데이터를 확보하는 데 있어서 아직까지는 최신 분석법을 활용한 데이터의 양이 충분하게 공개되거나, 암과 같은 특정 질환에 국한한 데이터에 집중되어 확보되어 있다는 점이 일차적인 한계로 생각한다. 많은 수의 인공지능 신약개발회사들이 일부 자체적으로 내부 데이터를 활용하고 있기는 하지만, 결국 자본적인 한계로 제한적인 질환에서의 공공데이터의 활용에 많은 의존을 하고 있다. 활용할 수 있는 데이터의 수가 늘어나거나 조금 더 공격적인 투자를 통한 양질의 데이터를 확보하기 위해서는 획기적인 성공사례가 나타나서 따른 데이터의 질과 양이 선순환될 필요가 있다. 현재 인공지능을 통한 신약개발은 임상 2상 정도에 진입해 있는 걸음마 단계이기 때문에, 실제 효능을 입증할 수 있을지 의구심도 일부 존재하지만 초기 개발을 주도한 몇몇 회사에서 성공적으로 증명해 낸다면 인공지능을 활용한 개발은 신약개발의 판도를 바꿀 수 있으리라 생각한다.
5. 참고문헌
==>첨부파일(PDF) 참조
![]() | ||
| ||
![]() |
본 게시물의 무단 복제 및 배포를 금하며, 일부 내용 인용시 출처를 밝혀야 합니다.
자료열람안내
본 내용은 BRIC에서 추가적인 검증과정을 거친 정보가 아님을 밝힙니다.
내용 중 잘못된 사실 전달 또는 오역 등이 있을 시 BRIC으로 연락(view@ibric.org) 바랍니다.