최신 연구동향 정보를 제공하기 위해 생명과학관련 정보제공자를 모집합니다.
Bio리포트 동향리포트
바이오 신약 개발 회사의 인공지능 활용 동향
윤희선, 정희진(홍익대학교)
목 차
1. 서론
2. 본론
2.1. 바이오 신약개발에 사용되는 인공지능
2.1.1. 머신러닝과 딥러닝
2.1.2. 약물 후보 물질 발굴
2.1.3. 단백질 구조 예측
2.1.4. 임상 시험 최적화
2.1.5. 맞춤형 의약품
2.1.6. 약물 재창출
2.1.7. 독성 예측
2.2. 인공지능 기술을 활용한 바이오 신약 개발 기업
2.2.1. Insilico Medicine
2.2.2. Exscientia
2.2.3. Recursion Pharmaceuticals
2.2.4. DeepMind
2.2.5. Atomwise
2.2.6. BenevolentAI
2.2.7. Moderna
2.2.8. International Business Machines
2.3. 인공지능 기반 신약개발을 위한 과제
3. 결론
4. 참고문헌
1. 서론
인공지능(artificial intelligence, AI)은 인간의 논리적 사고, 문제 해결, 언어 이해 등의 지능을 컴퓨터 시스템이 구현하여 데이터와 알고리즘을 통해 ‘학습’하고, ‘경험’을 바탕으로 문제를 해결한다. 사람이 언어를 이해하고 이를 바탕으로 의사소통을 한다면, AI는 방대한 양의 데이터를 바탕으로 언어 및 패턴에 대한 규칙을 학습하고 자연어 처리 기술을 통해 의사소통을 한다. AI가 방대한 데이터를 빠르게 조사하고 규칙을 찾기 위해 사용되는 핵심 기술이 머신러닝(machine learning)과 딥러닝(deep learning)으로, 이 기술은 데이터를 분석하고 이를 AI가 학습하여 성능을 향상시키도록 한다. AI는 대량의 데이터를 신속히 처리하고 그 과정에서 패턴을 찾으며, 이를 학습한 AI는 새로운 데이터가 입력되었을 때 이에 대응하여 기 학습한 내용을 바탕으로 예측 및 결정을 한다. 현시점에서는 특정 작업에 특화되어 학습하고 그 범위 안에서 작업 성능을 최적화하는 narrow AI가 실용화되고 있으며, 사람의 뇌처럼 과정을 이해하고 창의적 사고를 바탕으로 다양한 작업을 수행할 수 있는 general AI는 개발 초기 단계에 있다 [1].
1990년대부터 데이터 처리 능력이 향상되면서 AI 기술이 본격적으로 발전하기 시작했다. 전통적인 알고리즘과 규칙 기반 시스템을 활용한 AI 기술이 개발되기 시작하였으나 당시의 컴퓨터의 성능은 이를 다루기에 제약이 많았다. 하지만 후에 발전할 딥러닝의 기초가 된 인공신경망(neural networks) 연구가 이루어졌다 [2]. 2000년대에는 대규모 데이터(big data)를 활용한 패턴 인식 및 예측 분석 기술이 본격화되었으며, 다양한 머신러닝 알고리즘이 개발되었다. 이 시기에 후술 하는 그래픽처리장치(graphics processing unit, GPU)는 주로 게임과 그래픽 처리에 사용되었다. 2010년대에는 대량의 데이터를 빠르게 처리할 수 있는 GPU의 획기적인 발전으로 인해 딥러닝 훈련 속도가 혁신적으로 단축되었다. 컴퓨터의 운영체제를 실행하고 작업을 관리하여 컴퓨터의 뇌에 해당하는 중앙처리장치(central processing unit, CPU)는 개별적인 작업을 처리하는데 특화되어 복잡한 연산을 순차적으로 처리할 수 있다. 고전적인 하드웨어인 CPU와는 달리 GPU는 여러 가지 작업을 병렬로 처리할 수 있어 대량의 데이터를 신속히 처리하는데 높은 성능을 나타내었고, 이는 딥러닝 훈련에 적합하였다 [3]. 합성곱 신경망, 순환 신경망 등의 복잡한 신경망이 개발되었고, 음성 인식(Siri, Alexa), 이미지 분석(구글 렌즈), 자연어처리(구글 번역) 등이 일상생활에서 사용되기 시작하였다. 2020년대에는 AI가 전 세계적으로 다양한 분야에서 핵심 기술로 자리 잡으며 더욱 고도화되었다. 사람처럼 텍스트를 이해하고 생성하는 GPT와 같은 초거대 언어모델이 개발되어 대화형 AI시스템이 현실화되었다. 사회의 전반적인 영역에서 AI가 활용되고 있고 산업 전반에서 그 중요성이 점차 강조되고 있으며 바이오의약 분야에서도 본격적으로 도입되고 있다. 특히 제약 산업 분야에서 약물 발견, 생물학적 데이터 분석, 단백질 구조 예측, 임상 시험 최적화, 환자 맞춤형 의약품 개발, 약물 재창출, 약물 독성 예측 등에 대한 연구 개발 프로세스를 가속화하는데 중추적인 역할을 하고 있다 [4].
신약이 개발되면 전 세계적으로 파급되어 건강 및 보건에 핵심적인 역할을 하지만, 평균 10-15년이 소요되며 성공 확률이 낮다. 한 종류의 신약이 개발되기까지 수차례의 실험과 임상시험이 필요하며 실패할 경우 경제적 손실을 초래하기 때문에 기업 및 연구기관에서 개발하는 신규 발굴 신약 종에는 한계가 있다. 하지만 AI는 신약 개발 단계에서 생물학적 데이터 분석을 통해 약물 후보 물질의 스크리닝 및 구조 분석을 효율적으로 수행하고, 약물과 단백질 간의 상호작용을 예측하여 치료 효능을 향상시키며, 임상 시험 최적화 단계에서 실험 비용과 시간을 줄이는 등 개발 효율성을 획기적으로 향상시킨다. 특히 AI가 보유하는 방대한 양의 실험 데이터를 신속히 분석하고 복잡한 질환 메커니즘을 이해하여 기존 약물의 효능을 재발견하는 기능은, 연구의 효율성을 높이는 것을 넘어 신약개발의 방식을 근본적으로 변화시키고 있다. 이는 전 세계적인 의료 혁신의 촉진 및 인간의 건강과 삶의 질을 향상시키는 중요한 원동력이 된다.
본고에서는 AI를 기반으로 한 신약 개발의 동향과 함께 바이오 제약 업계에서의 AI 기술 활용 사례를 정리하고, 향후 해당 기술이 어떻게 제약 산업의 혁신을 이끌어갈지에 대한 전망을 제시한다.
2. 본론
2.1. 바이오 신약개발에 사용되는 인공지능
2.1.1. 머신러닝과 딥러닝
신약 개발을 위해서는 방대한 데이터 분석과 복잡한 패턴 탐색이 필요되는데, 기존에는 많은 양의 생물학적, 화학적 데이터를 사람이 직접 분석하였고, 그 과정에서 많은 시간과 비용이 소요되었다. 하지만 머신러닝을 활용함으로써 데이터 분석 속도와 정확성이 획기적으로 증가되었다. 특히 딥러닝을 활용하여 복잡한 패턴과 상관관계를 파악할 수 있어 기존에는 발견하지 못했던 새로운 결과를 발견함으로써 새로운 신약 후보 물질 개발 기술로 재규명되고 있다.
신약 개발에 사용되는 머신러닝 기술은 세 가지로 대표될 수 있는데, 그중 한 가지인 지도학습은 랜덤 포레스트, 서포트 벡터 머신과 같은 알고리즘을 바탕으로 기존의 레이블이 있는 데이터를 처리하여 예측 모델을 학습시켜 약물과 단백질 사이의 상호작용 예측, 약물 효능 평가, 독성 예측에 활용된다. 비지도학습은 K-평균 클러스터링 및 주성분 분석과 같은 기법을 통해 레이블이 없는 데이터를 분석하여 약물 구조 분석 및 약물 간 유사성을 바탕으로 그룹화하는데 사용된다. 강화학습은 딥리워드 생성모델 등을 통해 목표하는 특징을 가진 화합물을 최적화하거나 생성하는 약물 설계에 활용된다 [5, 6].
머신러닝은 데이터에서 찾은 규칙에 기반하여 새로운 데이터를 처리하는 데이터 기반 학습을 통해 결과를 예측하는 기술이다. 머신러닝의 한 종류인 딥러닝은 데이터로부터 특징을 자동으로 추출하여 학습한다. 따라서 사람이 데이터를 분석하고 특징을 추출하여 알고리즘에 입력하는 것이 주가 되는 머신러닝과는 달리 딥러닝은 데이터에서 자동으로 특징이 추출되기 때문에 사람이 데이터를 처리하는 과정이 생략된다. 딥러닝은 머신러닝 보다 복잡한 특성을 인식하고 이를 위해 대량의 데이터와 정교한 계산 능력을 요구한다. 신약 개발에서 활용되는 딥러닝 기술에는 합성곱신경망(Convolutional Neural Network, CNN), 순환신경망(Recurrent Neural Network, RNN), 생성적적대신경망(Generative Adversarial Network, GAN)이 있다. 약물과, 약물이 결합하는 단백질의 2D 이미지가 입력되면 CNN을 통해 결합부위가 학습되어 약물-단백질 결합 분석 및 분자 구조 예측에 사용되며 기존의 계산 화학적 방법을 통한 결합 및 구조 예측보다 신속하고 정확한 분석이 가능하다. RNN은 데이터의 흐름을 시간 경과에 따라 처리할 수 있기 때문에 시간에 따른 체내에서의 약물의 반응, 시간 경과에 따른 약물의 효능 변화 등의 약물의 동적 반응을 예측하는 데 사용된다. 또한 단백질 서열을 입력하여 그 구조를 예측할 수 있다. GAN은 생성자신경망과 판별자신경망이 경쟁하며 학습하는 구조로, 신약개발에서는 생성자신경망이 새로운 분자구조를 생성하고 판별자신경망이 생성된 분자 구조가 실제 약물과 얼마나 유사한지를 평가하여 정교성을 점차적으로 증가시켜 최종적으로 기존 화합물의 한계를 극복한 새로운 약물 후보 물질을 발굴한다 [7-10].
2.1.2. 약물 후보 물질 발굴
AI는 머신러닝 및 딥러닝 알고리즘을 사용하여 화합물의 물리화학적 특성, 생물학적 특성, 단백질-화합물 상호작용 등에 대한 데이터를 신속하고 정확하게 분석한다. 이를 통해 약물 후보 물질을 선별하고, 효능과 안전성을 평가한다. 예를 들어, 약물로 사용되는 화합물의 용해도, 분자량, 극성표면적 등을 파악하여 약물이 체내에서 작용하는 기전 및 치료 타깃 분자와 약물 상호 간의 작용을 예측한다. 또한 방대하고 복잡한 유전체학, 단백질체학 등의 생물학적 데이터를 분석하여 질병의 메커니즘을 제시하고, 질병의 원인이 되는 유전자 변이, 단백질 변화 형태를 발견하여 그에 맞는 효과적인 치료법을 제시한다 [11-13].
2.1.3. 단백질 구조 예측
DeepMind社의 AlphaFold와 같은 AI 시스템은 아미노산 배열 정보를 바탕으로 단백질의 입체구조를 예측하는데 중추적인 역할을 한다. 기존에 단백질 구조를 규명하는 방법으로는 단백질을 고순도로 대량생산한 후 X-ray 결정구조를 파악하는 실험적 방법이 사용되었다. 이 방법은 고순도로 재조합 단백질을 대량생산하는 것이 필요하기 때문에 많은 시간과 비용이 소요되었고, 재조합 단백질을 발현하기 위한 최적화 과정이 요구되었다. 반면에 AlphaFold 시스템은 단백질을 구성하는 아미노산 배열로 입체구조가 예측 가능하기 때문에 재조합 단백질을 대량생산하지 않아도 아미노산 배열 정보만으로 실행 가능하다 [14, 15]. 현시점에서 AI를 통해 예측한 단백질 구조가 실제 단백질 구조와 100% 일치하지는 않지만, 앞으로 실험적인 방법으로 단백질 구조를 규명한 데이터가 더욱 증가된다면 그 데이터를 AI가 학습하여 점차적으로 AI의 정확성이 향상될 것이기 때문에, 실험적인 결정구조 파악과 AI를 통한 예측 양쪽 모두가 활발히 진행됨이 기대된다.
2.1.4. 임상 실험 최적화
AI는 환자의 유전자 정보, 질병 이력, 생활 습관 등의 데이터를 분석하여 치료에 적합한 환자군을 선정하고, 실험 설계를 최적화하여 임상 실험 시간과 비용을 절감시킨다. 유전자 변이 및 유전자 발현 패턴을 분석하여 유전자 편집 기술을 기반으로 하는 약물 및 유전자 치료제가 효능을 나타낼 수 있는 환자를 선별한다. 그리고 약물의 효능에 영향을 미칠 수 있는 환자의 장기적인 데이터를 파악하여 그에 적합한 약물을 투여한다 [16].
통계적 모델링과 학습을 통해 샘플 수 및 통계적 유의성을 고려하여 임상 실험 계획을 수립하고, 실제 실험에서 발생할 수 있는 다양한 변수에 대비할 수 있도록 한다. 그리고 임상 실험에서 도출된 데이터를 실시간으로 분석하고 이를 통해 실험 결과를 예측하여 보다 많은 환자수가 필요한지, 실험 방법을 변경해야 하는지 등의 실험 설계를 조정한다. 이를 통해 임상 실험의 효율성을 높이고 불필요한 비용과 시간을 감소시킨다.
2.1.5. 맞춤형 의약품
AI는 유전자데이터, 환자의 생체 신호, 병력 등을 분석하여 개인화된 치료법을 제시한다. 이를 통해 환자에게 최적화된 맞춤형 의약품을 개발하고, 환자별로 최적화된 치료 계획을 수립한다. 환자의 유전자 정보를 분석하여, 개인의 유전자 변이와 유전자 발현 패턴을 파악함으로써 환자 개개인마다 상이한 특정 질병에 대한 유전적 취약성을 확인하고, 유전자 차이에 따른 약물 반응 차이를 예측한다. 예를 들어, 유전자 분석을 통해 약물 대사가 빠른 환자에게는 투여 용량을 조절하고, 특정 약물이 효과적이지 않은 환자에게는 다른 치료법을 제시한다. 그리고 환자의 심박수, 혈압, 혈당 수치 등의 생체 신호를 실시간으로 분석하여 심혈관 질환의 위험을 예측하고 약물 투여양을 조절한다. 웨어러블 기기를 통해 환자의 건강 데이터를 모바일로 실시간으로 계측하고 수집하는 것 또한 AI를 통해 효율적으로 진행될 수 있다 [17, 18].
2.1.6. 약물 재창출
AI는 기 승인된 약물이 다른 질병 치료에도 효과가 있을 수 있는 가능성을 재발견하여 기존 약물에 대한 새로운 적응증을 찾는다. 기존 약물의 부작용 데이터와 약리학적 프로파일을 분석하여 다른 질병에 적용할 때 발생할 수 있는 부작용을 예측함으로써 안전성을 평가하고, 임상 시험을 통해 리스크를 최소화할 수 있다. 기존 약물은 체내 안전성이 검증되어 있기 때문에 임상 실험 단축 등 새로운 약물을 개발하는 데 필요한 시간과 비용을 절감할 수 있다. 예를 들어 Thalidomide 약제는 처음에는 임신구토증 진정제로 사용되었지만, AI를 통해 이 약물이 다발성 골수종 치료에 효과적이라는 것을 발견하게 되었다 [19]. Raloxifene 약제는 폐경 후 여성의 골다공증 치료제였지만, AI의 약물의 작용 기전과 호르몬 수용체 상호작용 분석을 통해 유방암 예방에도 효과적이라는 가능성이 제시되었다 [20]. 또한 AIDS 치료제에 사용되는 Lopinavir와 Ritonavir 약제는 AI를 통해 COVID-19 치료 가능성이 제시되었다 [21].
2.1.7. 독성 예측
전통적으로 독성 예측은 동물 실험을 통해 이루어지는데, 이는 비용이 많이 들고 시간이 오래 걸려 다양한 독성 유형을 평가하는데 제한이 있다. AI는 약물이 체내에서 유해한 영향을 미칠 가능성을 예측하고 약물 개발 초기 단계에 심장 독성 등 독성이 높은 물질을 제외시켜 약물의 안전성을 확보하고, 임상실험 성공률을 증가시킨다 [22]. 또한 독성 패턴을 학습함으로써 새로운 패턴을 예측하여 부작용을 미리 파악할 수 있다. 단, AI가 학습할 수 있는 고품질 독성 데이터가 부족할 경우에 예측 모델의 성능이 저하될 수 있으며, 체내에서 화합물이 실제로 어떻게 작용하는지 모든 변수를 고려하기에는 한계가 있어 현시점에서 AI예측기술은 초기 단계에서의 독성 파악에 사용되고 최종적인 독성 평가는 동물 실험 및 임상 실험이 수반된다.
2.2. 인공지능 기술을 활용한 바이오 신약 개발 기업
2.2.1. Insilico Medicine
Insilico Medicine社은 WuXi AppTec社와 Alan Aspuru-Guzik社와 공동으로 신약 후보 물질 발굴을 위해 약물의 화학적 구조와 생물학적 효과를 예측하는 머신러닝과 딥러닝 기반 플랫폼인 generative tensorial reinforcement learning (GENTRL)을 구축하였다. 그 후 Insilico Medicine社는 Genentech社의 의뢰를 받아 GENTRL을 활용해 섬유증 발병 원인 단백질 DDR1의 활성을 억제하는 저해제 후보 물질 6개를 3만 종류의 후보군으로부터 선별하였는데, 이 과정은 단 21일 만에 완료되었고, 소요비용은 15달러였다. 이는 Genentech社의 DDR1저해제의 개발에 8년의 기간과 수백만 달러가 소요된 것과 비교되는 성과였다. GENTRL은 강화학습, 변분추론, 텐서분해를 융합한 알고리즘을 바탕으로 하여 화합물의 합성가능성, 표적에 대한 효과, 문헌 및 특허에 기재된 분자에 대한 신규성을 고려하여 타깃 분자를 선별한다. Insilico Medicine社은 선별한 후보물질을 합성한 후 in vitro에서 저해활성을 평가한 assay를 수행하였고, 활성을 나타낸 4종의 후보군 중 가장 높은 활성을 나타낸 2종을 대상으로 하여 세포 기반 저해활성 및 대사안정성 실험을 수행하였다. 이 과정은 25일 안에 수행되었으며, 최종적으로 1종의 후보군을 대상으로 하여 마우스를 사용한 약물 동태 프로파일링과 양자화학계산에 의한 저해 메커니즘 추정을 포함한 in vivo 평가 및 전임상 평가가 두 달 안에 완료되었다. 최종적으로 6종의 후보물질 중 1종이 마우스를 사용한 실험에서 효능을 발휘하였다 [23, 24].
2.2.2. Exscientia
2020년에 영국의 인공지능 신약개발 스타트업 Exscientia社와 일본의 제약사 Sumitomo Dainippon社가 공동으로 AI를 활용하여 강박장애 치료 후보 물질인 세로토닌수용체 작용제 DSP-1181을 발굴하였다. 임상 1상 시험 진입 전까지의 해당 약물 발굴 기간은 약 12개월로, 약물 후보물질 도출에 5년 이상이 소요되는 종래의 기간을 획기적으로 단축시켰다는 점에서 AI기반 신약개발의 잠재력을 제시하였다. Exscientia社의 Centaur Chemist 플랫폼은 머신러닝을 통해 저분자 화합물 디자인과 약물 발견 과정을 가속화하는데 중점을 두어 개발된 플랫폼으로 이를 이용할 경우 후보물질 발굴에 소요되는 시간은 전통적인 약물 발굴 방식의 1/5이다(2500개의 화합물 중 한 개의 신약 개발이 500개의 화합물로 단축. 5년의 기간이 1년으로 단축). 예측모델이 고려하는 대상은 표적분자의 저해 및 활성화, 선택성, 합성 실현성, 구조적 신규성 등이다. Exscientia社는 이외에도, 여러 GPCR 중에서 두 가지 GPCR에 선택적으로 작용하는 이중특이성 리간드 약제를 개발하였고, 파킨슨병 치료 분야 및 암면역 분야에서 효능을 나타냄이 알려진 아데노신 A2a수용체에 선택적인 길항제(antagonis)를 개발하였다 [25]. Exscientia社는 Sumitomo Dainippon社 이외에도 Sanofi社, Roche社 등의 글로벌 제약회사와 파트너십을 체결하였으며, Evotec社과의 협력으로 발굴한 면역항암제 EXS21546은 임상 1상이 진행되어 고형암 치료제로 개발되고 있다 [26].
2.2.3. Recursion Pharmaceuticals
2013년에 설립된 미국 기업 Recursion Pharmaceuticals社는 대규모의 생물학적 이미지, 유전자 데이터, 화학적 데이터, 약물 작용 메커니즘, 독성 규명 등을 AI를 통해 처리하고 분석한다. 뇌의 혈관이 확장되고 불규칙해지는 등 비정상적으로 형성되어 혈액이 뇌나 척수로 새어 뇌 기능에 영향을 미치는 난치병(뇌해면체 기형)을 치료하는 약물 REC-994를 발견하였다 [27]. 이때 AI를 활용하여 혈관 기형과 관련된 유전자와 생리학적 패턴을 분석하고, 기존의 약물 데이터베이스와 실험 데이터를 바탕으로 효과적인 치료 후보 물질을 도출했다 [28]. 이 사례는 AI가 신경계 질환과 같은 복잡한 뇌 질환을 치료할 수 있는 약물개발에도 활용될 수 있음을 제시하였다. Recursion Pharmaceuticals社는 신약개발을 위한 AI플랫폼인 Recursion OS를 자체적으로 구축하였고 자동화 데이터 생성, 실험 이미징 데이터 분석, 데이터베이스 관리에 응용하여 질환에 대한 세포 표현형 변화, 약물 반응에 대한 정보를 제공하여 신약 후보 탐색에 활용한다. 2024년 8월 Recursion Pharmaceuticals社는 상기한 Exscientia社를 흡수합병 하였다.
2.2.4. DeepMind
Google DeepMind社에서는 단백질의 3차원 구조 예측에 특화된 AI플랫폼인 AlphaFold를 개발하였다 [14, 15]. 2018년에 개최된 단백질 구조 예측 대회(CASP13)에서 AlphaFold는 template 구조가 없는 도메인의 구조를 예측하는데 성능을 나타내 43개의 도메인 중 24개에서 기존의 예측 방법들보다 정확도가 향상된 성과를 기록하여 단백질 구조 예측의 새로운 가능성을 열었다 [29]. AlphaFold를 바탕으로 단백질 구조 분석이 신속히 수행되었고, 이는 약물-단백질 상호작용 예측 및 약물 설계 과정의 효율성 상승으로 연계되었다. 현재 AlphaFold는 단백질의 결합구조까지 정확히 ‘예측’하는 AlphaFold3까지 개발되었으며, 표적 단백질에 결합하는 단백질을 ‘설계’하는 AlphaProteo가 2024년 9월 공개되었다. AlphaProteo는 AlphaFold의 1억 개 이상의 구조 예측 데이터와 Protein Data Bank(실제로 단백질의 결정구조를 파악하여 제시된 단백질 입체구조의 데이터베이스)의 데이터를 사용하여 분자가 결합하는 방법을 학습한다. 그 후 목적 단백질의 구조와 우선 결합 위치 데이터가 주어졌을 때 해당 위치에서 목적 단백질에 결합하는 단백질 후보를 생성한다. 목적 단백질은 감염 관련 단백질인 BHRF1(엡스타인바 바이러스 발현 단백질)과 SC2RBD(코로나바이러스 스파이크 단백질 수용체 결합 도메인) 및 암, 염증, 자가면역증에 관련된 단백질인 IL-7 Ra, PD-L1, TrkA, IL-17A, VEGF-A에 해당하는 7종류의 단백질이다 [30].
2.2.5. Atomwise
미국 Atomwise社는 2015년 인공지능시스템 AtomNet을 개발해 이용해 화합물의 구조 분석 및 상호작용 분석을 통해 해당 화합물이 타깃으로 하는 질병을 예측하였다 [31]. 하루에 100만 개의 화합물을 선별하여 대규모 화합물 데이터베이스를 신속하게 스크리닝 하고 고효능 물질을 식별한다. Atomwise社는 International Business Machines (IBM)社의 슈퍼컴퓨터를 사용하여 시판 중인 7000종의 약물 중에서 에볼라에 치료 효과가 있는 후보 물질 두 개를 하루 만에 선별하여 큰 주목을 받았고, Merck社를 포함한 다양한 제약회사들과 협력하여 신경질환, 암, 파킨슨병 등의 질환을 타깃으로 한 치료제를 개발하고 있다 [32, 33].
2.2.6. BenevolentAI
영국 BenevolentAI社는 AI를 통해 질병 메커니즘을 분석하고, 치료가 필요한 질병을 타깃하는 약물을 설계한다. 기존에 자체적으로 수행한 연구에서 얻은 데이터를 AI에 학습시켜 2019년 알츠하이머병 치료제 개발을 위한 후보 물질을 도출하였다. 2019년에 AstraZeneca社와의 공동연구를 통해 AI를 사용하여 만성신장질환, 특발성폐섬유증에 대한 신규 표적을 발굴함에 이어 2022년에는 전신홍반성루푸스, 심부전증의 치료제 개발을 진행 중이다 [34, 35].
2.2.7. Moderna
mRNA 백신 및 치료제 개발 전문 기업 Moderna社는 최근 AI를 활용한 신약 개발에도 적극적으로 나서고 있다. AI 및 데이터 분석 기술을 사용하여 새로운 약물과 백신 후보 물질을 발굴하고 있으며, 2023년 지질 나노입자 구조 최적화를 최적화하고 mRNA를 캡슐화하는 과정에 IBM社의 AI플랫폼인 MoLFormer를 적용해 mRNA 기반 치료제를 설계하였다. MoLFormer는 11억 개 분자의 데이터를 기반으로 하여 분자의 입체구조 및 혈액내장벽 통과 기능 등의 물리적 특성을 예측한다 [36-38].
2.2.8. International Business Machines
IBM은 환자의 유전자 정보, 병력, 의료정보를 수집하고 임상 실험 조건을 분석하여 환자에게 적합한 의료 시스템을 제시하기 위해 Watson for Oncology(암환자 진료), Watson for drug discovery(신약 개발), Watson for Genomics(유전체 분석), Watson for Clinical Trial Matching(임상실험 환자 매칭) 등의 AI기반 ‘Watson 진단 서비스’를 개발하였다. Watson for Oncology는 의학 저널, 연구 논문, 임상 가이드라인 등에 제시된 임상 데이터를 분석하여 유방암, 폐암, 대장암을 포함한 암 질환에 대한 정보를 제공하고, 이를 통해 의사가 환자에게 적합한 개인 맞춤형 치료법 선정하는 것을 돕는다 [39, 40]. Watson for drug discovery의 예로, 암억제 유전자인 p53을 활성화시키는 인산화효소를 예측하기 위해 p53에 관한 7만 건의 논문을 분석한 결과, 기존에 알려진 효소에 더하여 6가지 신규 효소를 발견하였고, Baylor College of Medicine의 in vitro 및 in vivo 연구를 통해 실제로 해당 효소 NEK2가 p53(Ser315의 인산화)에 영향을 미침이 밝혀졌다 [41].
하지만 의료 데이터에 대한 신뢰성 및 정확성 부족, 높은 비용 등에 대한 문제로 인해 IBM은 2022년 Watson for Oncology 사업을 중단하였다. 유사한 이유로 Watson for drug discovery도 2019년 중단되었고, Watson for Genomics도 2020년 중단되었다.
2.3. 인공지능 기반 신약개발을 위한 과제
AI를 활용한 신약 개발은 아직 초기 단계이기에 현시점에서 몇 가지 한계점이 존재하며, 이는 신약 개발의 각 단계에서 AI를 보다 효율적이고 안전하게 적용하는데 중요한 과제가 된다. 예를 들어, 현시점에서의 AI는 기존의 데이터를 학습하여 결과를 도출하기 때문에, 대용량의 자료에 약물 관련 효능 및 안전성에 대한 내용뿐만 아니라 생물학적 기초연구 결과 등 다방면의 관점에서의 내용이 포함되어야 한다. 특히 생체의 복잡함을 계산적으로 완벽히 구현할 수 없기 때문에 가능한 한 다양하고 많은 수의 임상 데이터가 필요하다 즉, AI학습을 위해서는 많은 양의 데이터가 필요한데, 현재 의약 분야에서 활용 가능한 의료 데이터는 부족하기 때문에 모델의 신뢰성과 예측 능력이 제한된다. 또한 개인정보 보호 및 윤리적인 이유로 의료 데이터에 접근이 어려운 경우가 많다 [7]. 또한 AI에 기반한 신약 개발 과정에서의 안전성, 윤리적 문제, 법적 책임 등의 규제적 측면이 고려되어야 하며, AI가 제시한 결과가 임상 시험에서 어떠한 결과를 초래할지에 대한 규제 당국의 승인이 필요하다 [42, 43].
3. 결론
AI 기술을 기반으로 한 신약 개발은 제약 산업에 혁신적인 변화를 일으켰으며, 그 중요성은 앞으로 더욱 커질 것으로 예상된다. 신약 개발 분야에 있어서의 AI 도입은 연구 속도를 향상시키는 것을 넘어서, 신약 개발의 패러다임을 근본적으로 변화시키고 있다. 전통적인 신약 개발 방식에는 10-15년의 시간과 많은 비용이 필요되는 반면에, AI는 데이터를 기반으로 신약 후보 물질을 빠르고 정확하게 발굴하고, 임상 시험을 최적화하며, 개인화된 맞춤형 치료법을 제공한다. 또한 머신러닝과 딥러닝을 활용해 방대한 생물학적 데이터를 효율적으로 분석하며 기존에 발견되지 않았던 새로운 약물 구조를 탐색하고, 이미 개발된 약물의 새로운 용도를 발견하는 데에도 기여하고 있다. 정밀 의학과 맞춤형 치료 분야에서 AI의 활용은 환자 개인의 특성에 맞는 최적의 치료법을 제공하고 미래의 의료 환경을 혁신적으로 변화시킬 것이다. AI의 발전은 신약 개발에 그치지 않고, 질병 예방, 진단, 치료의 전 과정에 걸쳐 중요한 역할을 할 것이다. 이를 통해 제약 회사들은 더욱 효율적이고 혁신적인 방식으로 신약을 개발할 수 있으며, 기존 약물의 재발견 및 개선을 통해 더욱 안전하고 효과적인 치료제를 빠르게 시장에 출시할 수 있다.
AI 기반 신약 개발은 바이오 제약 산업의 경쟁력을 한층 강화시킬 것이며, 전 세계의 제약 기업들이 AI를 적극적으로 도입하는 것은 미래 생명 과학 분야에서 경쟁력을 유지하고 발전하기 위한 필수적인 전략이 될 것이다. AI가 이끄는 신약 개발의 혁신은 이미 시작되었으며, 앞으로 정확성이 보다 향상되었을 때 제약 산업이 어떻게 변모할지에 대한 기대가 매우 크다.
4. 참고문헌
==>첨부파일(PDF) 참조
본 게시물의 무단 복제 및 배포를 금하며, 일부 내용 인용시 출처를 밝혀야 합니다.
자료열람안내
본 내용은 BRIC에서 추가적인 검증과정을 거친 정보가 아님을 밝힙니다.
내용 중 잘못된 사실 전달 또는 오역 등이 있을 시 BRIC으로 연락(view@ibric.org) 바랍니다.