국내외 바이오 관련 동향 뉴스를 신속하게 제공합니다.
뉴스 생명과학
[초심자를 위한 생물학+정보학] 생물학 연구를 위한 인공 지능/딥러닝 - 59
Bio통신원(고주온)
지난 연재를 통하여 생물학 연구에 있어서 매우 중요한 분야인 단백질 구조 예측과 관련된 도구들에 관한 내용을 소개하였다. 이 분야 역시 최근 들어서 괄목할 만한 발전을 거듭하고 있는 인공 지능, 그중에서도 딥러닝(deep learning)을 적용한 방법론이 대세를 점하고 있고, 그 성과 또한 남다른 결과로 이어지고 있다.
그런데 딥러닝과 관련된 인공 지능 분야가 최근 급격히 성장하는 관계로 어느 정도 기초 지식이 없이는 따라가기에도 벅찰 뿐만 아니라, 생물학 연구에 적용하기가 쉽지 않은 것이 현실이다. 예컨대, 앞선 연재에서 다루었던 알파폴드 역시 다중 서열 정렬과 서열 검색으로 시작하는 입력 전처리 단계에서부터 단백질 구조 군집화(clustering)와 self-destination을 적용한 학습 데이터 확장 등의 기법을 사용하고, 이후 학습 모델을 구축하는 과정에서 자연어 언어 처리에서 주용 사용하는 attention mechanism을 적용하여 각 층(layer)에 개별 매개변수를 가진 48개 block으로 Evoformer를 구성하고, 이를 통해 생성된 정보가 RNN (recurrent neural network) block으로 이루어져 3차원 protein geometry로 변환해 주는 structure module을 거친 다음, ResNet으로 거의 최종 3차원 단백질 구조가 출력된다 (그림 1).
그림 1. Model architecture of AlphaFold (Jumper et al., 2021).
사실, 이러한 과정에서 적용되는 다양한 기법에 대한 지식 없이는 해당 방법론을 이해하거나 이들을 응용하여 각 연구자 자신의 실무에 적용하는 것은 매우 어려운 일이 될 것이다. 따라서, 본 연재에서는 앞으로 인공 지능 분야 가운데 기계 학습(machine learning) 분야에 있어서 기본적으로 알아야 할 사항들을 개괄해 보고, 이들과 딥러닝의 차이점을 살펴보고자 한다.
<References>
Jumper,J. et al. (2021) Highly accurate protein structure prediction with AlphaFold. Nature, 596, 583–589.
본 기사는 네티즌에 의해 작성되었거나 기관에서 작성된 보도자료로, BRIC의 입장이 아님을 밝힙니다. 또한 내용 중 개인에게 중요하다고 생각되는 부분은 사실확인을 꼭 하시기 바랍니다.
[기사 오류 신고하기]
(http://bioprofiler.tistory.com) IBM-XT시절부터 개인용 컴퓨터를 사용하였으나, 강산이 변한 지금도 어제 코딩한 내용을 오늘 기억하지 못하는 자유인. 박사학위는 분자유전학 분야로 받았으며, 물리학과 화학에 관심만 있음. 현재 대학 교수로 재직 중.
다른 연재기사 보기
전체 보기