생명과학분야 학술정보 온라인 세미나!
BRIC은 생명과학분야 연구자들의 학술정보 교류에 적극적으로 참가하실 학술웨비나 발표연사를 모십니다.
학술웨비나 개최예정
APACE: AlphaFold2의 고성능 컴퓨팅 최적화를 통한 단백질 구조 예측 가속화 프레임워크 [Proc. Natl. Acad. Sci. USA.]
APACE(AlphaFold2 and advanced computing as a service)는 고성능 컴퓨팅 플랫폼에서 AlphaFold2를 최적화하여 대규모로 실행할 수 있도록 설계된 컴퓨팅 프레임워크입니다. 이 프레임워크는 TB 크기의 AI 모델과 데이터베이스를 효율적으로 처리합니다. 우리는 Delta와 Polaris 슈퍼컴퓨터에서 APACE를 사용하여 다양한 단백질의 구조 예측을 가속화했으며, 300개의 NVIDIA A100 GPU에서 200개의 앙상블을 분산시켜 APACE가 며칠 걸리던 시간을 몇 분으로 단축할 수 있음을 보여주었습니다. 이 프레임워크는 자동화된 대규모 발견을 가능하게 하기 위해 자율 실험실과 쉽게 연계될 수 있습니다. APACE의 주요 최적화 중 일부는 CPU와 GPU 계산의 효율성을 향상시키기 위해 구현되었습니다. CPU 최적화의 경우, 여러 MSA 검색 도구와 템플릿 검색 도구에 대해 16개의 CPU 코어를 할당하여 병렬 처리를 통해 성능을 크게 향상시켰습니다. 또한, 데이터셋을 SSD로 이전하여 데이터 검색 시간을 최소화하고, IME를 활용해 SSD 캐시에 데이터 파일을 사전 스테이징했습니다. 이러한 최적화는 MSA 계산의 속도를 크게 향상시켰습니다. GPU 최적화의 경우, Ray 라이브러리를 사용하여 다중 GPU 병렬화를 통해 AlphaFold2/APACE가 모델 앙상블의 각 예측을 독립적인 GPU에 할당하여 구조 예측을 가속화했습니다. 또한, 모델 예측 후 각 구조의 이완 과정을 병렬화하여 처리 시간을 단축했습니다. 결론적으로, APACE는 AlphaFold2의 강력함과 정확성을 유지하면서도 슈퍼컴퓨팅을 활용하여 며칠에서 몇 분으로 통찰 시간을 단축하는 프레임워크를 제공합니다. 이를 통해 데이터 저장 및 스테이징의 효율적인 사용, CPU 및 GPU 계산의 최적화, 그리고 단백질 구조의 다양한 형태 예측을 가능하게 하는 과학 소프트웨어 개발을 이루었습니다. 이러한 도구들은 과학적 발견을 자동화하고 가속화하기 위해 로봇 실험실과 쉽게 연계될 수 있습니다.
진행 방법
사전 준비