최신 연구동향 정보를 제공하기 위해 생명과학관련 정보제공자를 모집합니다.
Bio리포트 동향리포트
단백질 삼차원 구조에 기반한 신약 디자인 동향
성상현(서울대학교 생명과학부)
목 차
1. 서론
2. 본론
2.1 구조 기반의 신약 디자인(structure-based drug design, SBDD)
2.2 조각 기반의 리드 발견(fragment-based lead discovery, FBLD)
2.3 도킹 방법론
3. 결론
4. 참고 문헌
1. 서론
잠재적인 신약을 시장에 출시하는 것은 엄청난 시간과 돈의 투자를 필요로 한다. 한 연구 기관에서는 이 과정의 평균적인 비용이 26억 달러라고 추산했으며 최근에는 더 증가하고 있는 추세이다. 개발에 소요되는 기간은 평균적으로 10년에서 15년 정도가 필요하다고 한다 [1]. 그러나 이런 노력에도 불구하고 약효가 충분하지 않거나 부작용이 발견되는 등의 이유로 신약 개발 프로세스의 90%는 임상시험 중 실패한다 [2]. 기술의 개발을 통해 높은 처리량으로 수많은 약물을 스크리닝할 수 있게 되었지만, 엄청난 비용이 드는 것은 여전하다. 따라서 어떤 방향이든 비용은 줄이고 성공률을 높일 수 있는 방법론이 중요하다. 신약 개발 분야에서 이는 크게 두 갈래의 방향으로 이루어지고 있는데, 하나는 wet lab 기반의 실험적인 방법론이고, 다른 하나는 컴퓨터 기반의 접근법이다. 사실 이 두 가지 방향은 따로 존재한다기보다는 서로 상보적으로 같은 목표를 위해 나아간다고 할 수 있다. 수많은 생물학적 분자들의 삼차 구조가 밝혀지고 데이터 베이스화되고 있으며 이를 기반으로 신약을 디자인하려는 노력이 일정 부분 성공을 거두었다. 이 과정에서 실험적으로 해결할 수 없는 부분에서는 컴퓨터를 이용한 예측이 필요하며, 그러한 예측에 대한 검증 과정에 실제 실험이 도입되는 것이 이상적이다. 본 글에서는 우선 구조 기반의 신약 디자인(structure-based drug design, SBDD)의 개념에 대해 설명하고, 그 구체적인 형태를 조각 기반의 리드 발견(fragment-based lead discovery, FBLD) 과정을 기반으로 소개하고자 한다. 그리고 컴퓨터 기반의 신약 개발 과정에 대해 도킹 방법론을 중심으로 서술한다. 이러한 구분은 편의적인 목적을 위해서이며, 실제로는 두 방향의 조화가 중요하다는 것을 다시 강조해두고 싶다. 구조 기반의 신약 디자인 과정의 기본적인 흐름과 사례, 각 단계에서의 한계점, 앞으로의 방향에 대해 소개하며 최신의 신약 개발 프로세스에 대한 이해를 돕고자 한다.
2. 본론
2.1 구조 기반의 신약 디자인(structure-based drug design, SBDD)
신약을 찾는다는 것은 대개 높은 품질의 화학적 리드(lead)를 찾는 것을 의미한다. “리드"란 특정한 생물학적 타겟에 대해 원하는 활성을 가지는 물질을 말하며, 생화학적인 테스트를 통해 그 활성을 측정할 수 있어야 한다. 그리고 임상적인 적용을 위한 후보로 고려되기 위해서는 화학적, 생물학적, 물리적 특성에 대한 최적화 과정을 거쳐야만 하는 상태의 물질을 말한다. 리드는 다양한 곳에서 발견 가능하다. 예를 들면, 자연적인 산물이나 이미 존재하던 화학적 리드 또는 허가받은 신약이 리드로 사용될 수 있고, 스크리닝을 통해 직접 히트(hit: 사용된 테스트에서 양성 결과를 내는 물질)를 찾고자 시도할 수도 있다. 지난 약 20여 년간 리드를 찾기 위해 가장 널리 사용되던 방식은 높은 처리량의 스크리닝(high-throughput screening, HTS)이었다. HTS는 수백만 개 이상의 물질로부터 출발해서 히트를 찾고 최적화하여 리드로 발전시키고자 한다.
약간 거슬러 올라가 보면, 1950년대와 1960년대에 X-선 결정학(X-ray crystallography)으로 첫 번째 단백질 구조가 발견된 이후 특정한 타겟의 삼차 구조에 대한 지식으로 신약을 개발하려는 노력이 꾸준히 존재했다 [2]. 흔히 이러한 방법론을 구조 기반의 신약 디자인(structure-based drug design, SBDD)으로 부르는데, 컴퓨터, 구조 생물학에 기반하여 다양한 분야를 포괄하며 학계와 산업계에서 관심을 모았다. John Kendrew와 Max Perutz에 의해 만들어진 SBDD의 초기 성과는 상당히 유명한 편이다. 미오글로빈과 헤모글로빈의 구조가 풀렸으며 이 단백질들이 산소를 어떻게 저장, 수송할 수 있는지 뿐만 아니라 sickle cell anaemia의 기전에 대한 분자적인 기반을 제공하고 치료 방향도 제시했다 [3]. 또한 Fred Sanger가 인슐린의 아미노산 서열을 결정하고 Dorothy Hodgkin이 삼차 구조를 결정함으로써 당뇨병을 처치하기 위해 합성 인슐린을 제작하는 기반이 되었다 [4]. 이러한 연구는 단백질의 구조 및 기능에 대한 이해가 어떻게 치료에 영향을 미쳤는지를 단적으로 보여준다. 단백질 접힘에 대한 지식, 구조-기능의 관계, 분자 진화, 치료에 연관 있는 삼차 구조의 이용 가능성 등이 합쳐져 SBDD의 기반을 닦았다.
1980년대에는 다양한 바이오 기업들이 성장하여 구조 기반의 신약 찾기에 나섰는데 암을 타겟팅하는 곳도 있었고, 인플루엔자 바이러스를 억제하기 위한 시도도 있었다. 대표적인 성공 사례는 HIV/AIDS에 대한 처치로 HIV protease의 구조를 사용하여 FDA를 승인을 받은 saquinavir, nelfinavir, indinavir, ritonavir 등이 있다 [5, 6]. 이처럼 신약 개발 분야 이외에도 Protein Data Bank (PDB) 같은 데이터 베이스에 단백질 구조 정보가 대량으로 모이자, 이를 컴퓨터로 분석하여 특정 타겟에 대한 저해제 등을 개발하기 위한 소프트웨어 개발도 활성화되었다.
1990년대에는 SBDD가 발전하여 “조각 기반의 리드 발견(fragment-based lead discovery, FBLD)”이라는 형태가 되었다 [7]. 이는 컴퓨터와 구조 생물학 양쪽 분야의 큰 발전에 힘입은 결과이다. FBLD는 30개 이상의 신약 후보를 제시했고, 암 분야에서 FDA의 승인을 받은 세 가지 성공 사례를 만들었다. BRAF의 저해제인 vemurafenib, BCL-2의 저해제인 venetoclax, CDK4의 저해제인 ribociclib이다 [8]. 이런 성공을 바탕으로 FBLD는 더욱 다양한 방법론을 포용하며 발전하고 있다. 라이브러리 크기가 작고 초기 진입 비용이 낮은 점 때문에 학계와 작은 회사에서도 널리 쓰이고 있고, 특히 중견 이상의 제약 회사들에서는 핵심적인 도구로 이미 사용되고 있다.
구조 기반의 디자인은 임상에서 쓰일 신약을 개발하는 것뿐만 아니라 일반적인 생물학 분야에서 분자적인 기전을 연구하는데 사용될 화학적인 탐침을 발견하는 데도 중요하다. RNA 간섭이나 CRISPR 같은 유전적인 접근에 더해서 높은 선택성과 다양한 기능을 가지는 화학적 탐침을 사용하는 것이 기전 이해에 큰 도움이 될 수 있다.
2.2 조각 기반의 리드 발견(fragment-based lead discovery, FBLD)
조각(fragment) 방법론은 관심 있는 생물학적 분자에 결합하는 200 Da 이하의 화합물 또는 조각을 찾는 것으로부터 시작한다 [10-12]. 수백에서 수천 개 정도의 적은 수의 물질로 스크리닝을 시작해서 타겟(대다수의 조각 방법론은 단백질을 타겟으로 한다)에 대한 한 두개의 좋은 상호작용을 보이는 물질을 찾는 것을 목표로 한다. HTS에서 타겟 단백질과 수많은 상호작용을 하는 물질을 찾는 것과는 대조적이다. 조각은 작기 때문에 결합을 방해하는 부분을 포함하고 있을 가능성이 낮고, 타겟에 적절히 결합할 조건을 갖추고 있을 확률이 높다. 결과적으로 높은 분자량과 더 복잡한 분자들을 포함하는 비슷한 크기의 라이브러리보다 히트를 얻을 확률이 높다. 이를 다른 방식으로 표현하면 조각은 큰 분자보다 더욱 효율적으로 화학적 공간(chemical space)을 샘플링할 수 있다.
조각 스크리닝은 히트를 찾을 확률은 높지만, 찾아진 조각의 타겟에 대한 친화력은 상대적으로 낮은 편이다. 그러나 이것이 ‘타겟과 상호작용을 제대로 하지 못한다’는 의미는 아니라는 것을 분명히 해야 한다. 오히려 리간드가 단백질에 결합할 때 잃게 되는 엔트로피를 고려하면, 조각은 일반적인 크기의 리간드보다 뛰어난 상호작용을 한다. 엔트로피의 감소는 용액 내에 있던 분자가 특정한 결합을 이루게 되며 회전 운동이나 병진 운동이 감소하기 때문에 발생한다 [13, 14]. 대개 이러한 엔트로피 페널티는 분자량에 무관하다. 분자가 타겟에 결합하기 위해서는 이러한 엔트로피 페널티를 극복해야 하는데, 수많은 상호작용을 하는 큰 분자량의 신약 후보에게 이는 별다른 문제가 되지 않는다. 반대로 말하면, 한 두개의 상호작용만을 만드는 조각의 경우에는 타겟과 강력한 상호작용을 해야만 엔트로피 페널티를 극복할 수 있다. 이런 강력한 상호작용을 기반으로 조각을 리드로 최적화하기 쉬운 것도 FBLD의 장점이다.
타겟과 결합하는 조각이 발견되면 이후에 최적화 과정을 거치는데 리드로 발전시키는 것 이외에도 관심 있는 타겟을 탐지하는데 사용되는 더 높은 친화성의 화합물로 발전시킬 수도 있다. 대부분의 조각은 타겟 사이트에 매우 약한 정도로 결합하기 때문에 그러한 약한 결합을 탐지할 수 있는 특별한 방법론을 필요로 하게 되고, 조각 라이브러리를 만드는 과정에서 높은 용해도를 유지할 수 있게 하는 것이 중요하다.
조각 방법론이 1996년에 최초로 도입된 후 많은 회사들이 원하는 기능을 가지는 조각을 찾는 성과를 보였다. 중요한 점은 1,000개 정도의 작은 조각 라이브러리로 시작해서 유의미한 발견을 할 수 있었다는 점이고 점차 높은 처리량의 방법론이 동원되어 후보 물질의 수를 늘려갔다. 리드가 최적화되어감에 따라서 신약의 개발이 이루어지기 때문에 리드 조각을 찾는 것이 매우 중요하다. 더 중요한 것은 실제로 효과가 있느냐, 즉 조각이 타겟에 결합했을 때 질병이나 상황에 원하는 효과를 줄 수 있느냐라고 할 수 있다.
전통적 방식(HTS)에 대비되는 조각 방법론의 장점
스크리닝 과정에서 친수성의 조각이 많이 발견되는데 이들은 수소 결합을 통해 높은 결합력을 가지는 경우(엔탈피에 의한 결합)가 많다. 여기서 추가로 결합력을 증가시키기 위해 소수성 잔기가 주로 추가되는데(엔트로피에 의한 결합), 친수성 조각으로 시작하면 최종적으로 최적화된 리간드가 지나치게 높은 소수성을 가지는 상황을 막을 수 있다.
기본적으로 높은 리간드 효율을 보이기 때문에 최적화된 리간드의 분자량도 작은 편에 속한다. 또한 이론적으로는 최적화된 리간드를 만드는 과정에서 2개나 3개 정도의 조각이 합쳐질 수 있기 때문에 N개의 물질로 된 라이브러리로 스크리닝을 하면 전통적 방식이 N2에서 N3개의 물질을 스크리닝하는 것과 유사한 효과를 낼 수 있다.
조각은 작은 크기를 통해 리간드-단백질 상호작용을 입체적으로 막을 만한 잔기를 가질 확률이 낮기 때문에 조각 라이브러리를 조합하는 것의 장점을 더욱 극대화할 수 있다.
FBLD의 실제 진행 과정
FBLD는 아래의 다섯 가지 핵심적인 과정으로 구성된다.
1) 조각 라이브러리 준비
FBLD를 위한 라이브러리를 준비하기 위해서는 세 가지의 고려 사항이 있다. 첫째, 조각들의 특성: 조각들은 단백질에 반응성을 가지는 부분이 없어야 하고, 스크리닝에 사용될 정도로 높은 농도에서 용해도를 유지해야 하며, 가능한 한 종류가 다양해야 한다 [15]. 둘째, 분자량은 라이브러리 안의 조각의 수를 결정짓는데 중요하다. Reymond의 추정에 의하면 분자 안에 무거운 원자 하나가 추가될 때 마다 분자가 차지하는 화학적 공간의 크기가 약 8배로 증가한다 [16]. 추산해보면, 190 Da의 분자량을 가지는 1,000개의 조각의 라이브러리는 280 Da 대비 108배, 440 Da 대비 1018배의 화학적 공간을 커버하는 셈이다. 따라서 주로 사용되는 라이브러리는 평균 200 Da의 1-2,000개 정도의 물질을 포함한다. 셋째, 라이브러리는 수시로 조각들이 안정적인지, 침전되거나 뭉치지 않는지 체크되어서 높은 농도의 실험에서의 위양성(false positive) 결과를 피할 수 있어야 한다. 조각 구조의 작은 차이도 결합 능력에 대해서 엄청난 차이를 가져올 수 있다. 이 단계에서 기대하는 바는 무언가라도 타겟에 결합해서 더욱 최적화될 가능성이 있는 조각을 찾는 것이다.
2) 타겟 준비
두 가지 종류의 타겟으로 FBLD를 시작할 수 있다. 하나는 일반적인 타겟으로써, 크리스탈 구조를 알고 있고 결합 또는 기능에 대한 테스트가 가능한 것이다. 그리고 대개 타겟팅하는 이유가 명확하고 그것을 조절하는 무언가를 얻어야만 하는 합리적인 이유가 있다. 다른 하나는 조금 더 도전적인 타겟으로써 타겟팅하는 목적이 단백질-단백질 상호작용을 막기 위해서, 다양한 단백질이 만드는 복합체를 억제하기 위해서 등 다양할 수 있다. 또한 급박한 필요성은 없거니와 결합과 기능에 대한 테스트도 잘 수립되어 있지 않아 기반이 약한 경우가 많다. 스크리닝에 필요한 타겟을 확보해서 준비하는 난이도도 상당히 차이가 날 수밖에 없다. FBLD는 스크리닝을 진행하고 구조를 결정하기 위해 충분한 양의 순수하고 기능적이며, 균일한 단백질을 필요로 한다. 도전적인 타겟에 대해서는 어려운 부분이 많고 대개의 프로젝트에서 타겟 자체를 확보하는 것이 병목 구간이 된다.
3) 조각 스크리닝
실제로 조각과 타겟 사이의 상호작용을 관찰하는 스크리닝 과정이다. 스크리닝 과정에서 가장 널리 사용되는 방법론은 핵자기공명(nuclear magnetic resonance, NMR) [17], 표면 플라스몬 공명(surface plasmon resonance, SPR) [18], X-선 결정학 [19] 이다. NMR은 자기장 속에 놓인 원자핵이 특정 주파수의 전자기파와 공명하는 현상이며, 이를 통해 분자의 구조적인 내용을 추론할 수 있다. NMR의 장점은 표지 없이(label-free) 진행할 수 있으며 자유로운 용액 안에서 측정이 이루어진다는 것이다. 또한 단백질과 조각의 용해도와 안정성이 각각 측정될 수 있다. 이것은 도전적인 타겟의 경우 중요한데, 안정성이 중요한 문제가 되는 경우가 많기 때문이다. 도전적인 타겟 단백질이 뭉치거나 침전되어서 위양성이나 위음성 결과가 나오는 경우가 많다. 그럼에도 민감도나 높은 처리량으로 진행할 수 있다는 장점 덕분에 널리 사용되고 있다. SPR 역시 라벨 없이 생체분자의 상호작용을 관찰할 수 있는 기법이다. 주로 금속 표면에 특정 단백질을 부착 시켜 두고 다른 분자와 상호작용할 때의 표면 굴절률의 변화를 빛으로 측정한다. SPR은 적은 양의 단백질을 필요로 하고 상대적으로 빠르기 때문에 널리 선호된다. 핵심 이슈는 단백질이 표면에 잘 고정되고 결합 능력을 유지할 수 있느냐 하는 것이다. SPR과 NMR을 이용한 분석에서 공통적으로 고려해야 하는 점은 높은 농도에서 비특이적인 결합이 만들어져서 위양성이 나타날 가능성을 조심해야 한다는 것이다. X-선 결정학은 X-선이 결정(크리스탈)에 입사하고 회절될 때의 정보를 이용하여 원자나 분자의 삼차원적인 구조를 분석한다. 대개 타겟 단백질을 결정으로 만들고 매우 높은 농도의 조각 용약을 적셔서 실시되기 때문에 다른 방법론에 비해 높은 적중률을 보일 수 있다. X-선 결정학은 단백질과 조각의 결합에 대한 즉각적인 모델(어느 위치에 결합하는지, 결합의 양상이 어떠한지 등)을 제공하는 거의 유일한 방법론이다. 또한 위양성이 가장 적게 나타난다. 그러나 조각 용액에 의해 잘 적셔질 수 있는 타겟 결정을 만드는 과정 자체가 많은 경우에 문제가 될 수 있다. 결정화 과정에서 규칙적인 분자들의 쌓임 구조로 인해 입체적인 방해가 발생할 수 있기 때문이다.
4) 조각 결합에 대한 모델 수립
대부분의 단백질에 대해 결합 조각을 찾는 것은 비교적 직관적이고 쉬운 일이다. 실제로 도전적인 부분은 그 결과를 가지고 무엇을 할 것인가 하는 점이다. 약하게 결합하는 조각만을 가진 타겟의 경우, 시행착오를 겪으면서 계속 합성을 진행(trial and error synthesis)하기 위한 유용한 구조-활성 관계(structure-activity relationship, SAR)를 확보하기 힘들다. 조각에 가해지는 대부분의 변형은 결합 능력을 약화시키거나, 변화시켜서 유용한 조각이 갖추어야 할 조건을 찾는 것을 어렵게 한다. 현재까지 성공적이었던 조각 최적화는 모두 어떻게 조각이 타겟에 결합하는지에 대한 모델을 가지고 있었다. 모델을 가지고 있으면 최적화 과정에서 어떤 부분에 우선 순위를 두고 변형을 해야 할지 판단하기 쉽다. 구조 기반 디자인 분야에서 가장 강력한 모델은 구조 결정학을 통해 얻어졌으며, 잘 풀릴 경우에는 프로젝트 초기부터 수백 개의 크리스탈 구조를 얻고 최적화 과정에 유용한 정보를 얻을 수 있다. NMR 또한 모델을 만드는데 필요한 정보를 제공할 수 있지만, 대개 모델을 완성하는 데까지 수주 이상의 시간이 걸린다.
5) 조각에서 리드로의(fragment to lead) 최적화
조각을 최적화하는 방법론은 크게 조각 연결, 조각 성장, 조각 병합의 세 가지로 나뉜다.‘ 조각 연결(linking)’은 NMR을 통해 구조-활성 관계를 찾던 초기 방식으로, 첫 조각 찾기, (구조 결정에 뒤따른) 첫 조각의 최적화, 첫 조각 ‘존재 하’에 스크리닝을 시행하여 더 작은 조각을 찾기, 두 번째 조각 최적화, 두 조각의 ‘연결’로 이루어진다 [7]. 간단하게 말하면 결합 부위 내의 다른 영역에 결합하는 두 조각을 연결해서 하나로 만드는 과정이다. 어려운 점은, 타겟의 결합 부위에 추가적인 조각을 허용할 만한 공간이 존재하는지 여부와 두 조각의 결합 능력을 바꾸지 않고 연결하는 화학적 기법의 실재 여부이다. 이런 조건을 만족하는 연결기(linker)나 분리기(spacer)를 찾아야 하는데, 이로 인해 사실상 가장 도전적인 최적화 방식으로 여겨진다. 대표적인 성공 사례는, 만성 림프구성 백혈병 환자에 투여되는 venetoclax의 발견이다.
‘조각 성장(growing)’은 FBLD에서 가장 널리 사용되는 전략이다. 이름에서 드러나듯이 조각을 변형 시켜 크기를 증가 시켜 나간다. 다양한 반응기를 더해나가는 이 방법은 HTS에서 사용하던 방식과 동일하다. 초기 조각을 구조 기반의 디자인을 통해 원하는 만큼의 선택성과 약물로써의 특성을 가지도록 최적화한다. 흑색종의 원인이 되는 B-Raf kinase의 V600E 돌연변이 단백질을 선택적으로 억제하는 vemurafenib이 대표적인 사례이다. 약간 변형된 접근법은 ‘목록에 의한 SAR (SAR by catalog’로 불리는데, 초기 조각의 핵심적인 결합 모티브를 가지는 물질을 따로 찾는 방식이다. 즉, 새로운 물질을 합성하는 것이 아니라 기존에 가지고 있던 또는 쉽게 구할 수 있는 물질에 초기 조각과 유사한 특성이 있는지를 비교해보고 테스트하는 것이다. 이런 방식은 특정 조각의 화학적인 특성을 싸고 빠르게 검증 및 발전시킬 수 있다. 이 방법으로 Hsp90에 대한 저해제가 임상 2상에 들어갔다.
‘조각 병합(merging)’은 두 개의 다른 조각이 부분적으로 같은 영역에 결합할 때나 두 결합 부위가 공통된 영역을 공유할 때 사용할 수 있는 방법이다. 이때 겹치는 부분을 중심으로 조각을 합치게 된다. 전통적으로 “분자 혼성화(molecular hybridization)”라 부르던 개념과 유사하다. 이는 다양한 크리스탈 구조와 신중한 구조 기반의 디자인을 필요로 한다. 스크리닝에서 찾아진 조각에 대한 정보를 문헌, HTS, 자연상의 리간드 등에서 찾은 또 다른 저해제의 정보와 합치는 것도 가능하다. 조각 연결보다는 간단한 방법으로 여겨지는데, 두 조각을 이어줄 부분을 새로 디자인할 필요가 없기 때문이다. PDPK1 kinase에 대한 저해제 [20]나 Hsp90 저해제인 BEP-800 등이 이렇게 발견되었다 [21].
조각을 리드로 최적화하는 과정에서의 흔한 실수는 조각을 발전시키는 과정을 조각 자체의 핵심적인 특징을 규명하기 전에 시작하는 것이다. 스크리닝은 숫자 싸움이며, 조각 라이브러리 안에 최적의 효과를 보이는 조각이 포함되어 있을 확률은 낮다. 따라서 조각과 긴밀히 연관된 다른 화학형(chemotype)을 잘 탐색하는 것이 중요하다. 메틸기를 추가하거나 질소 원자를 헤테로 고리에서 이동시키는 것 등 작은 차이가 타겟과 조각의 결합에는 큰 변화를 줄 수 있다. 이처럼 적극적으로 조각을 진화 시켜 봄으로써 친화성이나 선택성을 증가시키는 특징을 찾는 것이 최적화 성공에 큰 영향을 미친다.
최근의 발전
1) 조각과 화학생물학
수많은 초기 연구들은 실질적으로 대부분 단백질들의 모든 결합 부위에 대한 조각을 발견할 수 있다는 것을 보였다. 이 때 발견되는 조각의 수는 특정 결합 부위가 조각들에 대해 얼마나 화학적으로 친화적인지를 의미한다. 반대로 생각하면 조각이 단백질의 잠재적인 결합 부위에 대한 정보를 줄 수도 있다 [22]. 즉, 조각이 결합하는 정보를 통해 단백질 자체를 탐구할 수 있는 것이다.
예를 들어 K-Ras는 수많은 암의 핵심 인자로 밝혀졌는데 상당히 작은 G-단백질에 속한다. K-Ras에 결합하는 GDP가 GTP로 바뀌는 것만으로 다양한 신호 경로를 바꾸는 구조 변화가 일어난다. 수십 년 동안 K-Ras를 타겟팅하는 약물을 찾기가 어려웠는데, 조각 스크리닝을 이용해서 새로운 결합 부위를 찾았고, 기능 억제를 할 수 있는 약물이 개발될 희망이 커졌다 [23].
공유 조각(covalent fragment)에 대한 관심도 커졌는데, 이는 단백질과 공유 결합을 형성할 수 있는 작용기를 가진 조각을 말한다. 공유 조각을 이용한 사례로는 단백질 표현의 시스테인과 반응하는 조각 라이브러리를 이용한 경우가 있다. 조금 더 확장하면, 기능적으로 중요한 부분의 시스테인에 돌연변이를 만드는 방법도 있으며, 이 방법을 통해 K-Ras에 돌연변이를 도입하기도 했다 [24].
2) 효소 촉진제로써의 조각
핵 수용체(nuclear receptor)나 G-단백질 연결 수용체(G-protein coupled receptor)의 경우에는 효능제(agonist, 단백질의 구조를 조절하여 생물학적인 기능을 나타내도록 하는 물질)의 발견을 목적으로 리드를 찾으려는 경우가 많다. 그러나 아직까지 작은 분자가 효소 활성화를 일으키는 사례는 많지 않다. 약간의 활성 변화만으로 유익한 효과를 얻을 수 있을 것이라는 기대 때문에 가능성에 대한 탐구는 활발히 이루어지고 있다 [25].
3) 컴퓨터를 이용한 접근법
컴퓨터 분야에서 계산 속도가 비약적으로 발전함에 따라 FBLD에서 컴퓨터 기반 방법론의 사용은 증가했지만, 근원적인 방법론이나 모델에서의 획기적인 변화는 없었다. 만약 단백질 타겟의 구조를 알고 있고 리간드가 큰 구조 변화 없이 결합한다면, 원리적으로는 둘 사이의 가능한 결합 형태에 대한 결합 에너지를 계산할 수 있어야 한다. 그러나 실제로는 리간드가 어떤 방향과 위치로 결합할지 정확히 예측하는 것이 어려운 문제다. 또한, 조각의 경우에는 가능한 결합의 종류와 결합 강도가 매우 약하기 때문에 더욱 어렵다. 최근의 시뮬레이션 프로그램들은 단백질 타겟의 유연성(flexibility)을 함께 고려하고 있고, 더욱 높아진 컴퓨터의 계산 능력을 이용하기 때문에 조각 최적화 과정에서 유용한 정보를 제공해줄 것으로 기대가 높아지고 있다. 이 부분은 뒤에 별도의 장에서 자세히 설명한다.
4) 구조 생물학의 발전
X-ray free electron laser (X-FELS) 기술은 나노크리스탈 슬러리에 고에너지 X-ray를 펨토초 단위로 처리하는데, 이는 크리스탈이 파괴되기 전에 유용한 회절 이미지를 얻을 수 있게 해준다 [26]. 이론적인 시뮬레이션 결과로는 단일 분자에 대한 X-ray 이미지를 얻을 수 있을 것으로 기대되며 단백질을 결정화시킬 필요가 없을지도 모른다.
자크 뒤보셰 교수 등 3인이 고안하여 2017년 노벨화학상의 영광을 안은 극저온 전자현미경(cryo-electron microscopy, cryoEM)기술도 이와 비슷한 장점이 있는데, 단백질을 결정화시킬 필요 없이 단백질 또는 단백질 복합체의 구조를 거의 원자 수준의 분해능으로 밝힐 수 있다 [27]. 초기에는 cryoEM을 300 kDa 이상의 큰 복합체에 대해서만 적용했었지만, 최근에는 100 kDa 이하의 단백질이나 복합체에 대해서도 적용 가능하다는 것이 알려졌다. X-ray 결정학을 적용하기 어려운 타겟에 대해서는 cryoEM이 아주 좋은 대안이 될 것으로 기대된다. 또한 cryoEM은 리간드와 결합한 단백질 복합체의 구조를 타겟팅하기에 유리하기 때문에 기존에 알려진 분리된 단백질이나 특정 단백질 도메인에 대한 구조 정보에 추가적인 정보를 제공할 수 있다. 실제로 항생제가 결합한 라이보좀 구조나 기질 유사체가 결합한 인간 20s 프로테아좀의 구조 등이 보고되었다. 앞으로 cryoEM을 활용한 연구 분야는 더욱 발전할 것으로 기대되고 일상적인 신약 개발 프로젝트 과정에도 포함될 것으로 보인다.
2.3 도킹 방법론
컴퓨터가 보조하는 신약 디자인(Computer-aided drug design, CADD)은 수십 년 동안 신약 개발에서 당연하게 여겨지는 컨셉이다 [28]. 구조 기반의 CADD는 크게 두 가지 점에서 핵심적인 역할을 하는데, 단백질 타겟에 작은 분자들이 어떻게 결합하는지를 예측하는 것과 결합 세기를 측정하는 것이다. 결합을 예측하는 것은 작은 분자와 단백질 간의 최적화된 위치와 방향에 좌우된다. 후보 물질-단백질 간의 결합 세기보다는 상호작용의 질이 더 중요하다. 상호작용의 질이란 주로 리간드 효율(ligand efficiency, LE)로 표현되는데 이는 리간드 내의 수소가 아닌 원자당 평균에너지를 뜻한다. 기본적으로는 무거운 원자 하나당 결합 세기를 비교할 경우 작은 크기의 리간드가 더욱 효율적으로 결합한다. 또한 리간드와 단백질 사이에 입체적인 충돌은 없는지, 다양한 결합 형태에 대한 반데르발스 및 쿨롱 상호작용의 세기가 어떠한지, 탈용매화(desolvation)에 의한 페널티는 어떠할지 등을 종합적으로 평가한다 [29].
이러한 예측 및 평가 능력에 기반하여 컴퓨터는 신약 개발 전체에서 광범위하게 쓰이고 있다. 본 글에서는 그 중에서 “분자 도킹(molecular docking)”이라고 불리는 핵심적인 개념에 대해 소개한다.
도킹 방법론이란 컴퓨터를 기반으로 특정한 리간드가 관심 있는 수용체에 대해 결합하는 양상을 예측하려는 시도를 말한다 [30]. 분자 생물학, 생물 정보학, 수학, 화학, 컴퓨터 과학 등 다양한 분야의 지식을 포괄하며 더욱 발전하고 있는 분야이다. 신약 개발 과정은 매우 길고도 어려운데, 대개 후반부 과정으로 갈수록 (주로 임상시험 단계에서) 실패율이 높아진다. 동물 실험 자체의 한계, 안정성이나 효율성의 문제, 임상 과정에서의 문제점 등 다양한 요소가 성공적인 신약 개발을 어렵게 한다 [31]. 신약 개발에 드는 시간과 돈을 절약하기 위해서 도킹 방법론이 더욱 관심을 받게 된 측면이 크다. 그러나 어디까지나 예측인 만큼, 도킹 연구에서 높은 점수를 받은 물질이 동물 테스트에서 탈락하는 것 또한 흔한 일이다. 또한 특정한 물질이 타겟에 대해 효능제(agonist)로 작용할지 아니면 억제제(antagonist)로 작용할지 예측하는 것도 어려운 일이다. 장점과 단점이 뚜렷한 만큼, 목표에 맞게 도킹 방법론을 잘 이해하고 사용하는 것이 중요하다.
도킹 방법론의 필요성
모든 약물의 안정성과 효율성은 대부분이 동물 실험에 기반하여 평가된다. 그러나 실험 동물의 짧은 수명으로 인해 약물의 장기 사용에 대한 평가를 정확히 하기 힘들다는 한계가 있다 [32]. 따라서 동물 실험에서는 인간에게 투약될 양보다 더 많은 양의 약물을 투약하는 경우가 많고, 이 또한 정확한 판단을 어렵게 한다. 또한 동물 실험의 더 중요한 문제는 도덕적이고 윤리적인 문제를 포함하여 비용이 지나치게 높다는 점이다. 미국 FDA에 의하면 90 퍼센트 이상의 후보 물질이 인간에 대한 테스트를 통과하지 못한다. 이처럼 신약 개발의 후반부에 가서 실패하는 사례를 줄이고자 도킹 방법론이 더욱 적극적으로 채용되었다 [33].
도킹 방법론의 기초
1970년대에 활발히 연구하고 2013년에 복잡한 화학 시스템에 대한 멀티 스케일 모델을 개발한 공로로 노벨상을 수상한 마틴 카플러스, 마이클 레비트, 아리에 워셜 3명의 학자가 도킹의 기초를 닦았다 [34]. 이들이 개발한 방법론과 프로그램은 빠르게 일어나는 화학반응의 양상을 예측하고 커다란 단백질의 구조도 빠르게 예측할 수 있었다. 도킹의 기본은 수용체의 활성 자리에 결합하는 리간드의 이상적인 방향을 예측하는 것이다. 도킹에는 두 가지 방법이 있는데 단단한(rigid) 도킹과 유연한(flexible) 도킹이다 [35]. 단단한 도킹에서는 단백질과 리간드의 결합 각도나 길이가 고정되어 있어서 상당히 빠르게 계산된다는 장점이 있지만, 리간드의 구조적인 자유가 무시된다. 유연한 도킹은 구조적인 변화를 포함하기 때문에 널리 사용되지만, 연산에 훨씬 많은 시간과 컴퓨팅 능력을 필요로 한다.
약물의 기능이 원하는 타겟에 대하여 나타나면 이상적이지만(온-타겟) 예상하지 못한 타겟에 대해 나타나기도 한다(오프-타겟). 이로 인해 원하지 않는 부작용이 나타나기도 하는데, 경우에 따라서는 오프 타겟 결합이 이로운 효과를 낼 수도 있다. 도킹을 정교하게 잘 이용하면 다양한 오프-타겟 결합을 미리 예측할 수 있고, 부작용을 예측함과 동시에 이미 허가된 약물을 다른 이로운 효과를 내도록 사용할 수도 있다(약물 재창출, drug repurposing) [36].
기본적인 도킹 알고리즘은 리간드가 결합 부위 내에서 취하게 될 다양한 방향을 예측하고(search), 타겟과 리간드의 상호작용의 강한 정도를 평가할 수(score) 있어야 한다 [37]. 복합체의 상호 작용과 열 교환이 일어나고 이는 다양한 에너지 상태의 변화와 연관된다. 이는 열역학의 법칙에 의해 설명되는 과정이며, 단백질, 리간드, 물, 용액 내의 다양한 이온들 간의 상호작용과 에너지 교환을 종합적으로 평가하여 타겟과 리간드 사이의 연관을 지배하는 힘을 계산할 수 있다 [38].
1) 단백질 및 리간드의 선택과 준비
단백질을 선택하는 과정이 좋은 도킹 결과를 얻는 것에 핵심적이다 [39]. 구조를 결정할 수 있는 기술들의 발전으로 다양한 단백질 데이타 은행(protein data bank, PDB)에 특정한 수용체들의 삼차 구조가 축적되고 있다. 당연하게도 해상도가 좋은, 즉, 원자들의 배열과 구조를 잘 보여주는 구조가 선호된다. 그리고 수소 이온을 더하고 물 분자를 제거하고 에너지 최소화(계산 모델에 따라 각 원자의 순 원자간 힘이 가능한 한 0에 가까운 원자 배열을 찾는 과정)를 거쳐서 준비를 마친다. 리간드의 구조는 직접 그리거나, 다양한 데이터베이스에서 얻을 수 있으며 역시 에너지 최소화를 거쳐 준비한다.
2) 도킹의 종류 선택
몇 가지의 물질만을 특정한 단백질에 대해 정해진 조건 하에서 도킹해보고 싶다면, 유연한 도킹 프로그램이 좋은 선택이다. 그러나 수천 가지의 물질을 유연한 도킹으로 테스트하는 것은 너무 높은 컴퓨팅 사양을 요구하기 때문에 적절히 타협하여 선택해야 한다.
3) 최상의 도킹 결과 선정
도킹 점수가 높은 리간드를 실제로 찾는 과정이다. 도킹 점수가 높다는 것은 리간드와 단백질 복합체의 안정성이 높다는 의미이다. 이론적으로 낮은 깁스 자유 에너지를 가지는 단백질-리간드 복합체의 안정성이 높지만 이를 정확히 예측하고 평가하는 것은 어려운 일이다.
4) 도킹 결과에 대한 검증
도킹 결과는 재도킹을 반복하며(유전 알고리즘에서 다른 초기값을 갖도록 변경해가면서 진행) 정확도, 도킹되는 방향, 예측되었던 상호 작용의 범위 등을 평가하며 검증한다. 리간드의 구조가 고정되어 있다면 비교적 수월하지만, 리간드의 유동성이 증가할수록 일관된 결합 양상을 찾는 것이 어려워진다. 리간드와 단백질의 구조가 복잡하다면, 분자 동역학(molecular dynamics)을 이용해서 어떠한 아미노산 잔기가 복합체의 안정성에 영향을 많이 미치는 지에 대해 평가하는 것이 좋다 [40]. 분자 동영학은 원자와 분자들의 물리적인 움직임을 분석하기 위한 시뮬레이션 도구다. 고정된 시간 동안 원자와 분자들이 상호작용하도록 허용해 두고 그 시스템이 어떻게 진화하는지 관찰한다. 기본적으로는 상호작용하는 입자들 사이의 힘과 위치 에너지를 계산함으로써 작동한다. 분자 동역학 시뮬레이션은 단백질 구조와 역학을 자세히 조사하는데도 유용하며, 리간드와의 상호작용을 평가하기 전후에 최적의 구조를 찾고, 단백질의 유동성을 평가하고, 상호작용 중인 복합체의 구조를 정교하게 다듬고, 유도 적합(induced fit)의 효과를 설명하고, 잠재적인 리간드들 중에 순위를 매기는 등 널리 사용되고 있으며 위양성(false positive) 결과를 줄이는데 중요한 역할을 한다. 2013년 노벨화학상 수상자인 카플러스의 대표적 업적이 분자 동역학 시뮬레이션 프로그램인 CHARMM을 개발한 것이다 [14].
현존하는 어려움들
소프트웨어마다 같은 정보를 주지 않으며, 측정에 있어서도 신뢰도가 모두 다르다. 특히 분석의 대상이 되는 화학 물질이 소프트웨어가 개발될 때의 측정 가능한 화학적 공간을 넘어선다면, 당연히 좋은 결과를 기대하기 어렵다. 좋은 소프트웨어도 새로운 데이터와 명백한 실패 사례를 기반으로 검증되고 개량되며 발전한다.
1) 도킹의 정확도
도킹을 시작할 때의 단백질 구조가 아주 중대한 영향을 미친다 [43]. 데이터 베이스의 단백질 구조는 대개 리간드와 결합한 형태의 것이다. 도킹에 사용할 때는 리간드를 제거하고 단백질만의 구조를 사용해야 한다. 이 과정에서 발생한 차이가 도킹 결과에 영향을 미친다. 또한 결합 부위의 환경도 매우 중요하다. 예를 들어 약물이 세포 내의 수용체와 결합하는 경우를 생각할 수 있다. 소프트웨어 환경에서는 좋은 도킹 결과를 보이던 약물이 세포 내의 복잡한 환경 내에서 반드시 동일하게 작용할 것이라고 확신할 수 없는 것이다. 또한 물 분자를 처리하는 것이 상당히 어려운 문제인데, 리간드가 타겟에 결합할 때 어떤 분자가 결합 부위에 남아있고(예를 들어 분자 사이에 수소 결합을 형성함으로써 다리 역할을 할 수 있다) 어떤 것은 빠져나갈지를 예측하기가 어렵다. 결합 부위 내에서 물 분자의 안정성은 다양한 크리스탈 구조를 분석하거나 정교한 분자 동역학 시뮬레이션을 통해 주로 평가한다.
2) 결합 부위의 유연성
단백질 자체의 유연성이 도킹에 가장 어려운 문제 중 하나이다. 하나의 단백질이 다양한 리간드에 대해 상당한 정도의 구조적 차이를 가지고 결합하기도 하기 때문에 단백질의 결합 부위를 하나의 구조로 정의할 수 없는 경우가 많다. 인터루킨-8에 대한 결합 단백질을 찾는 연구에서 단백질-단백질 상호작용이 얼마나 유연하게 일어나는지 알려진 이후 유사한 많은 사례가 발견되었다. 뿐만 아니라 비교적 고정된 형태를 가질 것이라 예상되었던(자물쇠와 열쇠 모델로 설명되던) 효소와 기질 사이의 상호작용 또한 훨씬 유연하게 변화할 수 있었다.
3) 리간드의 성질
도킹 결과는 리간드가 어떤 효과를 낼 지는 알지 못한 채 특정 타겟에 대한 결합 정보만을 제공한다 [44]. 도킹 프로그램에 따라서는 리간드가 효능제 또는 억제제로 작용할지 여부를 예측할 수 있다고 주장하기도 하는데, 실질적인 실험을 통해 검증하는 것이 정확하다. 또한 강하게 용매화(solvation)되는 리간드의 경우 용매화 효과를 고려해야 하는데, 이를 정확히 평가하는 것이 어렵다.
4) 찾고 평가하는 문제(search and scoring problem)
무엇보다 근본적으로 두 분자가 결합하는 양상을 예측한다는 것 자체가 어려운 일이다. 소프트웨어 나름대로 최적의 결합을 예측하고 점수를 매기는데, 이 방식이 워낙에 다양할 뿐더러 실험적인 결과와 일치하지 않는 경우도 많다. 도킹 문제를 풀기 위해서는 적절한 결합을 찾고 점수 매기는 알고리즘이 통합되는 것이 이상적일 것이라고들 말한다 [45].
3. 결론
조각 방법론은 상향식(bottom-up)으로 덜 복잡한 분자에서부터 출발해서 좀 더 크고 최적화된 분자에 도달하게 한다. 이런 접근법 자체는 단백질에 대한 결합 물질을 찾는 여느 방법론과 다르지 않다. 다만 큰 분자에 비해 훨씬 높은 확률로 조각이 결합한다는 점이 장점이다. 이는 큰 분자에 비해 조각이 넓은 화학적 공간을 효율적으로 탐색할 수 있기 때문이다. 또한 약한 결합력이지만 양질의 상호작용을 한다(크기 대비 결합 에너지가 높다)는 점도 중요하고, 도전적인 단백질의 새로운 타겟 부위를 찾아낼 능력도 있다. 핵심적인 문제는 약한 결합력을 가지기 때문에 스크리닝 과정의 방법론을 잘 정립해야 하고, 초기 조각을 발견한 후 리드로 최적화해 나가는 과정의 방법론도 잘 다듬어야 한다는 것이다. 그러나 기존의 높은 처리량을 요하는 전통적인 스크리닝 방식에 비해서는 훨씬 성공적일 것으로 평가되는데, 여러 가지의 잠재적인 조각에서 출발하여 최적화하는 과정이 있기 때문에 도전적인 타겟에 대해 적용할 더욱 많은 후보를 확보할 수 있기 때문이다.
신약 개발 분야에서 FBLD 방법론이 미친 영향은 리간드와 단백질의 결합을 설명하는 방법론의 개발을 촉진했다는 점이다. 이는 완전히 새로운 종류의 타겟에 대해 도전할 때 큰 도움이 될 것으로 예상된다. 학계의 연구자들에게는 비교적 작은 라이브러리와 간단한 기술만으로 스크리닝을 시작할 수 있다는 장점을 제공한다. 대부분의 경우 타겟에 결합하는 조각은 찾아지기 마련인데, 그것을 어떻게 이용할 것인지가 훨씬 중요하다.
도킹을 비롯한 컴퓨터 기반의 기술도 나날이 발전하고 있고 신약 개발 과정에 널리 이용되고 있다. 그러나 올바르게 이용되지 않으면 도킹 연구에서 나온 결과를 신뢰하기 어렵다. 지금도 도킹 점수가 가장 높은 리간드가 가장 좋은 리드가 되지 않는 경우가 많이 보고되고 있다. 실험 기반의 구체적인 정보와 컴퓨터 기반의 예측 및 평가 능력이 긍정적인 시너지 효과를 내야 좋은 성과를 얻을 수 있으리란 점은 자명하다. 각 분야에서의 기술 발전 속도는 괄목할 만하므로 더욱 많은 타겟에 대한 약물이 발견되고 생명 현상에 대한 이해도 깊어지길 기대해 본다.
4. 참고 문헌
==>첨부파일(PDF) 참조
본 게시물의 무단 복제 및 배포를 금하며, 일부 내용 인용시 출처를 밝혀야 합니다.
자료열람안내
본 내용은 BRIC에서 추가적인 검증과정을 거친 정보가 아님을 밝힙니다.
내용 중 잘못된 사실 전달 또는 오역 등이 있을 시 BRIC으로 연락(view@ibric.org) 바랍니다.