국내외 바이오 관련 동향 뉴스를 신속하게 제공합니다.
뉴스 생물산업
아두카누맙 (Aducanumab). 세계 최초의 치매 치료약이 될까?
Bio통신원(Beyond Lab.PhD)
졌.잘.싸. (졌지만 잘 싸웠다.)
축구 경기에서 졌.잘.싸.라는 기사를 종종 보곤 한다. 축구경기는 골 득점수로 결과를 가린다. 만약, 우리가 정해진 규칙 (득점수)에 의해 패배한 뒤, "가만있어봐. 우리가 슈팅수도 더 많고, 볼 점유율도 대등했고, 상대방보다 파울수는 더 적고...." "그러니 우리가 이긴 것으로 하자" 라고 한다면 어떨까?
오는 2021년 3월 7일로 예정되었던 세계 최초의 근치적 알츠하이머 (AD) 치료제. 아두카누맙 (Aducanumab, Biogen)의 운명이 3개월 뒤로 더 미루어졌고, 주가는 다시 반등하였다.
참조 1.
https://pharmaphorum.com/news/biogen-shares-soar-as-fda-delays-decision-on-aducanumab/
원칙적으로 아두카누맙에 대한 두 개의 3상 RCT 연구 (EMERGE Trial, ENGAGE Trial)는 1차 평가지표를 만족하지 못하였으므로 사실상 실패. FDA로서는 그냥 승인거절 하면 되는 일인데, 평가를 뒤로 미루었으니, 사람들의 기대감이 커진 모양이다.
바이오젠의 아두카누맙은 우여곡절이 많았다. EMERGE Trial, ENGAGE Trial 은 무용성 평가에서 이미 1차평가지표를 만족시키기 어려울 것으로 보고 임상개발이 중단되었지만, 다시 평가한 하위분석군에 대한 결과에서 희망적인 결과를 통해, 바이오젠은 다시 아두카누맙을 살리고, 2020년 말 FDA에 신약승인을 위한 서류를 제출 (BLA) 한 것이다.
EMERGE Trial, ENGAGE Trial 연구의 결과분석을 살펴보기도 전에 두 개의 3상 RCT 연구 (EMERGE Trial, ENGAGE Trial)를 신약 허가 관점에서 사실상 실패라고 생각하는 이유는 다음과 같은 원칙 때문이다.
1. Add-hoc으로 시행된 하위분석 (Sub-group analysis)결과는 아무리 유의미하고 중요한 발견이라도, 1차 평가 지표를 미충족한, 실패한 3상 임상시험을 구제하지 못한다.
2. Add-hoc, 즉, 어떠한 분석이든 사전에 계획되지 않은 (pre-specified) 않은 분석이라면, 탐색적 가설의 제시만 가능하며, 과학적 결론을 내릴 수는 없다.
3. FDA는 항상 두 개의 독립적인 3상 시험을 요구하며, 두 연구를 모두 성공시킴으로써, 통계적 1종, 2종 오류의 가능성을 최대한 예방하는데, 두 연구의 결과가 일치하지 않는다.
임상시험은 제약회사의 관점에서 2종 오류 (실제로 약효가 있는데, 임상시험 결과 효과 없는)의 위험과 허가기관 (FDA, EMA, 식약처 등)의 관점에서 1종 오류 (실제는 효과가 없는데, 임상시험 결과 효과 있는)의 위험을 피하기 위해 다양한 장치를 마련하고, 임상시험을 수행하며, 이를 사전에 계획하고, 정해진 방법론에 의해 해석한다.
EMERGE Trial, ENGAGE Trial의 결과를 해석하는 바이오젠의 관점(아래에 요약 기술함)은 허가기준에서는 많이 부족하다. 일단, 두 연구 모두 1차 평가지표, 2차 평가 지표 모두 만족하지 못했으니, 그것으로 이미 게임오버.
1차, 2차 평가지표를 만족하지는 못했지만, 하위분석에서의 결과와 2상까지 쌓여온 긍정적인 신호들은 너무나 희망적인 결과였고, 바이오젠뿐만 아니라, 환자들의 입장에서도 이렇게 끝내기는 너무 어려울 것이다. (물론 2상까지 잘 달려오다 3상에서 쓰러지는 약이 한 둘은 아니다)
참조 2.
22 Case Studies Where Phase 2 and Phase 3 Trials Had Divergent Results
FDA vs 외부자문위원회 (AdCom, Advisory Committee)
근치적인 (Disease modify) 알츠하이머 치료제가 전무하기 때문에 시급성에 있어서 FDA의 고민이 시작된다. (정치적 이슈나 다른 이유가 없다면.... 공교롭게도 미국 대선 후, 바이든이 승리 연설을 하면서, 알츠하이머 치료를 위한 정부의 투자의지를 언급하였다. 바이든은 선거기간 동안 치매 공격을 받았다)
또한, 환자와 가족들은 FDA에 아두카누맙의 승인을 강하게 압박하고 있고, 의료진들의 경우, "승인은 반대하지만, 승인된다면 처방할 것이다"는 조사 결과도 있으니 ("안전성에 있어서는 관리가능, 어차피 치료약이 없다면 아두카누맙이라도 시도하겠다"로 이해됨)
참조 3.
FDA로서는 바이오젠이 주장하는 EMERGE Trial, ENGAGE Trial의 결과 해석을 통계적 적합성만 가지고 단호하게 "거절" 하는 것이 쉽지는 않을 것이다. 실제로 FDA는 2020년 말 내부평가를 통해 승인을 내리는 쪽에 좀 더 무게중심을 실었다.
참조 4.
Data for Biogen's Alzheimer's hopeful aducanumab 'highly persuasive': FDA briefing documents
여기에 FDA가 최근 환자 중심 의학, 신약에 대한 접근성, 새로운 기전이나 접근방식(modality)에 대한 새로운 평가/연구 방법론을 강조하며, 다양한 심사기준 혁신 (통계적 대원칙을 파기하면서 까지?)을 도모하고 있다는 점을 보면, 어쩌면, 승인할 수도 있겠다?? 는 생각도 들려는 찰나..
FDA의 내부평가 발표의 잉크가 마르기도 전에,
아두카누맙에 대한 외부자문위원회는 투표를 통하여 승인 반대 10표, 승인 찬성 0표 (1 불확실)로 아주 확실하게 아두카누밤의 임상적 유효성에 대한 근거가 없다고 답하였다. (자문위원회의 결과를 FDA가 따라야 할 의무는 없지만)
FDA Advisory Committee Rejects Biogen’s Alzheimer’s Treatment
https://www.biospace.com/article/fda-advisory-committee-rejects-biogen-s-alzheimer-s-treatment-/
어떻게 될까? FDA는 자문위원회의 10대 0, 반대를 무시하고 승인을 내릴까?
시나리오 예측
결국, 승인 아니면 불허인데, FDA입장이라면 어떤 전략을 가져가는 것이 덜 험난해질까?
승인할 경우.
1. 일단 제한적 환자군에서 고용량으로 승인은 주되, 효과를 보인 고용량 군에 대한 전향적 3상 시험을 다시 실시하고 결과를 받아 재평가하는 조건부 승인. (바이오젠도 data의 비완결성을 인정한다면, 현실적으로 바이오젠도 원하는 시나리오라고 본다. 부담(돈)은 좀 있겠지만, 시판하여 판매할 수는 있으니)
2. 신약 허가의 원칙에서 예외 사례는 되겠지만, 조건이 달렸으니, 자문위원회의 10:0 반대의견을 완벽하게 부정하는 것은 아니므로, 적절히 전문가들의 의견을 고려하여 비난을 최소화해볼 수 있다. (물론, 자문위원회의 결정을 따를 의무는 없지만, 10:0 반대를 무시하여 전면 승인을 내리는 것은 아주 FDA로서도 매우 큰 부담이다. )
승인하지 않는 경우.
1. FDA도 원칙을 깨면서, 자문위원회의 반대를 정면으로 맞서서 승인하기는 큰 부담이다. (자문단 투표 결과가 10:0인데, 자문단의 의견이 첨예하게 갈리는 경우도 아닌데, 이렇게 승인한 사례는 현재까지 단 1건도 없다. 아래 참조 5)
2. 3개월의 리뷰 기간 연장을 갖는 것은, 향후 승인을 거절할 경우를 염두에 둔 사전 포석으로써는 좋은 선택으로 보인다. 승인을 거절해도 이미 FDA는 시급성과 과학적 근거에 대해 충분히 고민했다는 제스처가 되기 때문이다. (우리가 3개월이나 더 검토하고 노력했지만, 자문위원회 반대로 승인은 힘들었다.고 입장발표가 가능하다)
우선, 바이오젠이 설명하는 과학적 해석과 통계적 적합성은 이미 FDA의 허가 원칙에서는 Fail 이기 때문에 임상시험 자체에 대한 고찰을 살펴보기보다는 과거의 사례를 한번 살펴보았다.
FDA가 자문위원회 의견과 반대되는 결정을 내린 사례가 있을까?
참조 5.
https://pubmed.ncbi.nlm.nih.gov/31304643/
2019년 흥미로운 연구. FDA가 신약을 승인할지? 거절할지? 미리 예측해볼 수 있는 여러 예측인자들 중에서 자문위원회의 투표 결과를 지표로 분석하였다.
2008년 ~ 2015년까지 376회의 투표 미팅을 분석했더니, FDA가 자문위원회와 다른 최종 결정을 내린 경우는 산술적으로 22%. 이 중에서 자문위원회 투표가 신약 승인에 우호적(favorable)이었는데, FDA가 불허한 경우는 75% 자문위원회 투표가 신약 승인에 부정적(unfavorable)이었는데, FDA가 승인 내린 경우는 25% (아두카누맙은 후자의 상황이 될 것이다. 아직 FDA가 승인 내린 것은 아니지만)
FDA가 자문위원회한테 반하는 경우가 22%나 있네? 할 수 있겠지만, 이 연구에서 FDA가 자문미팅의 권고사항을 따르지 않는 "유일한" 예측인자는 자문위원회의 투표 결과가 갈려서, 자문위원회 조차 합의 (consensus)를 이루지 못하는 경우 라고 분석하였다. (하지만 Aducanumab은 10:0으로 자문위원회는 완벽한 합의로 반대중이다.)
좀 더 오래된 연구도 크게 다르지 않다 (아마 FDA가 더 보수적이었을 시기)
참조 6.
2013년 맥킨지에서 발간한 분석자료로, 2001년 ~ 2010년의 기간 중, 완전히 새로 진출하는 신약 (NDA 혹은 BLA)만 추려 63개의 투표결과를 분석해보니, 단, 2건에서 자문위원회가 반대한 약을 FDA가 승인하였다. (물론, 아두카누맙이 이런 예외적인 케이스가 되지 말란 법은 없다.)
다음으로는 역시 임상데이타. 바이오젠의 해석이 통계학에 기반한 허가의 관점을 만족시킬 수 있을까?
바꿔 말하면,
아두카누맙의 임상적 유효성을 치료(Treatment)와 환자예후(Outcome)의 인과관계로 결정지을 수 있을까?
논란이 되는 두 개의 독립적인 (FDA가 요구하는 필수사항) 3상 임상결과(EMERGE Trial, ENGAGE trial)
참조 7.
https://investors.biogen.com/static-files/f91e95d9-2fce-46ce-9115-0628cfe96e83 (슬라이드)
1차 평가지표를 만족하지 못했던 이유에 대해 바이오젠의 설명은 다음과 같다.
(1차 평가지표 - CDR-SB : 인지기능의 측정, 치매연구에서 대표적인 평가지표)
1. 임상시험 중에 총 4번의 임상시험계획 변경 (protocol amendment)가 있었다.
2. 뇌를 표적으로 하는 항체치료제는 보통 ARIA라고 하는 (뇌가 부음) 부작용이 있음.
3. ApoE carrier에서 (치매 위험도 높다) ARIA 위험이 높으니, Protocol 3 까지는 이들에게 저용량만 투여.
Protocol 4에서 결정적인 변화가 있는데,
1. 두 연구는 각각 환자를 1600명 정도 모집을 하는 동일한 디자인의 연구였고,
2. 각각 환자 600 (EMERGE), 800명 (ENGAGE)까지 enroll 한 시점에서
3. 생각보다 이 ARIA라는 부작용이 나타나지 않거나 쉽게 관리 가능하다는 경험이 쌓이면서
4. 이들 고위험군에게도 고용량 (10mg/kg)로 up-titration 하는 임상시험계획 변경을 결정함.
쉽게 요약해보면, EMERGE 연구의 경우 Protocol ver4에서 600명밖에 모집되지 않은 시점에서 고용량 투여가 이루어져서, 나중에 등록된 환자들은 고용량에 노출될 기회가 많았다. EMERGE에서 고용량 투여군은 효과가 보인다.
ENGAGE 연구는 이미 연구가 많이 진행된 시점에서 Protocol version 4가 적용되어서, 고용량 환자들이 별로 없었고, 결과가 희석되어 실패한 것이다. 4번째 Protocol 변경이후의 환자들만 따로 보면, 역시 고용량 투여군은 효과가 보인다.
1차 평가지표뿐만 아니라, 다른 2차 평가지표들 MMSE, ADCS-ADL-MCI 등도 모두 동일한 양상을 보여서 바이오젠은 이러한 결과의 배후에 용량 의존적인 임상적 유효성이 있다고 해석하였다.
2차 평가지표는 아니지만, 그 밖의 병리소견들 (PET으로 확인한 pTau, total Tau, b-amyloid) 은 인지개선(1차 평가지표 변화) 여부와 상관없이 모두 변형단백질들이 사라져서 개선을 확인하였다. 안전성 또한 충분히 관리가능한 수준으로 해석하였다.
일반적인 관점에서는 이러한 분석이 타당해 보이겠지만, 실제 임상개발과 통계학, 허가의 관점에서는 많은 문제가 발생한다.
임상시험, 통계, 허가의 대원칙
아이러니하게도 바이오젠은 결과에 대한 해석과 동시에 실패의 원인을 설명하면서, FDA에 BLA 제출을 하였다. 이러한 실패의 원인을 함께 고려하였을 때, 두 개의 3상 연구가 보여준 하위분석 결과(sub-group analysis)는 아두카누맙과 인지개선의 인과관계를 입증한다는 것이다.
이게 왜 문제가 될까?
참조 8.
Subgroup analyses in confirmatory clinical trials: time to be specific about their purposes
https://bmcmedresmethodol.biomedcentral.com/articles/10.1186/s12874-016-0122-6
FDA and CPMP rulings on subgroup analyses - PubMed
https://pubmed.ncbi.nlm.nih.gov/16847375/
https://www.sciencedirect.com/science/article/pii/S0895435618308916
3 reasons why you should be suspicious of study ‘subgroup’ results
"Sub-group analysis (하위그룹분석)"를 검색해보기만 해도 이를 바라보는 과학적인 해석과 관점들이
얼마나 많은 논란을 야기하고 있는지 볼 수 있다.
기본적으로 특정한 "치료 행위"와 그 결과(환자예후)의 "인과관계"는 전향적인 방법으로 (Prospective) 무작위(Radomization), 대조군(Control), 맹검 (Blinding)의 장치와 IIT, PP 분석을 함께 살펴보면서 확립된다. 여기에 P-value, Sample power, superior, non-inferior margin 등. 많은 사전 임상시험계획서에 정의해둔 분석 방법론을 도입하여 과학적 결론을 내리도록 한다. (이 글에서는 임상시험에서 위 장치들이 어떻게 임상적 중재와 결과 사이의 인과관계를 확립하는지에 대해 그 통계학적 기전 다루지 않음)
"sub-group analysis"는 전향적인 연구 (RCT)를 통해서 확보된 결과인 건 맞지만, 본질적으로는 Observational study (관찰연구)라는 점을 염두에 두고 해석해야 한다.
위 검색자료들에서 공통적으로 찾아지는 3개의 P 가 보이는데, Pre-sepcified, Powered, Plausible 가 그것이다.
Pre-specified plan (어떻게 분석하기로 미리 정하여 임상시험계획서에 명시적으로 정의함) 하에서 분석을 시행한 경우, 이를 post-hoc이라 하고, 사전 계획 없이 연구 종료 이후에 데이타를 다시 뜯어보고 분석하는 것을 ad-hoc이라 하는데, 당연히 pre-specify 된 경우에만 인과관계를 지원한다. (최근에는 post-hoc, ad-hoc의 구분을 두지는 않는 것으로 보인다. 당연히 pre-specify 된 분석이 아니라면, 과학적 결론을 내릴 수 없기 때문에, 최근에는 post-hoc이든 ad-hoc이든 정확하게 Pre-specified라는 단어를 명시적으로 표현하여 기술하는 경우가 많다.)
Subgroup 간의 차이에 대한 결과가 임상적으로 타당 (Plausible) 해야 하고 다른 근거/결과들과 함께 설명 가능한 것이어야만 설득력이 있다. Subgroup 간의 차이를 확정적으로 결론 내릴 수 없으며, 당연히 하나의 연구 안에서 비교해야 하고, 이는 그룹간의 차이로 기술하지 말고, 전반적인 분석 결과를 서술적으로 기술하는 것이 좋다.
Subgroup 간의 통계적인 유의성과 관련하여 각 Subgroup 은 다른 상황에 대한 서로 다른 치료적 중재효과가 있다는 것을 고려해야 하고, 이에 따라 통계학적으로 계산된 Powered size가 확립되어야 한다.
다시 맨 첫 문단의 3가지 원칙으로 돌아가면,
1. Add-hoc으로 시행된 하위분석 (Sub-group analysis)결과는 아무리 유의미하고 중요한 발견이라도, 1차 평가 지표를 미충족한, 실패한 3상 임상시험을 구제하지 못한다.
2. Add-hoc, 즉, 어떠한 분석이든 사전에 계획되지 않은 (pre-specified) 않은 분석이라면, 탐색적 가설의 제시만 가능하며, 과학적 결론을 내릴 수는 없다.
3. FDA는 항상 두 개의 독립적인 3상 시험을 요구하며, 두 연구를 모두 성공시킴으로써, 통계적 1종, 2종 오류의 가능성을 최대한 예방하는데, 두 연구의 결과가 일치하지 않는다.
이제, 두 개의 독립적인 (FDA가 요구하는 필수사항) 3상 임상결과(EMERGE Trial, ENGAGE Trial)로 부터 도출된 바이오젠의 하위분석 결과가 다르게 보인다.
"우리가 슈팅수도 더 많고, 볼 점유율도 대등했고, 상대방보다 파울수는 더 적고...." 하고 있지만...
1. 두 연구의 하위분석 결과는 임상실패선언이후 다시 분석해본 결과로써 pre-specify 한 (약속에 의해, 계획적으로 의도된) planned population, planned analysis 가 아니며,
2. pre-specify 된 분석이라 하더라고, 하위분석 결과는 본질적으로 관찰연구로서 "인과 관계"를 특정하지 못하고, 탐색적 가설만 제시할 수 있으며,
3. 두 개의 독립적인 3상 시험이 서로 일치하지 않으면, FDA는 승인하지 않는다.
사실 이 원칙은 FDA가 여러 기회를 통해 수시로 밝히고 있는 원칙이기도 하다.
참조 9.
Subgroup analyses (하위군 분석은)
- could inflate type 1 error (1종 오류를 증가시킨다.) : 약효가 없는데 있다고...
- cannot save failed trials (실패한 임상시험을 구제하지 못한다) : 실패는 실패이다.
- concerns over ad hoc analyses (Ad-hoc 분석에 따른 우려가 있다. ) : 관찰결과이며, 인과관계를 특정하지 못한다.
설령, 하위분석 군의 통계학적 수치의 차이(23% ~ 30% 개선)를 인정하더라고 CDR-SB 수치로는 0.4 점 언저리이기 때문에 설령 하위분석군의 통계적 유의성을 인정하더라도, 임상적 유의성은 거의 없다는 점도 문제가 된다. FDA는 임상시험에서 통계적 유의성뿐만 아니라 임상적 유의성을 함께 고려하도록 지침하고 있다. (즉, 통계적인 차이를 통해 인과성은 입증되지만, 임상적으로 그 효용이 크지 않다면, 승인하지 않을 수 있다)
승인? or 불허? 승인되면 어떻게 될까?
졌잘싸..라고 6월 7일 최종 결과를 앞두고 forward looking statement 하였지만, 정확하게 표현한다면, 승인되지 말아야 할 이유가 너무 쉽게 찾아진다라고 해야할 것 같다.
특히, 현재의 3상 하위분석 결과와 2상 data들 가지고 (주도 Tau Tangle이나 amyloid plaque의 개선) 승인이 될 경우, 1종오류 (효과가 없는데, 있다고 결론/승인)를 범한다면, 관련 업계 전체가 잘못된 가설을 계속 붙잡고 늘어지는 상황이 될 수 있다는 점은 우려가 될 수 있다.
(알츠하이머 (AD)의 병태생리를 기술할 때, 아두카누맙을 필두로 한 Beta-amyloid 가설만이 유일한 것은 아니기 때문에, 계속 "이 산이 아닌데.. 하면서도 계속 오를 수밖에 없는 상황"을 만들어주는 불필요한 희망고문의 상황이 연출된다.)
또한, 아두카누맙이 일관적으로 보여주는 강력한 한 데이타는 2상과 3상까지 확인되는 Tau나 amyloid plaque와 같은clinical marker 들인데, 아무리 3상 data를 뒷받침한다고 해도, patient outcome (환자예후)이 따라주지 않으면 이는 보조적인 지표 그 이상이 되지 못한다.
FDA의 혁신적인 승인 기조하에서 항암제 (Oncology) 분야의 조직 불문 항암제 (tumor agnositc medicine) 연구들이 특정 바이오마커만으로 실제 FDA 승인이 이루어지고 있지만, 이는 어디까지나 사전에 계획된 프로토콜 하에서 환자의 예후 (Patient outcome) 지표들로 대변되는 1차 평가지표를 만족시킨 경우에 한해서라는 점을 봐야 한다.
허가기관의 관점에서 과학적 데이터의 해석이 어떠한 원칙으로 이루어져 왔는지 정리해보았는데, 살펴본 몇 가지 대원칙들에 대해서 바이오젠이 모르지는 않을 것이다.
상당한 추진력을 보이는 바이오젠이라면, 설령 FDA 승인이 거절되더라고, 하위분석에서 효과를 보인 고용량 군만 모아서 3상 시험을 다시 하면 된다. 구지, 득점수는 밀리지만, 볼 점유율과 파울숫자등등을 운운하며, 졌잘싸라고 주장할 필요는 없다. 하위 분석으로부터 탐색적 가설을 설정하였으니, 확증적 3상 시험으로 검증하면 되는 것이다. (물론, 그렇게 막대한 자금이 다시 소요되니, 쉬운 결정은 아니며, 다시 3상을 시행하여 실제로 효능을 입증하고 시판 허가되어 기사회생한 약이 흔하지는 않다)
이 모든 예측과 전망은, 세계 최초의 알츠하이머 치매 치료제라는 타이틀이 헤드라인을 장식할지 아닐지는 오는 6월 7일 판가름 날 예정이다. 어떤 결과든 그 배후에서 다루어진 해석과 논의들이 무엇이었을지도 궁금해진다.
본 기사는 네티즌에 의해 작성되었거나 기관에서 작성된 보도자료로, BRIC의 입장이 아님을 밝힙니다. 또한 내용 중 개인에게 중요하다고 생각되는 부분은 사실확인을 꼭 하시기 바랍니다.
[기사 오류 신고하기]