유전자 편집 연구는 1세대 ZFN(Zinc Finger Nuclease, 아연-손가락 핵산분해효소), 2세대 TALEN(탈렌)을 거쳐 3세대인 CRISPR(크리스퍼)를 통해 전환기를 맞았다. 크리스퍼는 세균의 항바이러스 면역체계를 응용한 기술로 세균이 바이러스의 DNA를 기억해 Cas9 효소로 바이러스의 DNA를 잘라내 무력화시키는 면역 시스템을 차용했다. 가이드 RNA의 안내에 따라 표적으로 한 DNA 염기서열을 자르는 이 방법은 설계가 쉽고 비교적 정확하게 유전자를 편집할 수 있어 붐을 일으켰다. 하지만 DNA 이중 가닥을 모두 끊어낸 후 이어지는 자체 세포 복구 시스템에서 절단 지점에서 오작동을 일으키는 등의 문제가 있었다.
차세대 유전자 가위로 불리는 프라임 에디터(Prime Editor)는 DNA의 한쪽 가닥만 잘라내기 때문에 크리스퍼에 비해 훨씬 안전하고 정교하다. 하지만 비교적 간단했던 크리스퍼와 달리 경우의 수가 많아져 설계가 훨씬 복잡해진다는 단점이 존재했다.
연세대 김형범 교수팀은 이 문제를 인공지능과 빅데이터를 활용해 풀었다. 프라임 에디터를 안전하고 정밀하게 설계하고 편집 효율도 예측해 주는 이 연구는 23년 국제 학술지 Cell을 통해 발표됐고 2024년 과기정통부가 선정한 국가연구개발 우수성과 100선 중 생명해양 부문 최우수 연구 성과로 선정되기도 했다. 현재 프라임 에디터 효율을 찾는 이 연구는 어떤 방향성을 가지고 나아가고 있을까? 연세대 김형범 교수를 만나 연구 이야기를 들어보았다. |
Q. 안녕하세요. 교수님과 함께 연구를 소개해 주신다면?
안녕하세요. 저는 유전자 가위 연구자 김형범이라고 합니다. 제 연구는 크리스퍼-Cas9에서 한 단계 더 발전한 프라임 에디터라는 염기 교정기를 이용한 연구입니다. 프라임 염기 교정기를 사용해 원하는 유전자를 바꾸려고 할 때 어떻게 유전자 가위를 설계해야 가장 높은 효율로 사용할 수 있게 할까 하는 고민에서 이 연구는 시작되었는데요. 실제 프라임 에디터는 크리스퍼-Cas9보다 더 정교하고 진보한 기술로 평가받지만 설계가 매우 복잡하고 어렵습니다. 실제로 설계 가능한 경우의 수가 수백 가지 정도 됩니다. 이 수백 가지의 가능성 중에서 염기 교정기가 잘 작동되는 경우는 1% 미만, 그보다 더 적은 경우엔 0.5% 미만이에요. 모든 유전자 가위를 만들어서 하나하나 실험을 다 해볼 수 없기 때문에 효율 예측이 필요합니다. 그래서 제 연구는 프라임 에디터에 대한 작동 기전과 설계, 효율 예측에 관해 연구하고 있다고 말씀 드릴 수 있습니다.
Q. 프라임 에디터를 설계한다는 것에 대해 좀 더 자세히 설명해 준다면요?
프라임 에디터를 설계한다는 것은 결국 가능한 여러 조합(경우의 수) 가운데서 가장 효율적인 조건을 찾아내는 과정입니다. 프라임 에디터에 필요한 설계 요소는 pegRNA(prime editing guide RNA, 프라임 편집 가이드 RNA)를 만드는 데서부터 시작하는데, pegRNA를 디자인하려면, target 염기서열을 찾아야 하고, 그 이후 PBS(Primer Binding Site) 길이, RT template의 길이를 정해야 합니다. target, PBS, RTT 이 세 가지 Parameter의 조합인데, 경우의 수가 수백 가지 나옵니다. 그중에 어떤 조합이 가장 높은 편집 효율을 보일지는 아무도 모르는 거죠. 그래서 이전엔 이 모든 조합을 직접 실험해서 최적 조건을 선별했지만, 이런 방식으로 유전자 교정 가능성을 평가하는데 최대 4개월까지도 소요됩니다. 그래서 우리는 인공지능과 빅데이터를 접목해서 조합을 빠르게 스크리닝하고 최적의 결과를 찾도록 돕는 인공지능 모델을 개발했습니다.
차세대 유전자 가위인 프라임 에디터 연구자 연세대 김형범 교수의 연구는 24년 국가연구개발 우수연구성과 100선 중 최우수 연구로 선정되었다. [사진 = BRIC]
Q. 유전자 가위 기술에서 인공지능(AI)을 접목해야겠다는 생각은 어떻게 처음 하게 됐나요?
사실 처음부터 인공지능을 도입해야겠다고 계획한 것은 아니었습니다. 가이드 RNA의 효율 예측이라는 문제에 부딪혔고 이걸 어떻게 해결할 수 있을지 오랜 시간 고민하던 중 한 계기가 있었습니다. 어느 날 이세돌 바둑기사가 알파고와 대국을 펼치는 방송을 보게 되었고, 사람이 지는 결과를 보며 딥러닝의 가능성을 실감하게 되었습니다. 그때부터 관련 기술을 공부하기 시작했습니다. 그리고 서울대 윤성로 교수님과의 공동 연구를 통해서 인공지능을 적용한 연구를 성공적으로 시작할 수 있었습니다. 우리 랩에서는 High-throughput 기반의 대규모 실험 플랫폼을 구축해서 다양한 조건에서 방대한 양의 데이터를 수집했고 그렇게 축적된 데이터와 분석 기법을 바탕으로 빅데이터, AI를 접목한 연구를 계속해 왔습니다.
Q. 이 연구가 2024년 국가 연구개발 우수성과에서 생명해양부문 최우수 성과로 선정되기도 했습니다. 그 이유에 대해 어떻게 생각하고 계신가요
프라임 에디터 교정기에서 수백 가지 경우의 수 중에서 어떤 조건이 가장 높은 효율을 보일지 예측해 주는 인공지능 모델을 개발했기 때문입니다. 그 기반이 된 것은 2017년, 우리 연구실에서 처음 개발한 High- throughput evaluations 기술입니다. 이것이 우리 실험실의 강점이 되어서 많은 데이터를 모을 수 있었고 그를 통해 프라임 에디터 효율 측정까지 올 수 있었습니다.
처음엔 우리도 유전자 가위를 하나씩 제작하고 효율을 측정하는 방식이 일반적이었지만, 우리는 유전자 가위를 수천에서 수만 개 단위로 한꺼번에 제작하고 동시에 효율을 평가할 수 있는 시스템을 구축했습니다.
구체적으로는 벡터에 유전자 가위랑 타깃 시퀀스를 함께 삽입한 뒤, 타깃 시퀀스만 증폭해서 분석하는 방법이고요. 이러한 High-throughput 기술 덕분에 대규모 데이터를 빠르게 축적할 수 있었고 이를 정밀하게 해석하고 분석하기 위해 딥러닝 기반의 인공지능 모델을 도입했습니다. 이처럼 실험 기술과 인공지능 분석이 유기적으로 결합하면서 프라임 에디터의 편집 효율을 정량적으로 예측하는 시스템을 구축할 수 있었습니다.
Q. 그렇게 해서 Deep Prime(딥프라임)이라고 하는 효율 예측 모델을 개발했습니다. 딥프라임에 대해 좀 더 알려주신다면?
프라임 에디터의 성능을 정확하게 예측할 수 있는 프로그램입니다. High-throughput 기술을 통해서 구축된 빅데이터를 활용해 복잡한 요소를 통합 분석한 딥프라임 서비스를 만들었는데요. 유전자 관리 연구를 하는 분들이 모두 이용할 수 있게 무료로 오픈했습니다.
딥프라임은 사용자가 교정하고자 하는 유전자 염기서열 정보를 넣으면 자동으로 최적화된 pegRNA 디자인을 제안합니다. 단순한 디자인뿐 아니라 각각의 디자인 조합에 대해 예상되는 편집 효율을 수치화해 예상 결과를 수백 개 정도 도출해 줍니다. 이 자료는 딥프라임이 스스로 학습한 딥러딩 결과인 거죠. 스스로 설계하고 스스로 테스트한 결과를 제공하는 메커니즘입니다.
실제 유전자 가위의 편집 효율은 100%가 보장되지 않고 일반적으로 20~30% 수준이 많고 Parameter 디자인이 잘못되는 등의 실수가 있으면 0%가 되기도 합니다. Deep Prime을 이용하면 효율을 미리 예측할 수 있기 때문에 효율을 극대화할 수 있는 것에 의미가 있고요. 앞으로 공동 연구 등을 통해 데이터가 더 쌓이게 되면 정밀성과 안정성을 더욱 향상할 수 있을 것으로 기대하고 있습니다.
Q. 딥프라임 개발 과정에서 기억에 남는 에피소드가 있다면?
사실 지금의 딥프라임 이전에 발표한 다른 모델이 있었습니다. 그리고 그것의 개선점을 반영해 지금의 딥프라임 모델을 만들고 있었는데요. 2022년에 제가 국제 퍼런스를 조직했었는데 거기에 온 연사 한 명이 우리 연구랑 비슷한 내용으로 발표하는 것을 들었어요. 심지어 상대방 논문은 리비전 단계였기 때문에 우리보다 훨씬, 한 서너 달 이상 빠른 수준이었습니다. 순간 ‘저게 나오면 우리는 끝나는 거다’라는 절박한 마음이 들었어요. 그때, 학생들과 함께, anti-scoop이라는 연구 폴더를 만들어서, 집중해서 정리했던 기억이 남습니다. 다행히 비슷한 시기에 같이 공개되었어요.
Q. 교수님은 처음부터 유전자 가위 연구를 하신 건 아니었어요. 이 주제에 관심을 가지게 된 특별한 이유가 있었을까요?
저는 그 전엔 줄기세포를 연구했습니다. 박사후연구원으로 줄기세포 연구를 하다가 한국에 왔는데, 교수 임용은 됐지만 정말 아무것도 없는 상태였어요. 연구실도 조그마한 것이 주어졌고 실험할 수 있는 기계도, 함께 연구할 사람도, 또 당연히 연구비도 없었습니다. 그런 상황에서 출근은 매일 하는데 할 일이 없는 거죠. 실험할 것도 없는 empty 상태였는데 그렇게 막막한 상황에서 논문만 읽을 수밖에 없었어요. 그 당시 유전자 가위에 관심이 많아서, 6개월 동안 유전자 가위 관련 논문만 읽은 거죠. 그렇게 하다 보니까 전공자가 아닌데도 어떻게 연구해야 할지 대충 보이기 시작하더라고요. 그리고 그다음에 연구를 시작하게 됐죠.
(그 시기가 언제였나요? 크리스퍼 나오기 전이었나요?)
네. 전이었습니다. 1세대인 징크핑거 뉴클리에이스라는 유전자 가위가 있었을 때입니다.
Q. 그렇게 이 분야 연구를 시작하셨는데요. 앞으로 교수님의 연구는 어떤 방향으로 진행될 것 같습니까?
지금까지의 유전자 가위는 자연계에 존재하는 유전자 가위였습니다. 크리스퍼-Cas9도 결국 세균의 항바이러스 시스템에서 온 것이니까요. 지금 저희는 인공지능을 통해서 자연계에서 유래되지 않은 유전자 가위를 만드는 연구를 하고 있습니다. Protein language Model, DNA foundation Model 이런 것들을 이용해서 새로운 단백질을 챗GPT로 글짓기 하듯이 새 단백질을 만들어 버리는 거죠. 그리고 얼마나 그 유전자가 잘 작동하는지를 테스트하는 그런 쪽 연구가 이미 전 세계에서 많이 시행되고 있는데요. 우리 연구실도 그런 연구와 함께 유전자 가위를 새롭게 만든다거나 새로운 유전자를 찾는 것에도 관심을 두고 있습니다. 앞으로 이런 연구를 진행하게 될 것 같아요. 이런 과정에 인공지능을 잘하는 학생들이 필요한데, 앞으로 이런 학생들이 저희 연구실에 와서 같이 연구할 수 있기를 바랍니다.
의사과학자이기도 한 김형범 교수는 임상 의학의 한계를 극복할 방법은 연구밖에 없다고 생각했다고 말했다. [사진=BRIC]
Q. 김형범 교수님은 의사과학자 중에 한 분입니다. 의대에 진학했지만 임상 의사 대신 기초과학을 연구하게 된 이유가 있을까요?
저는 진짜 과학을 좋아했거든요. 임상 의사도 사람을 살리는 큰 일을 하지만 임상의학의 한계가 있잖아요. 의과대학 학생 시절 본과 실습을 돌면서 현장에서 직접 임상의학의 역할과 한계를 체감할 수 있었는데요. 그전엔 병원 가면 의사들이 질병을 정말 많이 고쳐주는 줄 알았거든요. 그런데 기대했던 것보다는 잘 안 고쳐지는 것들이 많더라고요. 예를 들어 신장이 제 기능을 못 하는 사람의 경우에 투석을 하는데요. 투석한다는 건 생명을 유지하는 정말 획기적인 방법이지만 결국 치료라기 보단 일종의 관리라고 밖에 볼 수 없는 거죠. 이런 한계를 극복할 방법은 결국은 연구밖에 없다고 생각했어요.
그리고 사실 그런 대의적인 뜻만 가지고 시작한 것은 아니고요. 뭐든 재미가 없으면 하기 힘들잖아요. 앞서 말씀드렸듯이 저는 공부하고 도전하는 걸 좋아하기 때문에 새로운 걸 배우고 새롭게 뭔가를 만들어내는 걸 좋아하다 보니까 좀 더 창의적인 걸 하고 싶다고 생각해서 연구를 시작하게 되었습니다.
Q. 의사과학자 양성에 대한 이야기가 꾸준히 나오고 있는데요. 이미 의사과학자의 길을 걸어가는 사람으로서 해 주고 싶은 이야기가 있을까요?
저도 의사과학자를 택하면서 솔직히 걱정을 많이 했습니다. 왜냐하면 임상이 싫어서 이쪽으로 오게 된 것이 아니라 임상도, 또 환자를 돌보는 일도 의미가 크거든요. 임상도 보람이 크고 뜻깊은 일이기 때문에 아마 둘 다 하고 싶은 마음을 가진 사람이 대부분 일거에요. 저도 그랬고요. 임상도 하고 싶은데 연구도 하고 싶다 이런 마음이었어요. 결국 조금 더 재밌는 걸 선택하면서 연구자가 된 건데 그렇게 시작했음에도 연구가 쉽지 않다는 건 얘기할 수 있어요. 실패가 너무 많고 생각한 대로 거의 안 나온다는 거 그거는 알고 시작해야 한다. 또 노력하는 것만큼 나오지 않은 게 또 연구거든요. 노력과 연구 성과가 비례하지 않는다는 점, 노력을 안 하면 연구는 당연히 좋은 결과가 안 나오겠지만 노력해도 좋은 결과가 안 나올 확률이 굉장히 높다 그걸 아셔야 해요. 생각한 대로 결과가 나오면 그건 누구나 할 수 있는 거고 그럼 재미가 없잖아요. 처음엔 안되니까 너무 힘들었는데 그게 인생인 것 같아요. 또 저는 뭔가를 할 때 빨리 해야 한다고 얘길 많이 하거든요. 빨리, 먼저 해야 하는데 그걸 잘하려면 생각을 잘해야 해요. 플래닝을 잘 짜서 해야 하는데 그 생각하는 걸 대부분의 사람은 힘들어합니다. 그리고 생각도 계속 바꿔가면서 해야 하거든요. 한번 계획을 짜면 처음부터 끝까지 그대로 실행하는 게 아니라 유연하게 상황에 따라 계속 바꿔줘야 합니다. 그게 힘들어요. 그런데 그게 과학이거든요. 그래서 의사과학자를 생각하고 계신다면 생각보다 쉽지 않다, 실패가 많다, 또 생각도 많이 해야 한다는 걸 알고 시작했으면 좋겠습니다.
Q. 이렇게 어려운 연구자의 길을 걸어가면서도 행복했던 순간이 있었을 텐데요. 소개해 주신다면?
제가 지도하는 학생이 처음으로 상을 받을 때 좋았어요. 제가 조교수였을 때 그것도 포스터 상인 작은 상이었는데 그때 기분이 엄청 좋더라고요. 큰 보람을 느꼈었고요.
또 2017년에 처음으로 제가 네이처 자매지에 교수로서 논문을 냈었거든요. 그 처음도 굉장히 기분이 좋았습니다.
그리고 제 제자 중에 첫 번째로 박사 학위를 받은 학생이 성균관대 조교수로 임명됐을 때 그때도 보람과 행복을 느꼈어요. 또한, 한양대에서 가르쳤던 포닥인데 한양대 조교수로 임명된 후, 몇 달 전인가 저를 찾아왔어요. 근데 조교수에서 이제 정교수 됐다고 인사차 찾아왔다는데 기분이 정말 좋더라고요.
Q. 유전자 가위와 같은 유전자 교정 연구에 관심이 있는 후배 연구자에게 해주고 싶은 이야기가 있다면?
진학하기 전이라면 여러 연구실 인턴을 해보면 좋을 것 같다는 얘길 해주고 싶어요. 여러 연구실을 먼저 다녀보고 경험을 해보라고요. 진학한 경우라면 지도 교수님이랑 밀접한 커뮤니케이션이 필요하다고 생각합니다. 자기가 뭘 하고 있는지 무슨 무슨 연구에 관해 어떤 생각을 고 있는지, 그래서 무엇을 공부하고 있는지를 공유하면 어드바이스를 받을 수 있거든요. 그런데 이건 자기 상황을 공유해야만 받을 수 있습니다. 지도 교수와 밀접한 커뮤니케이션을 유지하는데 자기가 가지고 있는 노력의 10%는 써야 한다고 생각합니다. 그걸 기억해 두면 좋을 것 같아요.