한빛사 인터뷰
1. 논문관련 분야의 소개, 동향, 전망을 설명, 연구과정에서 생긴 에피소드
(1) 쓸모 없는 이야기들
"준킴님 시간되십니까."
이번 연구는 갑자기 날아든 메일로부터 시작됐습니다. 이전 직장에서 일하고 있던 어느 날, 김천아 박사님이 학부생한테 메일을 받았다며 연락을 주셨거든요. 듣자하니 어떤 학부생이 우리 논문을 재밌게 읽었다며, 자기가 코딩을 엄청나게 잘하니 논문 내용을 자동화하는 프로그램을 짜보고 싶다는 내용이었습니다. 김천아 박사님은 저에게 어떻게 생각하냐고 물었고, 저는 이왕 코딩 잘하는 친구면 다른 더 좋은 연구를 같이 해보자고 제안 드렸습니다. 대학원생 시절에 김천아 박사님이 저를 가르쳐줬는데, 그때 같이 공부했던 내용에서 시작된 연구를 확장시켜 마무리 짓자는 것이었죠. 그렇게 논문이 하나 발표됐습니다.
이 연구는 제가 박사후연구원으로 일할 때 발표했던 논문의 후속입니다. 당시에도 이번 논문과 같은 학술지에 논문을 하나 발표했습니다. DNA가 깨지고 붙으며 돌연변이가 심각한 형태로 쌓인 선충에 대한 연구였어요. 이준호 선생님 연구실에서 김천아 박사님이 "이건 중요하다!"라며 미리 점지해서 생산해둔 소중한 데이터였죠. 어찌저찌 해서 논문을 투고하고 동료 평가를 받았는데요, 평가자 중 한 분이 DNA 손상을 회복하는 과정에서 눈에 띄는 특징이 남으니 그걸 한 번 대규모로 검출해보라는 제안을 줬습니다. 코딩도 개판으로 하던 시절이었는데, 어찌저찌 대충 짜서 논문에 추가할 수 있었습니다. 덕분에 논문 질이 확 올라갈 수 있었죠. 이 자리를 빌어 익명의 평가자에게 다시 한 번 감사를 드립니다.
그렇게 논문을 내고 나니, 제가 짰던 코드를 좀 더 정밀하게 다듬어서 범용적으로 쓸 수 있도록 자동화를 하면 좋겠다는 생각을 계속 하게 됐습니다. 공부를 좀 더 해보니 당시 논문 낼 때 분석에 활용한 방식이 아닌 다른 형태로도 DNA 손상이 회복될 수 있더라고요. 이것까지 포함해서 보다 포괄적인 분석을 자동으로 처리해주는 프로그램을 개발하는 게 가능할 것 같았습니다. 이것만 처리해도 논문 하나 뚝딱일 것 같아서 얼른 정리해야겠다는 생각을 했죠. 물론 그 사이에 계속 정규직 일자리 알아본다고 지원서 줄창 내고, 새로운 논문 쓰고, 이직하고 이사하는 등 온갖 일이 겹치니까 쉽진 않더라고요. 그래서 머릿속에 계속 생각만 해두고 미룰 수밖에 없긴 했습니다.
그때 마침 현우 씨를 만난 겁니다. 그래서 현우 씨 붙잡고 왜 이 연구가 중요한지, 우리가 보려고 하는 특징이 무엇인지, 어떤 절차를 통해 그 특징을 확인하고 의미를 부여할 수 있을지 등등 자동화를 위한 온갖 설명을 했습니다. 김천아 박사님과 셋이서 이야기하면서 내용을 계속해서 점검하고 회의했죠. 당연한 얘기지만 처음부터 잘 되진 않았어요. 현우 씨는 그때만 해도 생물학이랑 컴퓨터공학 전공 수업을 많이 듣긴 했지만 연구를 직접 해본 경험은 당연히 없었거든요. 신상을 까자면 현우 씨는 당시 이전 한국 나이로 스무 살, 만으로 19세 정도 됐습니다. 현우 씨가 프로그램 개발에 활용해보고 싶다고 하는 방식도 많았지만 그거 다 쳐내고 제가 제안하는 방식으로 일단 따라가보는 게 좋다는 걸 설득하느라 시간도 꽤 썼습니다. 아슬아슬하게 설득이 이어지던 때가 기억이 나네요. 한동안 방향을 잡느라 가장 많은 시간을 썼던 것 같습니다. 그 사이에 저는 또 한 번 이직하게 됐고, 현우 씨는 그때부터 충남대로 출근하면서 본격적으로 연구를 시작하게 됐습니다.
처음에는 연구실도 없다시피 해 개판으로 일했습니다. 책상이고 뭐고 없어서 실험대에 모니터 올려두고 일했습니다. 의자도 없어서 학교 어딘가에서 주워온 실험대보다 한참 낮은 의자에 앉아 높디높은 모니터를 올려다보고 일을 했습니다. 공간도 따로 없으니 고성능 서버랑 같은 방에서 일을 했는데요, 소음이 어찌나 심한지 노이즈캔슬링도 그냥 뚫리는 상황이었습니다. 그나마 연산 처리할 것도 부족해 한현호 교수님께서 연산 자원을 제공해주시지 않았다면 일도 똑바로 못했을 겁니다. 그 공간에서 현우 씨랑 방학 내내 매일 12시간 넘게 일하면서 본격적으로 프로그램 개발하고, 데이터를 처리하고, 결과가 나오면 다시 점검하고, 코드를 뜯어고치고, 다시 데이터를 처리하면서 방학을 보냈습니다. 김천아 박사님께도 계속해서 연락 드리고 회의를 하며 일을 마무리했던 게 떠오르네요. 정규직 되고 나니 박사후연구원 때보다 마음은 편했는데, 구르는 시간은 비슷하더라고요. 그래도 같이 구를 사람이 있어서 즐겁게 일하긴 했네요. 저도 현우 씨도 일하는 걸 즐기고, 인생에 있어서 일하는 걸 매우 높은 우선순위에 두는 사람들이라 재밌을 수밖에 없었거든요. 힘들긴 해도 기분 좋은 시간이었습니다.
그렇게 해서 프로그램의 첫 번째 버전이 완성됐습니다. 그때부터는 현우 씨에게 본인이 작성한 프로그램을 설명하는 논문의 초안을 작성해보시라 지도했습니다. 다 뜯어고쳤습니다. 수십 번을 넘게 뜯어고치며 회의를 했고, 드디어 첫 번째 논문 초고가 나왔습니다. "연습했다 칩시다?" 저는 현우 씨에게 가볍게 말하고는 학술지 투고용으로 또 뜯어고치고 영작해서 냈습니다. 다음 논문 낼 땐 금방 늘어서 더 잘 쓸 거라는 말과 함께 말이죠. 현우 씨랑 보낸 두 번째 방학이 지나고 난 뒤, 24년 2월 말쯤 논문 초안이 완성됐습니다. 현우 씨 인생 첫 논문이었습니다. 완성된 논문은 원래 다른 학술지에 보냈어요. 워낙 전통 있는 학술지라서 한 번 내보고 싶은 곳이 있었거든요. 아쉽게도 거절 메일을 받았습니다. 그런데 내용이 자기네는 수준이 높고 의의가 높은 논문만 싣는다는 거였어요. "뭐지 이건?" 보통은 예의상이라도 자기네랑 관점이 잘 안 맞아서 거절한다고 하는 학술지가 대부분이거든요. 메일에 쓰인 문구는 일반적인 수준을 제법 벗어나있었습니다. 제가 그때 자격지심을 친친 감은 안경을 쓰고 읽어서 그런가, "그쪽 논문은 우리 학술지에 싣기엔 수준이 낮고 의의가 낮네요, 죄송 ^^"이라고 읽히지 뭡니까. 그래서 개열받아서 한국인이 사랑하는 영향력 지수(impact factor) 기준 분야 최상위 학술지에 보냈습니다. 그렇게 수락됐지 뭐예요. 인생 하여간 모를 일입니다. 발표해준 학술지는 물론이고, 거절해준 학술지에도 감사를 전할 따름입니다.
(2) 어쩌면 더 쓸모 없을 연구내용
연구 내용은 뭐 얼마나 중요하겠어요. 그래도 짧게 써보자면, 기본적으로는 고도화된 DNA 서열 분석 기법인 롱리드 시퀀싱(long-read sequencing) 데이터를 최대로 활용하기 위한 제 발악이라고 생각하시면 되겠습니다. 요새 기술이 좋아지면서 예전에는 3조 원씩 들던 휴먼 게놈 프로젝트, 인간 유전체 지도 사업이 대충 수천만 원 수준이면 가능하게 됐거든요. 아직은 여전히 비싸긴 하지만 그래도 초기 데이터는 전세계 선도 그룹에서 꾸준히 발표되고 있습니다. 개인맞춤형 인간 유전체 지도 사업이 수백 명 규모로 지속되고 있는 상황입니다. 한국에서도 하고 있습니다. 국립보건연구원에서 한국인 판지놈 지도 구축을 1000명 규모를 목표로 시작했거든요. 데이터가 계속해서 쌓일 게 확실한 상황인 겁니다.
이번에 만든 프로그램은 이 인간 유전체 지도 데이터를 분석해서, 사람들이 지닌 변이가 대체 어떤 DNA 손상 회복 과정을 통해 형성된 것인지를 유추해주는 프로그램입니다. 자동화도 잘 되어있고, 고성능 컴퓨터도 효과적으로 활용해서 매우 빠르게 데이터를 처리합니다. 제 연구실에 있는 적당한 수준의 고성능 컴퓨터를 이용하면, 사람 유전체 지도 100개 정도를 처리하는 데 하루 정도면 충분합니다. 관련 분야에서 일하는 분들이 아직은 많지 않겠지만, 향후에 점점 늘어나서 활용도가 늘어나길 바라고 있습니다. 그럴 수밖에 없을 거라는 게, 제 확신이기도 합니다. 학술지도 그런 점에서 받아준 게 아닐까 싶기도 하고요. 혹시 써보고 싶으신 분들은 다음 페이지 들어가보시면 되겠습니다.
https://github.com/Chemical118/GDBr
(3) 현우 씨에 대한 찬가
이 연구는 지금도 학부 다니고 있는 고려대학교 유현우 학생이 전부 진행한 일입니다. 저는 초반에 찾아야 하는 특징과 배경지식, 최종으로 얻어야 하는 결과물만 잘 설명했고, 나머지 프로그램 개발은 현우 씨가 거의 전부 다 했습니다. 제가 한 건 이 분야에서 중요한 질문을 찾고, 그 질문을 풀기 위한 방법론을 대략 고민하고, 현우 씨한테 설명한 게 거의 다입니다. 현우 씨가 가져온 거 토론하고 논문 뜯어고치고 마무리 하는 작업도 진행하긴 했네요. 참고로 논문에 들어간 글은 제가 거의 다 고쳐서 새로 썼습니다만, 프로그램에 들어가있는 코드는 제가 쓴 게 한 줄도 없습니다. 제가 초반에 대략적인 방향을 잡아주기도 했지만, 결국 현우 씨가 더 좋은 방향으로 가닥 잡아서 짰거든요. 다 현우 씨가 본인 역량 잘 살려서 한 일입니다. 아주 위대하신 분입니다.
현우 씨 일하는 거 보면 아주 부럽고 자랑스럽습니다. 저는 학부생 때 그런 실력을 갖추지 못했거든요. 대학원생 때도 실제로 연구에 쓸 수 있는 실력은 2년 정도 지난 뒤에야 갖출 수 있었던 것 같습니다. 현우 씨는 그런 점에서 저보다 5년은 앞서 있는 것 같아요. 논문 읽고, 질문 찾고, 글쓰는 건 금방 늘 것 같습니다. 지금도 논문 하나 더 쓰고 있는데, 설명하는 방식을 포함해서 글이 훨씬 매끄러워졌거든요. 제가 예상했던 것처럼 빠르게 성장하고 있습니다. 가까운 시일 안에 저보다 훨씬 훌륭한 연구자로 자랄 게 확실합니다. 이런 분과 일할 수 있다는 걸 생각해보면 저는 정말 운이 좋은 것 같다니까요.
자랑 하나 하자면, 제 연구실에서 지금 일하고 있는 다른 학생들도 정말 정말 뛰어난 재능을 지니고 있고, 앞으로 저보다 훨씬 훌륭한 연구자가 될 사람들이라는 겁니다. 이 분들이랑 올해 몇 편은 더 낼 것 같아요. 현우 씨랑 함께 한 논문은 그 시작이 될 것 같습니다. 그때 또 다른 학생들 이름 걸고 자랑할 기회가 생기길 바랍니다. 제가 앞으로 30년쯤 일하게 될 텐데요, 제 인생 최대 업적이 제자들이지 않을까 싶어요. 제가 학계에 기여한 것보다, 현우 씨를 포함한 제자들이 학계에 기여하는 게 훨씬 클 거라는 확신이 듭니다. 이 분들이 제 인생 자랑이 될 것 같아 벌써부터 기대가 되네요. 일단 현우 씨부터, 앞으로도 학계에 남아 위대한 연구자로서 세상에 더 많이 기여하길 바랍니다. 많은 사람들이 활용할 수 있는 중요한 프로그램을 개발하고, 이를 기반으로 중요한 생물학적 발견을 가능케 하길 바랍니다. 그렇게 우리가 생명을 이해하고 활용하는 데 기여하고, 동시에 이를 활용해 고통받는 환자가 줄어들고 삶의 질이 높아질 수 있도록 기여하길 바라고 있어요. 그렇게 될 거라 믿습니다. 저도 부끄럽지 않게 열심히 살아야겠습니다.
그림 설명: (왼쪽) 기존 연구에서 밝혀진 DNA 손상 및 수선 과정과 그 흔적들. 기존 연구는 대개 소규모 생화학 실험을 통해 돌연변이 형성 과정을 추적한 것으로, 노동집약적인 실험이 요구됐다. (오른쪽) 해당 연구진이 개발한 프로그램은 고품질 유전체 지도라는 대규모 데이터를 활용하고 그 분석 과정을 자동화하였다. 이를 통해 인구 집단에 존재하는 변이에 대한 해석을 가능케 하는 데 성공했다. (그림 출처: https://academic.oup.com/nar/article/53/2/gkae1295/7951712 해당논문의 시각화된 초록을 국문으로 변경함. CC-BY-4.0)
2. 연구를 진행했던 소속기관 또는 연구소에 대해 소개 부탁드립니다.
충남대학교 아주 좋은 곳이죠. 학생들이 정말 열심히 성실하게 살아갑니다. 인건비도 제법 줘서 박사후연구원 때랑은 비교도 안 될 정도로 화창한 미래를 꿈꿀 수 있게 되기도 했고요. 대전 자체가 좋기도 합니다. 서울에서는 이 월급으로 집 못 살 것 같은데, 대전에서는 미래가 보여요. 또 요새 전기자전거 타고 출퇴근하는 일이 많은데요, 대전은 자전거도로가 워낙 잘 돼 있어서 아주 기분이 좋습니다. 물론 뱃살은 눈곱만큼도 안 빠지고 있긴 합니다. 그래도 재밌으니 됐습니다. 대전 최고! 다들 대전 와서 살면 좋겠습니다.
3. 연구 활동 하시면서 평소 느끼신 점 또는 자부심, 보람
이제 첫 제자 그룹이랑 논문 쓰면서 열심히 성장하고 있습니다. 저도, 학생들도, 연구실에서 모쪼록 잘 성장하고 나가길 바랄 뿐이에요. 다들 좋은 곳에서 밥벌이 잘하길 바랍니다.
4. 이 분야로 진학하려는 후배들 또는 유학준비생들에게 도움이 되는 말씀을 해 주신다면?
저도 똑바로 못 살고 우당탕탕 헤매고 있는데 뭔 도움을 줄 수 있겠습니까. 다들 건강하게 지내시길 바랍니다.
5. 연구 활동과 관련된 앞으로의 계획이 있으시다면?
논문 다 쓰고 나니까 다른 더 좋은 방법이 떠올라버렸습니다. 그거 최대한 빠르게 업데이트해서 공개하려고 해요. 또 연구실에 롱리드 시퀀싱 데이가 계속 쌓이고 있어서, 올해는 매우 열심히 논문만 줄창 쓰려고 합니다. 과장 좀 섞으면 한 10개는 써야 할 것 같네요. 학생들이 얼른얼른 성장하기를, 연구실이 데이터 분석 자동화를 넘어 논문 생산 자동화에 이르기를 바랄 뿐입니다. 매일 같이 "제발 자동사냥, 제발! 흑흑" 이러고 살고 있는데, 몇 년 안에 제발 소원 성취되길 바랍니다.
6. 다른 하시고 싶은 이야기들.....
새해 복 많이 받으세요!
#판지놈 분석
# DNA 손상과 회복
# 변이
관련 링크
연구자 키워드
관련분야 연구자보기
소속기관 논문보기
관련분야 논문보기
해당논문 저자보기