1. 논문관련 분야의 소개, 동향, 전망을 설명, 연구과정에서 생긴 에피소드
Mass-spectrometry를 이용한 단백질 분석 방법에는 크게 두가지 방식이 존재합니다. 가장 널리 사용되는 bottom-up proteomics에서는 단백질을 짧게 조각낸 peptide를 분석합니다. 반면 top-down proteomics는 온전한 형태의 단백질 (intact protein)을 분해없이 직접 분석하는 방식입니다. Peptide에 비해서 intact protein은 시퀀스 길이가 길고, 분자량도 커서 분리와 분석이 상대적으로 어렵습니다. 하지만 분해없이 직접 분석하기 때문에, post-translational modification (PTM)에 대한 정보를 알아내는데 유리한 장점이 있습니다. 따라서 Top-down proteomics 에서는 샘플에 어떤 단백질이 존재하는지 (identification) 그리고 더 나아가 어떤 PTM들이 존재하며 (characterization) 그 양은 어느 정도인지를 (quantification) 정교하게 측정할 수 있는 분석 소프트웨어가 필요합니다.
제가 포닥을 수행했던 Pacific Northwest National Lab. (PNNL)에서는 top-down proteomics에 관한 연구를 매우 활발히 해오고 있었는데, 기존 분석 툴에 대해 개선되었으면 하는 사항들이 있었습니다. 이를 몇가지로 요약하자면 i) 분석 시간이 너무 오래 걸린다는 것, ii) 가능한 모든 PTM을 찾다보면 false positive한 결과가 너무 많아 manually 다시 확인해야하는 문제, iii) manually curated된 단백질과 PTM들만을 찾다 보면 ID되는 단백질의 수가 현저하게 적다는 것 등등의 문제들이 있었습니다. 이러한 문제를 개선하기 위해 PNNL 김상태 박사님께서 새로운 단백질 database search engine (MSPathFinder) 개발을 시작하셨습니다.
제가 본격적으로 프로젝트에 참여하게 된 계기는 큰 사이즈의 43 kDa 단백질을 top-down 방식으로 찍는 데 성공하였는데, MSPathFinder가 찾지 못한다는 소식을 듣고난 후였는데, 다양한 top-down 데이터를 보면 볼 수록 문제가 꽤 복잡하다는 것을 깨닫고, feature deconvolution (분석 툴의 첫 단계)부터 새로운 방식으로 개발 하면서 1년 가량을 보냈습니다. 마치 건초더미에서 바늘을 찾는 문제처럼 쉽지 않은 문제였지만, 새로운 아이디어를 적용하고 성능을 향상 시켜가며 새로운 단백질이나 modification들을 찾아낼 때마다 흥분과 보람을 느끼며 프로젝트에 매진할 수 있었던 것 같습니다.
2. 연구를 진행했던 소속기관 또는 연구소에 대해 소개 부탁 드립니다.
제가 포닥 과정을 하게 된 Pacific Northwest National Lab (PNNL)은 미국 서부 워싱턴주에 Richland라는 조용한 작은 도시에 자리잡고 있습니다. 연구소는 순수 과학에서부터 에너지, 환경 그리고 국가 안보에 이르기까지 다양한 연구를 수행하고 있습니다. 제가 속했던 질량 분석 연구 그룹은 세계 최고 규모의 시설과 분석 기술을 가지고 있으며, Dick Smith 박사님께서 이끌고 계십니다.
3. 연구활동 하시면서 평소 느끼신 점 또는 자부심, 보람
제가 쓴 논문이 같은 분야의 다른 연구자에게 조금이나마 동기나 영감을 줄 수 있다면 기쁘겠지만, 무엇보다도 열심히 만든 툴들이 실제 biological한 문제와 씨름하시는 과학자들에게 유용하게 쓰여서 biological한 현상에 대한 이해를 좀 더 넓힐 수 있다면, 그보다 더한 보람이 없을 것 같습니다.
4. 이 분야로 진학하려는 후배들 또는 유학 준비생들에게 도움이 되는 말씀을 해 주신다면?
Bioinformatics는 collaboration을 하는게 매우 중요하다고 생각합니다. 그러기 위해서는 다른 분야의 연구에 대해서 관심을 갖고, 다양한 분야의 사람들과 교류하는 습관을 갖는 것이 중요합니다.
연구를 함에 있어서는 데이터를 끈기 있게 그리고 부지런히 여러 시각으로 바라보는 습관을 가지시길 바랍니다. 이론적으로 훌륭한 모델이나 알고리즘이 실제 문제에 잘 적용시키기 위해서는, 부지런히 아이디어를 적용해보고 실패로 끝나더라도 좌절하지 않고 다시 처음으로 돌아가 꼼꼼히 데이터를 살피다 보면 발전이 이루어지는 것 같습니다.
5. 연구활동과 관련된 앞으로의 계획이 있으시다면?
머신 러닝 기술을 mass-spectrometry 분야에 더 많이 접목하는 연구 개발을 하려고 합니다. 주로 proteomics를 연구해왔는데, 앞으로는 metabolomics 더 나아가 integrative omics 분야에서 연구해 볼 계획입니다.
6. 다른 하시고 싶은 이야기들....
저는 박사 과정을 마쳤을 때 연구에 대한 흥미와 자신감을 잃어버린 상태였습니다. 우연치 않게 PNNL 포닥 자리를 알게 되었고, proteomics에 대한 경험이 부족한데도 가능성을 보고 기회를 주신 김상태 박사님께 진심으로 감사드립니다. PNNL에서 1년 조금 넘는 포닥 생활을 하면서, 좋은 저널에 논문을 낸 것도 기쁘지만 무엇보다 연구가 즐겁다는 것, 또 즐기며 하다 보면 잘 할 수 있다는 자신감을 갖게 되어 너무 감사합니다. 마지막으로, 긴 시간 인내심을 가지고 이 논문을 완성시키느라 함께 고생해준 PNNL 동료들, 특히 많은 도움을 주신 김상태 박사님, Paul Piehowski, Sam Payne에게 감사의 말씀을 전하고 싶습니다