한빛사 인터뷰
1. 논문관련 분야의 소개, 동향, 전망을 설명, 연구과정에서 생긴 에피소드
최근 인공지능 기술의 발달로 인하여 다양한 분야에서 이를 활용하고자 하는 연구들이 활발하게 이루어지고 있습니다. 특히 의료분야에서 이런 인공지능 기술들을 적용하고자 하는 연구들이 최근에 폭발적으로 증가하고 있습니다. 하지만 인공지능 기술이 처음 의학분야에 소개되고 적용되기 시작할 때의 엄청난 기대와 바람과는 달리 인공지능 기술의 여러 한계점들이 부각되면서 의료분야의 적용에 있어서 현재 많은 debate가 있는 것이 현실입니다. 그 대표적인 문제는 바로 예측 모델의 훈련데이터에 의존되는 overfitting 문제입니다. 따라서 인공지능 예측 모델의 임상적 유용성을 판단하기 위해서 external validation을 잘 하는 것이 중요합니다.
우리 연구는 국내 4개의 의료 기관으로부터 대규모 데이터를 추출하여 각 기관 데이터로 학습한 예측 모델들을 서로 다른 병원 데이터에 external validation하여 서로 성능을 비교 검증하는 연구였습니다. 특히, 우리 연구에서 다기관에 적용 가능한 인공지능 예측 모델로서 많은 변수를 가지고 있는 heavy model보다는 light model을 제안하여 최소한 임상정보만을 활용한 예측모델을 제시하고 있습니다. 이는 정말 많은 변수들을 가지고 있는 기존의 인공지능 예측 모델과 다르게 적은 수의 입력 변수만을 활용하여 예측모델을 만들었을 때 좀 더 robust한 예측 모델을 개발할 수 있음을 본 연구를 통하여 보여주고 있습니다. 실제 임상 현장에서는 빠르게 다양한 임상환경에서 적용 가능한 예측 모델을 개발하는 것이 매우 중요합니다. 이런 예측 모델을 구현하기 위해서 다양한 분포의 다기관 데이터를 기반으로 서로 교차 검증하는 연구로서 우리 연구는 매우 가치가 있다고 생각합니다. 지금까지의 기존의 많은 인공지능 관련 의료분야 연구들은 대부분 단일기관의 데이터 베이스를 활용하여 개발하였기 때문에 새로운 다른 기관 데이터에서는 잘 적용하기 어려운 문제점들이 있었습니다. 따라서 본 연구는 4개의 대규모 데이터를 하나로 모아 서로 다른 데이터베이스를 기반으로 하는 서로 다른 예측 모델들로 서로 교차 검증함으로써 인공지능 모델의 다기관 검증에 관한 매우 중요한 이정표를 제시한 연구라는 점에서 가치가 있습니다. 우리 연구에서는 EMR에서 자동으로 추출이 가능한 혈액검사 결과나 단순한 demographic 정보들을 활용하여 수술 후 30일 이내 사망률을 예측하는 연구를 진행하였지만 이런 적은 수의 입력 변수들만 가지고도 앞선 연구들처럼 많은 수의 데이터 변수들을 이용하는 모델들에 비해서 결코 예측 성능이 떨어지지 않았고 무엇보다 다기관 검증에서는 오히려 적은 수의 변수를 가지고 모델링하는 것이 좀 더 robust한 예측 모델 개발이 가능함을 보여주고 있습니다. 앞으로 이렇게 다양한 기관의 대규모 데이터를 융합하여 EMR데이터뿐만 아니라 다양한 종료의 데이터를 기반으로 한 인공지능 관련 연구들이 다양한 영역에서 이루어질 것으로 기대됩니다.
2. 연구를 진행했던 소속기관 또는 연구소에 대해 소개 부탁드립니다.
본 연구는 한국보건복지인력개발원에서 주관하는 의료인공지능 전문가 과정 팀프로젝트 결과물로서 이루어진 연구입니다. 저희 연구의 저자들은 모두 위 과정을 수료한 팀원들로서 서로 다른 전공과 배경을 가지고 있었습니다. 공학자, 간호사, 의사 등 다양한 배경의 팀원들이 본 프로젝트를 위해 함께 연구를 수행하였습니다. 무엇보다 팀원들이 다양한 의료기관에 소속되어 있어 다기관 연구 수행을 위한 데이터 추출이 가능하였습니다. 서울대병원, 이대목동병원, 서울아산병원, 서울시립 보라매병원 등 총 4개 병원의 데이터를 기반으로 연구가 진행되었습니다. 팀 프로젝트 자체는 두 달이 채 되지 안는 짧은 기간 동안 수행되었지만 단기간에 IRB 통과와 데이터 추출 및 분석을 수행하였고 프로젝트 기간이 종료된 이후에도 지속적인 만남을 통하여 연구의 결과물을 내기 위하여 노력한 끝에 본 논문이 최종적으로 나올 수 있었습니다.
이번 연구에서 가장 많은 데이터를 제공해 주신 서울대병원 이형철 교수님께서 저희 팀 프로젝트에 많은 도움을 주셔서 본 연구가 가능하였습니다. 다시 한번 이형철 교수님께 감사드립니다. 그리고 나머지 기관 데이터 추출을 맡아주신 이대목동병원 김이준 교수님과 보라매 병원 서수량 선생님께도 진심으로 감사드립니다. 기술적인 부분에 있어서는 예측 모델링에 많은 기여를 해주신 이헌이 선생님과 이경현 선생님의 노력이 없었다면 본 프로젝트가 성공적으로 마무리되지 못했을 것입니다.
3. 연구 활동 하시면서 평소 느끼신 점 또는 자부심, 보람
의료인공지능 전문가 과정이 단순히 교육이 아닌 실제 연구의 성과로 이어질 수 있도록 끝까지 포기하지 않고 노력하여 본 결과물이 나오게 된 점에 대단히 보람을 느낍니다. 프로젝트 기간 동안에만 한정하여 끝났다면 여러 다른 대부분의 팀들과 마찬가지로 별다른 성과없이 마무리되었겠지만 프로젝트로 모았던 4개 병원의 대규모 데이터의 가치가 너무도 크기에 이를 기반으로 연구를 지속적으로 수행하고 팀원들과의 지속적인 협력을 통하여 좋은 결과를 낼 수 있었습니다.
4. 이 분야로 진학하려는 후배들 또는 유학준비생들에게 도움이 되는 말씀을 해 주신다면?
의료인공지능 분야는 이제 기나긴 항해를 막 시작하는 단계입니다. 아직도 너무나 많은 미지 영역들에 대한 연구들이 필요하고 인공지능의 기술적인 발전뿐만 아니라 앞으로 다양한 의료데이터의 융합과 축적이 이루어질 것이므로 이러한 대규모 데이터를 기반으로 하는 인공지능 연구는 다양한 영역에서 이루어 질 것입니다. 따라서 이 분야에 관심을 가지고 있다면 데이터의 중요성과 함께 양질의 임상 의료 데이터를 구축하는 부분에 많은 관심과 노력이 필요합니다. 앞으로의 연구는 서로 다른 전문가들과 협력을 통한 융합 연구의 형태가 많아질 것입니다. 그래서 여러 분야로 진출하더라도 서로 다른 배경의 전문가들과 소통할 수 있는 communication skill이 매우 중요해 지고 있습니다. 서로 다른 영역의 전문가들과 협력함으로써 더 가치 있는 연구들이 이루어질 것입니다.
5. 연구 활동과 관련된 앞으로의 계획이 있으시다면?
본 연구는 기본적인 이미 구축된 데이터셋을 기반으로 한 후향적 연구였습니다. 앞으로는 이런 예측 모델을 전향적인 데이터에 적용하여 임상적 유용성을 검증하는 연구들을 진행하고 싶습니다. 인공지능 모델의 임상적 유용성에 관련한 최근의 RCT연구들의 흐름을 보았을 때 단순히 기존 데이터셋을 이용한 모델의 검증뿐만 아니라 새로운 데이터셋을 기반으로 예측 모델의 성능을 검증하고 실제 임상에서 적용 가능성을 확인하는 연구들이 앞으로 활발하게 이루어 질 것으로 기대됩니다.
6. 다른 하시고 싶은 이야기들.....
저희 연구가 가능하도록 이런 프로젝트를 기획하고 연구의 장을 넓힌 의료인공지능 전문가 과정을 주관한 한국보건복지인력개발원(KOHI) 관계자 분들께 감사드립니다. 사실 저 같은 의료인들이 공학자나 다른 분야의 전문가들과 함께 일하거나 서로 협력할 수 있는 기회는 흔치 않습니다. 그래서 이런 전문가과정을 통하여 임상가와 다른 영역의 전문가들이 서로 소통하고 이를 계기로 다양한 융합 연구를 할 수 있는 연구의 장을 만들었다는 점에서 매우 소중한 경험이었고 다른 동료들에게도 적극적으로 추천하고 싶습니다.
#Machine learning
#Light model
#Multi-centered cross validation
관련 링크
연구자 키워드
관련분야 연구자보기
관련분야 논문보기