한빛사 인터뷰
1. 논문관련 분야의 소개, 동향, 전망을 설명, 연구과정에서 생긴 에피소드
의학적 사실의 발견 및 확인을 위한 의료 빅데이터 연구의 중요성은 점차 증대되고 있습니다. 빅 데이터 연구를 위해서는 다면적인 데이터들을 통합할 수 있는 모델링 수립 기법의 개발이 필요하며, 본 연구는 그러한 다면적 의료 빅데이터 연구의 최신 모델링 성과 중 하나입니다.
본 연구의 모델링의 종속 변인으로서 "천식 악화"라고 하는 조작적 정의가 가능한 outcome을 설정하고, 대규모 인구집단(서울 거주 천만명)에 대해 5년간 추적관찰하면서 이 종속 변인을 집계하였습니다.
독립 변인으로서는 지금까지 학계에 보고가 어느 정도 이루어진 모든 원인 물질들, 즉 미세먼지, 공해물질, 꽃가루 농도, 기후 변화, 바이러스의 유행 등을 각 기관 및 연구자들과 협력하여 수집하였습니다.
모델의 정확도를 올리면서도 해석 가능성을 유지하기 위해서 연령별 층화의 개념을 도입하였습니다. 비교적 잘 알려지고 주요한 변수인 연령을 통한 층화를 함으로써, 연령별로 주요한 천식 악화의 위해 인자가 다르다는 사실을 알 수 있었고, 그 차이에 대해서 의학적으로 심도 있는 해석이 가능했습니다.
모델링 과정에서 각 위해 인자는 시공간 변수를 통해 환자들과 연결됩니다. 비선형적이고, 시계열적이고, 지연시간이 있는 다양한 원인변수들을 함께 모델링하기 위해 Distributed Lag Non-Linear Model (DLNM)을 도입하였으며, 모델에 포함될 Confounder의 선정을 위해 Convergent Cross Mapping (CCM)과 Nearest Neighbor 가 사용되었습니다.
2. 다른 하시고 싶은 이야기들....
시공간 변수들을 다루기 위해서는 고전적인 통계 연구에서도 데이터 처리 및 가설 선정에 많은 심혈을 기울여야 합니다. 이번 연구는 시공간 변수들을 빅 데이터로 다루는데다가, 비선형 인과관계를 가정했기 때문에 정규성 및 잔차 분석, 모델의 민감도 분석에 특히 심혈을 기울였습니다.
DLNM과 CCM이라고 하는 두 최신 통계기법을 같은 모델 내에서 중첩하기 위해 두 통계이론의 가정들을 세부적으로 검토해야 했습니다. 각 기법의 내부에 있는 미분기하학 및 Machine Learning의 수학적 이론들을 검토하여 가정 위에 가정이 덧붙여지지 않도록 확인을 거듭했습니다. 이 결합은 세계 최초로 시도된 것이라, 두 이론의 거장이시며 주 개발자이신 Gasparrini 교수님 및 Sugihara 교수님과의 빈번한 서신 교환이 필요했습니다. 적극적으로 도와주신 두 분께 이 자리를 통해 다시 한번 감사의 말씀을 드립니다.
2019년 한 해 저희 연구팀에는 많은 변화가 있었습니다. 우선 저(이승원)는 세종대학교 데이터사이언스학과 정년트랙 조교수로서 근무를 시작하게 되었습니다. 연동건 선배님께서는 여러 편의 교신저자 논문을 출판하시고, Allergy, PAI의 리뷰어가 되며 독립적인 연구책임자로서의 위치를 공고히 하셨습니다. 고현용 선생님께서는 두산연강학술상을 수상하시고 Boston Children's Hospital, Havard Medical School의 연구원이 되셨습니다.
이러한 모든 진보는 항상 저희를 위해 조언과 도움을 아끼지 않으시는 한만용 교수님의 지도 하에 가능했습니다. 이 자리를 빌어 다시 한번 연동건 선배님, 고현용 선생님, 한만용 교수님께 감사의 말씀을 드립니다.
끝으로 고난도의 커리큘럼에도 불구하고 항상 학업에 최선을 다하는 세종대학교 데이터사이언스학과 학생분들에게 격려와 감사를 드립니다. 저 또한 이 자리를 빌어 빅 데이터 연구자로서 더욱 우수한 연구성과와 교육 커리큘럼 개발을 위해 힘쓸 것을 다시 한번 다짐하는 바입니다. 감사합니다.
관련 링크
연구자 ID
관련분야 연구자보기
소속기관 논문보기
관련분야 논문보기
해당논문 저자보기