박사 과정을 하면서 자주 들었던 단어 중 하나가 오픈사이언스 (Open Science)입니다. 요즘 많이 언급되는 단어라 한 번쯤 들어보셨으리라 생각합니다. 처음 이 단어를 들었을 때 제가 그러했든, 많은 분들이 오픈 사이언스를 open access와 비슷한 개념으로 단순히 논문이나 데이터를 무료로 공개하는 것으로 이해하곤 합니다. 하지만 오픈사이언스의 실제 의미는 훨씬 넓고 깊습니다. 오픈 사이언스는 연구 전 과정에서 신뢰성과 투명성을 확보하려는 연구진실성과 밀접하게 관련되어 있습니다. 이번 글에서는 오픈 사이언스의 의미와 실현 과정에서 발생하는 현실적인 어려움을 함께 이야기하려 합니다.
재현성 위기와 오픈 사이언스
오픈 사이언스는 연구 과정을 보다 투명하고 접근 가능하며 재사용 가능하게 만드는 포괄적 개념입니다. 단순히 논문을 통해 연구 결과를 공개하는 것을 넘어, 연구 방법 문서화, 데이터와 코드 관리, 가설 및 분석 사전 등록, 불확실성 소통 등 다양한 과정을 포함하고 있습니다. 오픈 사이언스는 검증이 어렵고 재현하기 힘들며 접근 비용이 높고 팀이 바뀌면 취약해지는 등, 연구의 구조적 문제에 대한 실질적 대응으로 등장했습니다.
조금 더 예를 들어 설명하면, 연구자가 가설에 맞는 결과가 나올 때까지 분석 방법을 조금씩 조정하거나, 통계적으로 유의미한 데이터만 선택적으로 보고하는 경우가 있습니다. 더 나아가, 학술지는 흥미로운 결과를 보이는 논문만 출간하고, 연구비와 경력은 빠른 성과에 연동되기 때문에, 연구자가 규칙을 명시적으로 어기지 않더라도 분석을 조정하거나 해석을 다듬는 행동이 발생할 수 있습니다. 이러한 결정들이 결과물인 논문만으로는 거의 보이지 않는다는 점이 연구 결과의 검증과, 재현 과정에서 문제가 됩니다. 결과적으로 이런 연구들은 ‘재현 불가능한 예쁜 쓰레기’로 남게 되며, 과학적 신뢰를 훼손하게 됩니다.
전통적인 연구 가이드라인은 이러한 보이지 않는 연구의 부분들을 충분히 다루지 못했습니다. 표절이나 데이터 조작처럼 명확한 위반은 제재할 수 있지만, “왜 이 분석을 선택했는가”, “다른 선택지는 왜 배제되었는가”라는 질문을 다루지는 않습니다. 오픈 사이언스는 이러한 연구자의 선택과 불확실성을 드러내고 기록하는 방식을 통해, 단순히 윤리적 규범 준수에 그치지 않고 연구의 질적 신뢰성을 확보하는 방안으로 제시되고 있습니다.
사전등록(preregistration)을 통해 분석 계획을 명시하고, 데이터와 코드를 체계적으로 관리 및 공유하면, 다음 연구자가 연구 결과가 어떻게 만들어졌는지를 이해하고 재현할 수 있는 기반이 됩니다. 실제로 저 역시도 논문을 읽으며 필요한 경우 분석 과정, 데이터 처리 과정이나 코드의 주석까지 참고하며 많은 도움을 받은 경험이 있습니다, 이처럼 오픈사이언스는 직접적으로 연구를 진행한 연구자와 소통 없이도 기존 연구의 결과를 더 잘 이해하는데 도움이 되며, 이는 많은 경우 재현성을 높이는 방법이 될 수 있다고 여겨집니다.
현실에서의 오픈 사이언스: 부담과 구조적 문제
그러나 실제 연구 현장에서 오픈 사이언스는 이상과 달리 추가적인 부담으로 여겨지는 경우가 많습니다. 특히 석박사과정 학생이나 박사 후 연구원 같은 주니어 연구자에게 이런 부담은 더 큽니다. 이 불편함은 단순히 개인적 저항이나 변화에 대한 게으름 때문이 아니라 연구 환경의 구조적 특성과 밀접하게 연결되어 있습니다..
우선, 연구현장에서 오픈 사이언스의 실천은 추가적인 작업을 요합니다. 예를 들어, 사전등록을 위한 문서를 작성하고, 모든 분석 결정과 선택의 근거를 기록하고, 코드를 누구나 이해할 수 있는 수준으로 정리해야 합니다. 이 과정에는 많은 시간과 노력이 필요하기 때문에 주로 취약한 위치에 있는 주니어 연구자들에게 집중됩니다. 더욱이, 이렇게 투명성을 확보하기 위해서 들인 시간과 노력이 직접적으로 졸업이나 취업, 다음 커리어를 위한 연구 성과로 이어지지 않기 때문에, 이들에게 오픈사이언스 실천은 그저 추가적인 행정업무나 보상 없는 노동으로 인식될 수 있습니다.
또한, 투명해질수록 더 많은 책임을 지게 되는 것은 아닌가에 대한 심리적 부담도 있습니다. 예를 들어, 데이터와 코드를 공개한 뒤 사소한 오류가 발견될 수 있습니다. 이는 인간이라면 누구나 할 수 있는 실수이며, 과학이 발전하는 과정에서 이러한 오류를 수정해 나가는 것은 자연스러운 일입니다. 하지만, 경쟁이 치열한 학계에서 이러한 실수가 나의 평판에, 성과에, 커리어 전체에 영향을 주지 않을까라는 걱정을 하게 됩니다. 특히나 오픈 사이언스를 위한 작업을 담당하는 사람들이 주니어 연구자들이라면 이러한 심리적 부담이 훨씬 더 커집니다.
사전 등록 역시 비슷합니다. 연구 계획을 미리 공개하면 투명성을 확보할 수 있습니다. 하지만, 연구 과정에서 계획을 수정해야 할 경우 부정적으로 오해받을 걱정에 오히려 반드시 필요한 수정도 망설이게 됩니다. 이는 수정 없는 방향으로 안정적이고 방어적으로만 연구를 진행하게 만들 수 있습니다. 즉, 실제로 충분한 지원과 보호 장치 없이 투명성만 요구될 경우, 오픈 사이언스는 연구의 질을 높이기보다 개인에게 부담을 전가하는 수단이 될 수 있습니다.
오픈 사이언스는 장기적으로 연구자와 학문 공동체에 여러 이점이 있습니다. 재현 가능한 연구 결과, 협업 촉진, 데이터 재사용 가능성 증가, 연구 부정행위 예방 등이 그것입니다. 그럼에도 불구하고, 앞서 언급된 문제들은 오픈사이언스 실천이 어려움이 단순히 심리적 어려움이 아니라 구조적 문제에 연결됨을 보여줍니다.
결론적으로, 오픈 사이언스는 연구의 신뢰성과 재현성을 높이는 도구가 될 수 있지만, 동시에 그 과정이 평가와 처벌의 근거로 사용될 수 있다는 가능성 때문에 우려를 낳습니다. 오픈 사이언스를 위한 구조적 시스템 없이 단순히 투명성만 요구할 경우, 오픈 사이언스에 대한 움직임은 설득력을 가지기 어렵고, 더 나아가서는 연구자를 지키는 도구가 아닌 위험에 노출시키는 장치가 될 수 있습니다. 다음 연재에서는 오픈 사이언스를 체계적으로 시스템화한 사례와, 현실 연구 환경에서 실천할 수 있는 방법을 다뤄보겠습니다. 이를 통해 오픈 사이언스가 연구자에게 부담이 아니라 신뢰성을 높이는 도구가 될 수 있는지 이야기해 보겠습니다.
*본문은 생성형 AI를 구성 아이디어의 정리와 문장 표현 개선 등 작성 과정 전반에서 참고 자료로 활용했습니다. 그러나, 최종 원고의 표현은 직접 검토 및 수정 후 완성했습니다.