위조, 변조, 표절은 연구 부정행위의 세 가지 주요 요소입니다. 지난 글에서 표절(plagiarism)에 대해 다뤘다면, 이번에는 위조(fabrication)와 변조(falsification)에 대해서 살펴보려 합니다. 위조와 변조는 표절에 비해서 상대적으로 드물지만, 연구 결과 자체를 왜곡한다는 점에서 과학의 신뢰성과 진실성에 큰 타격을 줍니다.
위조와 변조의 정의
대부분의 연구부정행위를 규정하는 지침에서는 위조와 변조를 연구진실성을 위협하는 대표적인 행위로 명시하고 있습니다. 우리나라 [연구윤리확보를 위한 지침]을 살펴보면 다음과 같이 정의합니다. (1)
- 위조: 존재하지 않는 데이터 또는 연구결과 등을 허위로 만들어 내는 행위를 말한다.
- 변조: 연구 재료, 장비, 과정 등을 인위적으로 조작하거나 데이터를 임의로 변형, 삭제함으로써 연구 내용 또는 결과를 왜곡하는 행위를 말한다.
즉, 위조와 변조는 모두 연구결과를 왜곡하는 행위이지만, 그 방식에서 약간의 차이를 보입니다. “위조”는 존재하지 않는 데이터를 있는 것처럼 꾸며내는 행위입니다. 실제로는 실험을 하지 않았음에도 가짜 데이터를 만들어 표나 그림을 만드는 것이죠. 예를 들어, 실험은 환자군 만을 대상으로 했지만, 추후에 대조군이 필요한 경우 대조군 모집 없이 환자군 데이터를 바탕으로 대조군 데이터를 창조하는 것이 여기에 해당합니다. 또 다른 예로는, 신약 개발 연구에서 약물 효과를 입증하기 위해 실제로 존재하지 않는 세포 사진이나 동물 실험 결과를 만들어내는 행위가 있습니다. 반면, “변조”는 실험은 했지만, 결과가 내 가설과 다르거나 마음에 들지 않는다는 이유로 연구 결과를 선택적으로 수정하여 보고하거나, 아예 보고에서 제외하는 경우를 의미합니다. 분석에서 특정 참가자의 데이터를 지워 유의적인 결과값을 만들어내는 것 등이 이에 해당합니다. 예를 들어, 100명의 참가자를 대상으로 한 설문조사에서 자신의 가설과 맞지 않는 응답을 한 10명의 데이터를 '오류'로 간주하고 임의로 삭제하여 통계적으로 유의미한 결과를 도출하는 경우가 변조에 속합니다. 특히 이미지 기반 연구에서는 원하는 결과와 맞지 않는 밴드(band)를 지우거나, 밝기나 대비를 조작하여 눈에 띄게 만드는 행위도 흔한 변조 사례입니다.
왜 심각한 문제인가?
표절이 주로 아이디어와 권리를 침해한다면, 위조와 변조는 과학적 증거 자체를 조작하는 것입니다. 이는 연구자 사이의 믿음과 협력을 무너뜨리고, 더 나아가 과학과 사회 전체의 신뢰를 훼손합니다. 또한, 거짓된 데이터는 그 데이터를 바탕으로 후속 연구를 진행하는 연구자들의 자원과 시간을 낭비시킵니다. 더 나아가 특정 이해관계에 따라 위조나 변조가 이루어지는 경우 환자의 안전과 공중 보건에 직결되는 문제를 초래할 수 있습니다.
국제적으로 가장 널리 알려진 사건은 MMR 백신과 자폐증을 연결했다고 주장한 1998년 The Lancet에 발표된 Andrew Wakefield의 논문이 있습니다. (2) 그는 자신의 주장을 뒷받침하기 위해 특정환자들의 임상 기록을 의도적으로 수정하고, 실제로 증상이 나타나지 않았음에도 백신 투여 후 자폐증이 발병한 것처럼 기록했습니다. 더 충격적인 사실은 해당 연구를 발표하며 관련된 소송을 준비하는 변호사들로부터 Andrew Wakefield가 거액의 돈을 받았다는 사실이었죠. 결국 2010년 논문은 철회되었지만, 이 사건으로 인해 전 세계에서 백신에 대한 불신이 커져 접종률이 낮아졌고, 거의 사라지고 있던 홍역 같은 질병이 다시 퍼지는 결과를 초래했습니다.
국내에서 가장 널리 알려진 사건은 황우석 박사의 줄기세포 논문 조작입니다. (3, 4) Science에 발표한 줄기세포 관련 논문에서 사용된 사진들이 복제되거나 변형되었고, 논문에서 주장하는 줄기세포주의 상당수는 실제로 존재하지 않는 것이 드러났습니다. 즉, 위조와 변조가 동시에 일어난 대표적인 사례였습니다. 결국 논문은 철회되었고, 황우석 박사는 위조와 변조에 더해 이루어진 많은 연구부정행위에 대한 법적 처벌을 받았습니다. 이 사건은 우리나라에서 연구부정행위에 경각심을 크게 높이는 계기가 되었습니다.
어떻게 해결할 수 있을까?
국내외에서는 이러한 연구부정행위를 없애기 위하여 연구윤리위원회 및 연구진실성위원회를 조직하여 지침을 마련하고, 연구자들을 대상으로 교육, 조사, 및 징계 조치 등을 수행하도록 하고 있습니다. 제가 속해 있는 연구기관의 경우, 분석에 사용되는 모든 코드와 결과를 연구와 직접 관련 없는 독립적인 연구자가 검증합니다. 검증 과정에서 이상이 발견되면 이를 수정한 뒤에야 논문을 저널에 제출할 수 있습니다. 또한, 연구진실성 위반 사례 발생 시 철저한 조사를 통해 연구자에게 연구비 환수나 일정 기간 연구 참여 제한 등의 강력한 제재를 가하기도 합니다.
저널에서도 데이터 조작을 탐지하기 위한 여러 노력을 기울이고 있습니다. 저널에서는 원데이터 (raw data) 제출을 의무화합니다. Western blot 이미지의 경우 부분이 아닌 전체 이미지를 제출하는 것이 이에 해당합니다. 더 나아가 Science는 2024년 조작 이미지를 탐지하기 위하여 AI를 활용한 사진 분석도구인 Proofig를 활용하겠다고 밝힌 바 있습니다. (5) 또한, 빅데이터셋이나 분석 코드의 경우에도 공개 저장소에 저장하고, 이를 다른 연구자들이 활용할 수 있도록 요청하고 있습니다. 통계에 대한 전문 리뷰어를 통해 데이터 분석과 결과에 대한 조작여부를 한 번 더 검증하기도 합니다. 특히 결과값이 너무 좋은 경우에는 ‘too good to be true’라는 마인드로 조금 더 철저한 검증이 이루어집니다.
이러한 노력에도 불구하고, 저널과 각 기관들이 모든 연구를 조사하는 데에는 한계가 있습니다. 결국, 연구자들의 정직성에 의존하게 되죠. 연구자들 역시 처음부터 이런 부정행위를 계획하는 것은 아닐 것이라 믿습니다. 아마도 내 연구결과가 나의 명성과 업적에 연결되는 것이기에 이런 부정행위를 저지르는 것이겠죠. 하지만, 이는 단순히 연구자의 실수가 아니라 연구 공동체 전체의 신뢰를 훼손하는 심각한 범죄라는 것을 기억해야 합니다.
더불어, 우리 연구 공동체에서도 연구진실성을 지키기 위한 근본적인 변화가 필요합니다. 단순히 논문 수나 임팩트가 아니라 연구 질문과 과정 자체에 대한 가치를 중심으로 평가가 강화되어야 할 것입니다. 또한, 형식적인 교육을 넘어, 데이터를 관리하는 방법, 연구노트 작성 및 관리 방법처럼 실제 연구 현장에서 연구진실성을 달성하기 위한 실질적인 교육이 대학원생부터 연구책임자까지 주기적으로 이루어져야 합니다. 마지막으로 네거티브 결과도 가치 있는 연구 결과로 인정받을 수 있는 개방적인 연구 생태계가 구축되어야 할 것입니다.
다음에는 연구윤리확보를 위한 지침에서 언급하는 또 다른 연구부정행위에 연관된 "저자(Authorship) 표시”에 대해서 이야기해보겠습니다.
Reference
교육부. 2023. 연구윤리확보를 위한 지침 (교육부 훈령 제263호).
Wakefield, Andrew J., et al. "RETRACTED: Ileal-lymphoid-nodular hyperplasia, non-specific colitis, and pervasive developmental disorder in children." The lancet 351.9103 (1998): 637-641.
Hwang, Woo Suk, et al. "Evidence of a pluripotent human embryonic stem cell line derived from a cloned blastocyst." Science 303.5664 (2004): 1669-1674.
Hwang, Woo Suk, et al. "Patient-specific embryonic stem cells derived from human SCNT blastocysts." Science 308.5729 (2005): 1777-1783.
Thorp, H. Holden. "Genuine images in 2024." Science 383.6678 (2024): 7-7.
본문은 생성형 AI를 구성 아이디어의 정리와 문장 표현 개선 등 작성 과정 전반에서 참고 자료로 활용했습니다. 그러나, 최종 원고의 표현은 직접 검토 및 수정 후 완성했습니다.