국내외 바이오 관련 동향 뉴스를 신속하게 제공합니다.
뉴스 종합
[게재 승인 확률을 높이는 투고 체크포인트] 2) Methods, Source, Policy
Bio통신원(김광은)
이번 글에서는 연구 재현과 관련된 부분에 대해서 말씀드리겠습니다. 의과학 분야의 재현 불가능성이 문제가 되고 있어서 점점 기준이 높아지고 있습니다. 미리 고려하지 않으면 논문 출판이 상당히 지연될 수 있습니다.
최종 제출 서류들
Methods
논문을 쓸 때 가장 만만하게 생각하는 파트이긴 하지만, 생각보다 까다롭습니다. 장비, 제품, 소프트웨어 버전을 모두 써야 합니다. 특히 Antibody 등 Reagent는 catalog 번호와 희석 비율도 적어야 하고, qPCR primer 서열도 정리해서 적어야 합니다. Nature 계열뿐만 아니라 Cell 계열도 Key Resources Table 형태로 작성하기 때문에 한 번 정리해 두시면 유용합니다. 저는 그냥 분주되어 있는 거 썼는데요?라고 넘기시면 곤란한 일이 생깁니다. 나중에 여기저기 물어보면서 실험실의 모든 냉장고와 냉동고를 뒤지지 않으려면 연구 노트에 꼼꼼히 적어두시는 것이 좋습니다.
내가 한 실험이야 어떻게 찾는다고 해도 공동 연구자의 methods는 쓰기가 더 어렵습니다. 2년 전에 결과만 받아놓고 이제 물어보려고 연락하니까 졸업/퇴사했다든지 하면 막막해집니다. 훌륭한 data를 받았다면, 기억이 생생할 때 공동 연구자에게 methods section을 바로 요청해 두시는 것이 좋습니다. 공동 저자로 들어간다는 뜻이기 때문에 바로 요청하면 잘 써줄 것입니다.
Methods에 “As previously described”, “according to manufacturer protocols”를 남발하는 경우도 있습니다. Nature 계열은 methods가 본문 뒤에 있고, 길이 제한이 없기 때문에 에디터가 충분히 자세하게 쓰라고 코멘트합니다. 대충 쓰면 리뷰어들도 알아보고 성의 없다고 생각합니다.
Reporting summary
Methods 관련 내용은 요약해서 Reporting summary 파일에도 들어갑니다. 일단 모든 n 수가 표기되어 있는지, 통계는 적절하게 처리했는지 쓰고, 분석 Software의 이름, 제작사, 버전을 적어야 합니다. 실험 디자인의 경우 어떻게 sample size를 정했는지, data exclusion의 기준이 있는지, replication은 얼마나 했는지, randomization 했는지, blinding 했는지 적어야 합니다. 처음 적기 조금 막막한데 비슷한 주제의 다른 논문 첨부 파일을 보시면 감을 잡으실 수 있습니다.
Antibodies 섹션에서는 사용한 모든 antibody의 이름, 제작사, 카탈로그, 희석 비율을 적어야 하고, 항체의 validation 근거도 적어야 합니다. 반대로 얘기하면 좋은 항체 정보가 공개되어있습니다. 보통 제작사에서 제공하는 결과 링크나 선행 논문을 적는데, 운이 나쁠 경우 항체를 잘못 쓰고 있었다는 사실을 알게 될 수도 있습니다…
Eukaryotic cell lines 섹션에서는 정확한 세포의 이름과 source를 적습니다. 부정확한 세포주를 이용한 연구가 생각보다 많아서 추가되었다고 합니다. 보통 ATCC에서 구매하는 경우가 많으나, 분양받은 세포의 경우 어디서 받았는지 적어야 합니다. 세포주의 검증 근거, Mycoplasma 감염 여부도 적습니다 (확인 안 했으면 안 했다고 적어도 됩니다).
Animals 섹션에서는 실험동물의 공급처, Strain, age, 동물 시설의 등급과 관리 방법 등을 적게 됩니다. 여기서 어려운 부분은 마우스 주령입니다. 실험마다 성별과 주령을 적어야 하는데 결과만 있고 주령이 안 적혀 있으면 고된 작업을 해야 합니다. Genotyping 날짜까지 거슬러 올라간 적도 있습니다. 미리 알았다면 잘 적어뒀을 거예요.
ChIP-seq 결과가 있다면 더 자세한 내용을 써야 합니다. Raw data 링크와 sequencing depth, peak calling 방법 등을 적습니다. Flow cytometry도 섹션이 따로 있습니다. Marker와 Fluorochrome을 잘 적었는지, 축이 잘 보이는지, 정량값이 쓰여 있는지 등을 확인합니다. 샘플링 방법, 장비명, 소프트웨어 등을 적고 Gating strategy도 적거나 보여줘야 합니다.
Source data
논문의 재현 여부를 보증하기 위해 제출하는 파일입니다. 우선 저자들이 결과를 올바른 방식으로 통계 분석했는지 확인하기 위해서, 결과 숫자를 엑셀 파일로 제출하게 됩니다. 원칙적으로는 그래프로 나타낸 모든 결과가 대상입니다. 작성하다 보면 그래프만 있고 원본 데이터를 못 찾는 경우가 있습니다. 그때는 연구노트와 장비 하드디스크와, 온갖 USB와 메일과 카카오톡을 뒤지게 되는데 미리미리 잘 정리해 두시기를 바랍니다. Western blot의 경우 uncropped gel image를 첨부해야 합니다. 이것도 나중에 편집된 것만 있고 원본을 못 찾는 경우가 있어서 잘 챙겨두시기를 바랍니다.
Data availability
Nature 계열의 경우 RNA-Seq raw data는 Gene Expression Omnibus(GEO)에, Proteome raw data는 PRIDE에 Deposit 하는 것을 원칙으로 하고 있습니다. 등록 신청하고 Public 상태가 되기까지 시간이 다소 걸리기 때문에 투고 시점에서 미리 올려둬야 시간을 절약할 수 있습니다. 사용한 Plasmid의 경우에도 Addgene에 Deposit 해두는 것을 권장합니다. 이 경우에도 Plasmid를 보내고, 시퀀싱 해서 업로드되기까지 시간이 걸려서 Revision 할 때 미리 해두시면 좋습니다.
Editorial policy checklist
Nature 저널 정책에 동의하냐는 내용입니다. 주요 내용이 요약되어 있는데 첫째로 Source data, Raw data, Code 등이 공개되고 접근할 수 있는지 확인합니다. 두 번째로 그래프에서 모든 data가 dot plot이나 box-plot으로 적절하게 그려졌는지, error bar는 명시했는지 확인합니다.
또 Western blot image에서 loading control이 같은 gel 상에 있는지, 표기는 잘 되었는지 확인합니다. 때때로 연구자의 실수에 의해 이미지가 중복되거나 뒤바뀌는 경우가 있는데, 출판 후에는 Erratum으로 수정해야 하므로 상당히 번거롭습니다. 추가로 단백질 구조의 경우 PDB에 등록해야 하고, 마우스 실험의 경우 IACUC 승인을 받았는지, 인체 샘플의 경우 IRB를 받았는지, 임상 시험은 등록 번호가 있는지 등을 확인합니다.
다음 글에서는 본문에서 확인해야 할 부분에 대해서 말씀드리겠습니다.
감사합니다.
본 기사는 네티즌에 의해 작성되었거나 기관에서 작성된 보도자료로, BRIC의 입장이 아님을 밝힙니다. 또한 내용 중 개인에게 중요하다고 생각되는 부분은 사실확인을 꼭 하시기 바랍니다.
[기사 오류 신고하기]