논문은 단순한 팩트의 나열이 아니라 어떤 팩트가 어떤 순서로 나열되어 있느냐에 따라 서사를 가진다. 그 서사가 얼마나 촘촘하게 직조되어 있는지에 따라 최종 결론에 도달했을 때의 설득력이 좌우되기도 한다. 우리는 이를 흔히 논문의 스토리라고 얘기한다. 논문의 데이터를 단편적인 사실 하나하나로 받아들이기보단 논문 전반을 관통하는 스토리의 흐름을 함께 파악해야 할 필요가 있다. 오늘 연재에서는 논문의 스토리는 어떤 식으로 만들어지는지, 그 과정에서 논리가 어떻게 전개되는지에 대해 살펴보고자 한다. 아래의 두 논문을 예시로 삼아 설명하고자 하니 기회가 되면 읽고 나서 이 글을 마저 읽어보는 것도 좋을 것 같다.
Chi et al. Nature. 2025.
Yu et al. N.S.M.B. 2025.
1. 질문에서 질문으로 이어지는 이야기
지난 <어떻게 논문을 읽을 것인가(1) : Title, Abstract, Introduction> 편에서 이야기했듯, 모든 논문은 이 연구를 시작한 한 가지 질문에서 출발한다. 그 질문이 연구의 당위성을 뒷받침해주기도 한다. Figure1은 첫 질문에 대한 실마리를 찾기 위해 얻어진 데이터로 시작한다. 그리고 그 데이터에서 뒤따라 나오는 꼬리 질문을 해결하기 위해 다음 실험을 진행한다. 또다시 따라 나온 꼬리 질문을 해결하기 위한 실험이 반복되고, 그렇게 마지막엔 논문의 결론에 도달한다.
예시를 통해 살펴보자.
Chi et al. 에서는 Cysteine의 식이가 장줄기세포의 활성화에 끼치는 영향에 대해 연구했다. 결론부터 말하자면, 논문의 제목에서 말하는 바와 같이 cysteine이 CD8+ T cell로 하여금 IL-22를 많이 만들게 해서 이것이 장줄기세포의 세포분열을 왕성하게 만든다. 하지만 첫출발은 '특정 아미노산의 식이가 장줄기세포에 어떤 영향을 끼치는가'에서 출발했다. 위 결론에 도달하기까지 논문에서는 아래와 같은 단계를 걸쳤다.
특정 아미노산이 장 줄기세포에 어떤 영향을 끼치나?
→ 아미노산 종류별로 쥐에게 먹여봤더니 cysteine을 먹였을 때 세포분열이 가장 활발해지더라
그때 장 조직에는 어떤 변화가 있었나?
→ CD8+ T cell의 양이 많아졌다
CD8+ T cell에는 어떤 변화가 있었나?
→ IL-22의 생산이 늘어났다.
Cysteine이 그 과정에 어떻게 영향을 끼쳤나?
→ Epithelial cell에서 흡수된 cysteine이 CoA으로 만들어지는 대사가 활발해지고 이것이 CD8+ T cell을 불러 모으는 CXCL10의 분비를 촉진한다.
핵심은,
"각 단계에서 도출된 결과 → 다음 단계에서 들여다볼 scope"으로 넘어가는 과정에 있다.
한 결과에서 그다음으로 무엇을 들여다볼지 결정하는 것이 스토리의 뼈대이다. Cysteine을 먹였더니 장줄기세포의 세포분열이 활발해진 장조직에서 immune cell이 아니라 다른 대상에 focusing on 했다면 전혀 다른 이야기가 펼쳐졌을 것이다. Cysteine을 흡수한 epitheilal의 metabolome을 들여다봤을 때 CoA뿐만이 아니라 다른 대사산물도 변화가 발생했었는데, 하필 CoA가 아니라 다른 경로를 들여다보기로 scope를 narrow down 했다면 또 다른 스토리의 논문이 되었을 것이다.
논문의 스토리는 꼬리의 꼬리를 무는 과정이라고 언급했다. 하지만 수백 개의 꼬리 중 어떤 꼬리를 물어서, 그 꼬리의 사슬이 어떤 최종 결론으로 이어지는지를 파악하는 것이 중요하다. 만약 한 데이터에서 뒤 따라 나오는 꼬리 질문이 이상하거나, '왜 이걸 들여다봤지?'라고 의문이 드는 논문은 좋은 스토리의 논문이 아니다. 독자로 하여금 첫 질문에서 시작해 결론에 도달하기까지 중간 질문들을 적절히 잘 던져주는 '이음새가 좋은' 논문이 좋은 스토리의 논문이다. 때문에 논문을 읽을 때는 데이터의 단순 나열로서 파악하기보다는, 각 다음 단계가 왜 시행됐는지 당위성을 하나씩 따져보면서 읽으면 스토리를 파악하는데 좋다.
2. 환원주의적 접근법과 논리적 정합성 따져보기
방금 전까지는 논문의 거시적인 흐름이 짜임새 있게 구성되는 방식에 대해 알아봤다. 하지만 연결고리만 튼튼하다고 좋은 논문일까? 그렇지 않다. 연결고리가 잇고 있는 각 덩어리들도 단단해야 한다. 지금부터는 각 단계 안에서 주장되는 바가 얼마나 논리적 정합성을 가지고 있는지 생각해 보는 방법을 환원주의적 접근법에 비추어 설명해보고자 한다.
환원주의란 '하위 단계의 작은 것들을 이해하면, 그것들이 구성하고 있는 상위 단계를 이해할 수 있다'는 접근 방식이다. 생명과학 연구의 대부분이 환원주의적 접근법을 이용한 연구방법론을 사용하고 있고 복잡한 생명 현상을 이해할 수 있는 아주 강력한 도구이다. 조금 더 쉽게 이해하기 위해 예시를 들어보자. 만약에 특정 조미료의 맛을 알아내는 방법은 무엇이 있을까? 첫 번째는 찌개를 끓일 때, 그 조미료만 빼고 요리해 보는 것이다 (Loss-of-function). 조미료를 뺀 찌개의 맛을 일반 찌개와 비교하여 어떤 차이가 있는지를 보면 된다. 만약에 조금 싱거워졌다면 이 조미료는 짠맛을 내는 역할일 테고, 만약에 더 매워졌다면 이 조미료는 매운맛을 억제해 주는 역할일 것이다. 두 번째는 찌개에 그 조미료를 더 넣어보는 것이다 (Gain-of-function). 역시 일반 찌개와 비교하여 짜졌다면 이 조미료는 짠맛을 내는 역할일 테고, 덜 매워졌다면 이 조미료는 매운맛을 억제해 주는 역할일 것이다. 이때 중요한 것은, 맛을 비교할 때 (종속 변인) 넣거나 빼는 요소 (독립 변인) 외의 나머지는 고정 (통제 변인)되어야 한다는 것이다. 이런 식으로 조미료뿐만 아니라 두부, 대파, 버섯 등의 각 식재료를 하나씩 넣거나 빼보면서 어떤 변화가 생겼는지 하나하나 파악하면 찌개의 맛이 어떻게 구성되는지 전체를 이해할 수 있다. 위와 같이 환원주의적 접근법으로 바라볼 때는 ▲어떤 상황에서 ▲무엇을 넣거나 뺐을 때 ▲어떤 변화가 일어났는지를 잘 분리해서 생각해야 한다.
역시 논문의 예시를 통해 살펴보자.
Yu et al. 에서는 흥미로운 두 가지 실험을 했다.
(1) CTCF라는 단백질을 K/D 한 뒤 (loss-of-function) 유전자 발현의 차이를 살펴봤다.
(2) CTCF를 K/D 한 뒤에 heat shock을 주고 heat shock response (HSR) gene의 증가량을 CTCF K/D 하기 전과 비교했다.
(1)의 결과에서는 유전자 발현 차이가 거의 없었다. 그리고 (2)에서는 K/D 했을 때의 HSR gene의 증가량이 K/D 전과 비교해서 작았다 (HSR gene이 증가하지 않은 게 아니다. 증가의 폭이 줄었다는 뜻이다). 위 두 실험에서의 상황, 변인, 결과를 정리해 보면,
(1)
상황 - WT HeLa
독립 변인 - CTCF의 유무 / 통제 변인 - 나머지 gene들 / 종속 변인 - 유전자 발현량
(2)
상황 - HeLa에 heat shock
독립 변인 - CTCF의 유무 / 통제 변인 - 나머지 gene들, heat shock 실험조건 / 종속 변인 - HSR gene의 증가폭
(1)과 (2)의 차이를 알겠는가? (2)에서는 heat shock을 주긴 했지만 heat shock 전후의 HSR gene 발현양의 차이가 관심사가 아니라, CTCF K/D 전후 각각의 HSR gene 증가폭 차이가 관심사이다.
이를 통해 내릴 수 있는 결론은 'CTCF는 steady state에서 유전자 발현 조절에 기여하지 않지만, gene stimulation에서 역할을 수행한다'라고 생각할 수 있다. 이렇듯, 각 실험에서 변인은 어떻게 설정하고 무엇을 비교하느냐에 따라 논리 전개가 결정된다. 어떤 상황에서 뭘 빼거나 넣었더니 무엇이 변했는지를 가지고 어떤 결론을 도출했는가. 각 데이터에서 이것을 들여다보며 논문을 읽어야 한다. 가끔은 뭔가 데이터를 보여주긴 하는데 거기서 뽑아낸 implication이 데이터와 잘 일치하는지 와닿지 않는 경우가 있다. 그런 무리수를 두는 데이터는 논리적 정합성이 떨어지는 데이터이다.
최근에 필자의 한 친구에게 있었던 일을 소개하며 글을 마치고자 한다.
글 작성 시점 기준 지난주에 서울에 눈이 많이 내렸다. 친구는 저녁 실험을 급히 마무리하고 저녁 약속을 나갔는데 눈길에 차가 미끄러져 사고가 나는 바람에 다음날 실험에 지장이 발생했다. 친구의 선배는 '그러게 왜 저녁 약속을 나가서 문제를 발생시키느냐'라고 나무랐다. 이 선배의 말은 과연 타당할까? 환원주의적으로 한번 생각해 보자.
저녁 약속을 나갔다는 사실을 고정시켜 두고, 눈이 내리지 않아 사고가 나지 않았고 무사히 약속을 다녀왔다고 가정해 보자. 그렇다면 다음날 실험에 지장이 가지 않았을 것이다. 그러면 문제가 되지 않는다. 저녁 약속을 고정해 두고 눈 내림 여부만 바꿨더니 문제였던 게 문제가 되지 않는 것으로 바뀌었다면, 과연 문제를 일으킨 요소는 저녁 약속일까 눈 내림일까? '저녁 약속을 나간 것이 문제'라고 나무란 선배의 말은 타당하지 않다. 선배가 평소에 환원주의적 사고를 훌륭히 해내왔던 사람이었다면 이런 말도 하지 않았을 것이다. 평소에도 간혹 엉뚱한걸 서로 결부시켜서 이상한 논리를 주장하는 사람들이 있다. 어떤걸 분리시키고 어떤 걸 연결시킬지 잘 생각하는 것이 논리적 정합성을 다듬는 중요한 관건이다.
참고 문헌
2. Yu, R., Roseman, S., Siegenfeld, A.P. et al. CTCF/RAD21 organize the ground state of chromatin–nuclear speckle association. Nat Struct Mol Biol 32, 1069–1080 (2025).
https://doi.org/10.1038/s41594-024-01465-6