다양한 스토리를 담고 있는 연재를 만나보세요.
[과학자에게 보내는 철학 서신] 1-2 경험과 이론 사이, 귀납과 입증(1)
Bio통신원(갑오징어)
데이터와 가설, 또는 경험과 이론 사이
어처구니 없을 정도로 오만해 보일지 몰라도, 여전히 적지 않은 철학자들은 과학을 좀 더 정교한 경험적 추론의 일종 정도라고 생각한다. 아마도 이런 입장의 핵심에는, 과학적 지식 역시 다른 모든 경험적 지식과 동일한 질문, 동일한 단절을 넘어야 한다는 사실이 자리잡고 있을 것이다. 지난 글에서 지적했듯, 이 단절은 관찰과 실험을 통해 얻은 경험적 데이터, 그리고 여러 ‘발견의 맥락’ 속에서 떠올린 가설 또는 이론 사이에 있다.
이 단절을 넘는 과정, 즉 옹호하고자 하는 가설을 세심한 관찰 끝에 얻어낸 경험적 증거로 지지하는 과정을 서술하고 또한 규제할 비법이 담긴 매뉴얼은 존재하지도 않고, 존재할 수도 없다. 분야와 맥락, 질문마다 과학자들의 개별적인 판단이 이뤄지고, 이 판단을 동료들이 평가하는 과정이 이뤄질 따름이다. ‘발견의 맥락’ 속에서 가설을 창안할 때 뿐만 아니라, ‘정당화의 맥락’ 속에서 가설을 입증할 때 역시 과학자들은 일종의 예술을 수행하는 것 같다.
입증의 과정이 품고 있는 바로 이 단절은, 과학철학의 전통적인 주제이면서 결코 쉽게 해결되지 않는 쟁점의 원천이다. 가설 H에 대해, 증거 E는 대체 어떤 관계를 맺고 있어야 충분한 지지를 제공해 H가 입증의 문턱을 넘게 도울 수 있는가? 증거 E를 설명할 수 있는 동등한 가설이 여럿 존재한다면, 이 때 당신은 무엇에 호소해 가설을 선택해야 하는가? 이들 질문은 모든 과학자들이, 공학적 활동들이, 그리고 일상인들 역시 늘, 적어도 묵시적으로는 묻는 질문이며, 결국 모든 과학자들과 경험적 데이터를 활용하는 사람들을 과학철학으로 인도하는 질문이다.
철학사에 익숙하다면, 이들 쟁점은 귀납의 문제(3절 참조)를 다루면서 취급하는 경우가 많다는 점도 알고 있을 것이다. 나 역시 귀납의 문제는 중요한 틀이라고 생각한다. 하지만 여기서 나는, 이들 문제에 접근하기 위해 일종의 우화가 아니라 실제 사례를 활용하고자 한다. 공학과 과학의 현장에서 직면하는 실질적인 문제를 활용하면, 과학철학 문헌에서 흔하게 접하는 철학자의 공상적인 사고실험과 기괴한 사례가 가진 통찰은 보존하면서도 좀 더 많은 과학기술인들이 납득할만한 설명을 구성할 수 있다고 보기 때문이다. 기술적으로 복잡한 상황이나 연구 과정 중 판단이 필요한 상황 속에서 기술자나 연구자들이 늘 마주치는 문제를 반성하는 데 유용한 거울이 바로 과학철학임을 밝히는 이 연재의 목표를 위해, 과학철학자들이 개발해 낸 사고 실험 속 기괴한 사례들은 좀 더 현실적인 사례와 함께 활용될 필요가 있다.
두 개의 현실적 사례
(그림 1) 신호와 열차. 후미등(열차측, 적색)이 열차의 진행 방향을 지시하고 있다. 열차 좌측 신호등의 적신호는 열차로 인해 점등된 것이다. 금천구청역에서 동료와 함께 직접 촬영한 그림이다(2017년 12월).
#1. 1 영하의 겨울에는 얼어붙은 외기에 노출된 모든 장비가 말을 잘 듣지 않는다. 개인적으로도 겨울의 추위 덕분에 기기가 말을 듣지 않아 끔찍한 경험을 하게 된 일이 한두 번이 아니지만, 2018년 12월 8일의 강릉역에서는 이 끔찍함이 수백 명, 나아가 보도를 통해 상황을 접한 수백만 명에게 번져 나갔다.
(그림 2) 탈선 분기기 인근의 배선 약도. 실제 철도 궤도의 기하 구조에 따라 그린 그림이다. 강릉기지분기만 비율을 확대해 그렸다.
이 날 07시 34분, 강릉역 남측 강릉기지분기에서는 고속 열차의 탈선 사고가 있었다. 사고의 근접 원인은 이 분기의 21B 분기기가 (아마도 추위로 인해) 불완전하게 작동한 데 있었다. 이 분기기는 강릉 측에서 접근하는 열차를 청량리 방향으로 보내거나 강릉기지 방면으로 진입시킬 수 있는 지점이다. 분기기가 불완전하게 개통되어 있거나 열차가 통과하는 도중 방향이 전환되는 경우 열차는 분기기 때문에 탈선하게 되며, 불행히도 21B 분기기는 사고 열차가 통과할 당시 불완전하게 개통되어 있었다.
본래 철도 설비는 이런 오작동과 관련된 정보를 전달할 수 없을 정도로 허술하게 구성되어 있지 않다. 분기기, 특히 열차가 고속 주행하는 본선상 분기기가 매우 위험하다는 것은 철도 초기부터 누구나 알고 있던 상식이기 때문이다. 여기 대응하기 위해, 분기기가 설치된 곳인 역 주변 철도 신호 체계에는 ‘연동(interlock)’이라는 시스템이 확립되어 있다. 여기서 연동이란, 분기기의 진로 구성 상태와 선로주변 신호기 또는 차상 장치에 표출되는 운전 지시 사이를 서로 대응시키는 신호 체계를 말한다. 21B 분기와 강릉기지분기에도 당연히 연동 장치가 설치되어 있었다. 그리고 이 장치와 연결된 어딘가에 오류가 있다는 것은 이미 강릉역에서 파악하고 있던 상태였다. 실제로 사고 시점에는 신호 파트 직원들이 분기기와 그 인근에 도착, 설비를 살펴보고 있었고, 이들은 탈선한 열차를 피하다가 부상을 입기까지 했다.
무엇이 문제였던 것일까? 관제소에 오류가 발생한 것으로 나타난 분기기가 21B 분기기가 아니었던 것이 문제였다. 21B 분기기는 쌍동기, 즉 연동되어 함께 움직이는 반대편 쌍이 존재하는 분기기였다. 이 분기기는 본선과 기지 인입선 사이에 위치해 있었고, 반대편 쌍인 21A 분기기는 기지에서 나온 열차가 폭주해 본선에 돌입할 경우를 대비한 안전측선과 (강릉방면 본선과 접속하는) 기지 인입선 사이에 위치해 있었다. 그런데 21B의 상태를 나타내는 신호를 관제로 전달하는 케이블은, 청량신호소 내부의 캐비닛에서 21A와 서로 바뀌어 꼽혀 있었다. 신호소의 캐비닛은 2017년 하반기 준공 당시의 검사 후 봉해진 채 사고 당시까지 개봉되지 않은 것으로 확인되었다. 한 차례 봉해진 신호소의 캐비닛을 다시 여는 것은 규정상 개통 뒤 3년이 지난 시점에 이뤄질 정기 예방정비 시점에나 예정되어 있었다. 결국 당시의 관제도, 현장 직원도 이 상황을 파악할 방법은 없었다. 엉뚱한 지점만 살펴보던 관제와 현장 직원들은 사고 상황과 관련된 조치를 취할 수 없었다.
이 분석은 증거를 통해 가설을 입증(confirmation)하려는 활동을, 그리고 이런 입증이 거짓으로 귀결되어 결과적으로 쟁점 가설 입증을 통해 충족하려 했던 공학적 목적을 달성하지 못하게 되어 생긴 비극을 보여주고 있다. 여기서 나는 공학의 현장 속에서 벌어져, 철학과는 아무런 상관도 없어 보이는 현업의 일화 속에서도 과학 철학의 핵심 주제인 입증이 등장한다는 데 초점을 맞추려 한다.
관제와 현장은 21A의 이상 신호를 문자 그대로 받아들였다. 이 신호는 관제와 현장에게 21A의 이상을 입증하는 증거였다. 평시에 이는 매우 당연한 방침이다. 연동 신호는 물리적 구조와 일정한 절차에 의해 상당한 보증을 받은 증거이기 때문이다. 그런데 사실, 실제로 21A와 21B에서 나타난 이들 신호는 배선 착오, 그리고 신호소 설비를 시공 후 영업 사업자(철도공사)에게 넘기기 직전에 이뤄지는 검증 과정에서 문제의 착오를 잡아내지 못한 허점 때문에 나타난 거짓 신호였다. 개통 이후의 조작으로 인한 추가적 혼동과 교란을 막기 위해 봉해져 있던 신호 설비는, 이 경우에는 예방정비가 실제로 이뤄지기 전에는 오류를 눈으로 볼 수 없게 만들어 원활한 재보증 과정을 막았다 2(물론 이는 실제로 연동 관련 회로가 언제나 쉽게 눈으로 확인되어야 한다는 말은 아니다). 다른 방향에서 재 보증 과정을 막는 압력도 존재했다. 21A 분기기는 강릉기지의 열차 진출입을 위해 다수 활용되는 분기기였고, 사고 시점에도 관제에서는 분기기 고장으로 인해 출고 열차 통과 일정을 재설정하기 위한 교신이 진행중이었다. 여러 과업이 동시에 진행되면서, 과거의 절차를 통해 입증된 것으로 간주된 신호를 재검토하는 과업의 우선 순위는 크게 뒤로 밀릴 수 밖에 없었다. 21B 자체의 이상은 분기기 자체에 가깝게 다가가야 확인할 수 있었으나, 아쉽게도 강릉기지분기는 상주 인원이 없으며 주변 역 직원에 의해 관리되는 본선 도중 분기 시설에 불과해 21B 자체의 이상을 명시적으로 확인할 충분한 눈을 얻기는 어려웠다.
사고의 핵심은 결국 이렇다. 문제의 신호가 21A와 21B 쌍동기의 상태와 정확히 대응한다는 가설에 대한 입증은, 준공 당시의 절차 속에서 불충분하게만 이뤄졌으나 이 불충분함은 현업에 알려지지 못했다. 또한 다양한 조건 덕에, 사고 시점까지 회로 구성상 오류가 있다는 증거는 발견되지 못했다. 불충분한 입증, 그리고 반대 증거의 확인을 막는 여러 조건들은 이 탈선 사고의 인식적 기반이 되었다.
이 글은 사고를 반성하는 보고서가 아니며, 다만 과학 철학 에세이일 뿐이다. 따라서 여기서 초점을 맞출 쟁점은 이것이다. 이 사고는, 이른바 ‘귀납의 문제’가 철학자들이나 관심을 가질만한 일종의 우화가 아니라는 점을 보여준다. 과거의 경험적 자료나 절차를 통해 어떤 목표나 주장, 가설에 대해 이뤄진 입증은, 분야를 막론하고 미래를 예측하는 데 불충분할 가능성이 여전히 남아 있다. 2019년 12월 8일 아침, 현장직원과 관제 모두가 의심하지 않았던 입증은 사실은 불충분한 것이었다. 탈선 사고는 바로 이 불충분성이 제공한 틈새가 어떤 결과까지 도달할 수 있는지를 극적으로 드러내 준다.
#2. 3 주제와 쟁점을 조금 바꿔 본다. 아래 그림 1은 내가 개인 저술(『교통, 서울 그리고 철도』, 가제, 워크룸프레스, 근간)에 활용하기 위해 준비중인 그림 가운데 하나를 MS 엑셀이 제공하는 방식대로 가공한 결과다.
(그림 3) 같은 데이터, 네 개의 추세선. 그림 네 개는 모두 같은 데이터, 즉 각 거대 도시별 철도 밀도와 인구당 철도 사용 빈도를 담고 있다. 모두 엑셀로 그린 것이며, 추세선의 작성 방법 역시 엑셀이 기본적으로 제공하는 것들이다. 원 데이터 자체의 내용은 이 글에서는 중요하지 않으므로, 이들이 단지 가상의 값이라고 보아도 큰 문제는 없다. 실제 데이터의 수집 과정과 그에 대한 분석은 추후 책이 출간되면 확인하기 바란다.
이 데이터에서 내가 얻고자 했던 것은 x축과 y축으로 나타낸 지표 사이의 관련성을 설명할 수 있는 규칙이다. 책에는 좌상단 그림이 들어갔다. 규칙 선의 수식이 가장 단순했기 때문이다. 하지만 그림 1의 나머지 세 그림은, 이들 데이터에 기반해 그릴 수 있는 규칙의 선이 단 하나가 아님을 보여준다. 물론 단순 이동평균 곡선에 불과한 우하단 곡선의 경우, 50개의 도시가 따르는 규칙을 간단하게 서술하는 데 도움이 되지 않는다는 점에서 쉽게 배제할 수 있다. 하지만 나머지 두 곡선은 그렇게 쉽게 배제하기 어렵다. 우상단 곡선 역시 사회과학의 값 치고는 결정계수(R2)가 매우 높은 것은 사실이다. 게다가 좌하단 곡선은, 비록 항이 하나 더 많아 수식의 복잡성은 좀 더 높지만 결정계수가 첫 번째 그림보다 조금 높다. 좌상단 대신 좌하단 곡선을 택해 그림 1의 데이터가 그리는 큰 추세라고 주장하더라도 별다른 문제가 없다는 말이다.
여기서, 나는 데이터와 이를 간략하게 설명할 이론 사이의 연결을 위해 데이터로 환원되지 않는 기준을 활용했다. 식의 단순성(항의 개수), 데이터와 제시된 곡선 사이의 관계(결정계수)가 바로 그것이다. 게다가 사용된 데이터는 결정계수를 기준으로 곡선을 선택할 것인가, 식의 단순성을 기준으로 곡선을 선택할 것인가라는 질문에 대해 분명 아무런 답도 제시해 주지 않는다. 다행히 여기서는 두 곡선의 결정계수의 차이가 매우 작아 식의 단순성을 선택 기준으로 삼는 데 큰 무리가 없어 보이지만, 결정계수 차이가 훨씬 컸다면 문제는 달라졌을 것이다.
이들 그림은 이른바 ‘미결정성 문제(indeterminacy problem)’를 과학 연구의 현실과 조금 더 가까운 방식으로 나타내기 위해 선택한 사례다. 이 문제의 요점은 이것이다. 어떤 데이터 집합 S에 대해, 이것을 설명할 수 있는 복수의 이론이 있다고 해 보자. 또 S는 이들 가운데 일부 또는 상당수에 대해 중립적이며, 이에 따라 S는 이론 가운데 어느 하나를 지지한다고 보기 어렵다. 여기서 감안된 요인 가운데, 물론 결정계수는 데이터와 이론 사이의 관계이므로 데이터에 중립적인 요인이라고 보기는 어렵다. 그러나 단순한 식을 택해야 한다는 지침의 경우, 데이터와는 무관한 고려 사항임이 분명하다. 주어진 데이터에 반영된 실재가 복잡한 식으로 더 잘 설명되는지, 단순한 식으로 더 잘 설명되는지는 문제의 실재에 대한 정보 없이 판정할 수 없는 쟁점이며, 따라서 데이터만 가지고 있는 입장에서는 데이터와 무관한 기준을 따라 어느 한쪽 식을 선택하지 않을 수 없다.
그림 3은, 경험과 이론 사이의 관계는 경험과 무관한 요소를 통해 결정될 수 있으며, 이 틈새는 가설을 입증하려는 과학자의 시도 속에서 많은 경우 회피할 수 없는 한계라고 말하고 있다. 4 과학이 가설과 데이터라는 두 기둥을 통해 진척된다는 점을 부정하는 과학자는 아무도 없을 것이다. 그런데 이 두 기둥 사이의 다리는, 예를 들어 식의 단순성과 같이 데이터로는 환원되지 않는 요소를 주요 재료로 하는 것 같다. 이 상황을 어떻게 이해할 수 있는가? 이 쟁점, 즉 입증을 위해 가설과 데이터 이외에 무엇이 더 필요하냐는 쟁점에 대한 과학자들의 묵시적, 또는 명시적 답변은 그 자체로 과학철학의 핵심 가운데 하나이다.
문제의 초기 형태: 귀납의 문제, 인과, 그리고 입증
각자의 마음 속에 무슨 답이 있는지는 여러분 자신만이 알고 있을 것이다. 이 글은, 바로 이 답과 비교해 볼 수 있는 몇 가지 그림을 제시하는 방향으로 나아가려 한다. 반복하자면, 이 연재는 철학자들이 과학 속의 단층에 대해 이미 제출해 놓은 답안들을 생각의 거울로 활용할 수 있는 위치에 배치하려는 시도이므로 그렇다.
흄의 답안은 그 선두에 올 수 있다. 입증을 위해 필요한 추가 요소가 무엇인지에 대해, 흄의 답안은 두 마디로 간추릴 수 있다. 인간의 습관. 조금 더 상세하게 말해, 유형 A에 속하는 선행 사건에 대해, 상당히 자주 후행하는 것으로 관찰된(=‘항상적 연접’이 관찰된) 유형 B 사건이 따라올 것이라는 추측을 상상해 내는 습관. 앞서 활용한 용어로 흄의 관점을 조금 더 상세히 서술할 수도 있다. ‘항상적 연접’은 선행 사건 A와 후행 사건 B 사이의 인과관계를 입증하는데, 이는 이 증거를 다수 관찰한 인간의 마음은 습관을 형성해 ‘항상적 연접’에 대한 데이터와 A와 B 사이에 인과관계가 있다는 가설 사이를 빠르게 연결시킬 수 있다는 말이다.
흄이 이런 주장을 내놓은 중요한 의도 가운데 하나는, 흄 이전 철학자들이 인과에 대해 가지고 있던 생각을 뒤흔드는 데 있었다. 적어도 아리스토텔레스 이래, 서양 철학자들은 인과 관계가 사물 내부에 있는 형이상학적 관계라고 생각해 왔다. 다시 말해, 인과 관계는 실재의 일부, 실재의 구조라고 생각해 왔다. 방금 확인한 흄의 입장은, 이런 생각에 대한 도전이었다. 그는 인과는 실재라고 말하기 어려우며, 습관의 도움을 받아 경험 데이터로부터 지지를 받는 가설이라고 주장했기 때문이다. 나는 이 주제와 관련된 논의는 제1부에서는 진행하지 않고, 부분적으로는 제2부, 그리고 상당부분 제3부에서 진행하려 한다. 그러나, 인과에 대한 흄의 입장은 적어도 부분적으로는 과학자들의 상식과 흄 이후 경험주의 철학 사이의 중요한 차이를 설명할 수 있다는 점에서 잠깐 짚어둘 필요는 있다. 대부분의 과학자들은, 적어도 학계가 상당한 의견의 일치를 보고 교과서에서도 다루고 있는 유형의 인과관계는 실재한다고 생각할 것이다. 그러나 흄 식의 입장, 즉 인과는 가설일 뿐이며 인간의 습관에 의해 지지받는 상상의 산물이라는 입장은, 자신들이 실재를 다루고 있다고 보는 보통 과학자들의 직관과는 충돌한다. 흄의 형이상학적 입장을 축소주의(deflationism) 또는 최소주의(minimalism)라고 부를 수 있다면, 과학자들의 직관이 품고 있는 형이상학은 팽창주의(inflationism)라고 불러도 좋아 보인다.
어쨌든, 흄은 (적지 않은 과학자들과는 달리) 가설과 데이터 사이의 연결을 위해 이들 배후의 실재에게, 다시 말해 팽창주의적 형이상학에 호소하지 않으려 한 철학자라는 의미에서 중요하다. 흄에게 반론을 시도한 칸트의 응전 역시 철학사에서는 중요하다. 하지만 이 연재에서, 나는 칸트와 흄의 공통점이 더 중요하다는 관점을 택하려 한다. 칸트와 흄은 과학과 실재 사이의 관계라는 형이상학적 쟁점에서는 사실상 같은 입장이기 때문이다. 둘 사이의 차이는 흄이 습관이라고 봤던 인과 판단을 칸트는 모든 인간이 가진 보편적 판단 형식이라고 보았다는 데 있으나, 이런 차이는 가설과 데이터에 더해야 하는 입증의 나머지 성분에 접근해 그 성격을 규정할 때는 그리 큰 차이가 아닌 것 처럼 보인다. 두 철학자의 답은, 성공한 입증에 대해 거의 같은 관점에서 제안되었으나 조금 초점이 다른 설명처럼 보인다. 게다가, 앞서 살펴본 사례에서처럼, 신뢰받았으나 결국 불충분했던 입증을 식별한다던가, 미결정성 문제 앞에서 결정할 때 무엇에 호소해야 하느냐는 문제에 대해, 이들 고전적 철학자들의 답은 큰 도움이 되지 않는 듯하다.
일러두기
※ 이 연재의 제1부는 약 15개의 에세이로 이뤄질 예정이며, 이 글은 그 가운데 두 번째 글의 첫 번째 부분이다. 특히 모바일 환경에서 읽기 지나치게 길다는 의견을 확인해, 너무 긴 에세이는 둘 또는 셋으로 쪼개어 업로드하려 한다.
※ 이번 서신(다음 주에 계속)에서 다룬 논의를 더 깊이 있게 검토하기 위해서는 다음 한국어 문헌을 참조할 가치가 있다.
● 전영삼, 『귀납: 우리는 언제 비약할 수 있는가』, 아카넷, 2013.
● 이영의 · 최원배 · 여영서 · 박일호, 『입증』, 서광사, 2018.
주석
1. 이 분석은 우연히 다시 읽게 된 찰스 페로, 『무엇이 재앙을 만드는가』, 김태훈 옮김(RHK, 2013)에서 착안한 것임을 밝힌다.
2. 이런 문제를 줄이기 위해 최근의 연동은 많은 부분이 소프트웨어로 구현된다. 그러나 이런 소프트웨어 역시, 직접 야지에서 움직이는 설비와 일정한 회로로 연결되지 않으면 실제 연동 기능을 수행할 수는 없다.
3. 이 사례는 ‘대안 가설의 문제’를 시각화한 ‘곡선 맞추기 문제(curve fitting problem)’를 실질적인 학술적 분석의 맥락 속에서 조금 더 흔하게 볼 수 있는 형태로 만들기 위한 것이다.
4. 물론 이 문제는, 예를 들어 결정계수가 1인 식이 나올 경우에는 사라지는 것이 아니냐는 입장도 가능할지 모른다. 이런 의문에 나는 이렇게 답하고 싶다. 이 지적을 회피하는 것은 논리적으로는 그렇게 어려운 문제는 아니다. 유한개의 점에 대해, 같은 점을 연결하는 무한히 많은 선이 가능하기 때문이다. 본래 이렇게, 무정형적으로 여러 곡선이 제시되는 것이 곡선 맞추기 문제의 형태이기도 하다. 다만 이런 회피 시도는 과학의 현장과는 멀리 떨어진 방향으로 향한다. 따라서 나는 과학의 현실에서 볼 법한 데이터와 곡선을 활용하는 논의 전개가 더 이득이라고 생각했다.
본 기사는 네티즌에 의해 작성되었거나 기관에서 작성된 보도자료로, BRIC의 입장이 아님을 밝힙니다. 또한 내용 중 개인에게 중요하다고 생각되는 부분은 사실확인을 꼭 하시기 바랍니다.
[기사 오류 신고하기]
과학철학을 공부했다. 철학이 오늘날의 정교한 지적 분업 체계 속에서 대체 무슨 의미가 있는지 고민하고 있다. 『거대도시 서울 철도: 기후위기 시대의 미래 환승법(워크룸프레스, 2020)』을 저술했고, 의학의 철학을 다룬 책 약간을 번역(공역)했다. 앞으로 이 연재는 바로 철학이 오늘의 지적 분업 체계 속에서 가진 의미에 대한 의문에 답하려는 시도로서 계속 진행될 것이다.
다른 연재기사 보기
전체 보기