19세기 말, 유럽은 콜레라의 위협에 휩싸였다. 영국 런던의 소호 거리, 한 사람의 사망으로 시작된 죽음의 그림자는 런던의 아침을 울음으로 휩싸이게 했다. 콜레라의 원인은 미궁으로 빠졌고 서로의 의견만 분분했다. 내일 아침 내가 죽는 일은 없기만을 바라며 시민들은 잠자리에 들었다. 하지만 다음 날 아침이면 그들 중 누군가는 죽음을 피하지 못했다. 현재 콜레라는 통제할 수 있는 질병이 되었다. 원인이 밝혀지지 않은 당시에 콜레라는 공포의 대상이었다. 의사 존 스노(John Snow)1)는 종이 한 장을 들고 죽은 자가 살던 집을 찾아다녔다. 그의 손에 들린 종이에는 콜레라 발생 원인에 대한 답이 담겨 있었다. 그 답을 만들기 위해 의사는 어떤 작업을 했을까? 그가 사용한 데이터는 무엇일까? 인문학에 담긴 데이터, 그 데이터를 살펴보자.
글 김택우(데이터인문학 저자, 나무데이터㈜ 대표)
사람들이 콜레라로 죽어나갔다
1854년 영국 런던 소호지구. 거리를 오가는 사람들의 표정이 좋지 않았다. 사람들은 배를 움켜쥐고 화장실을 찾아다니거나 병원을 찾아 종종걸음을 했다. 병원은 대기 환자로 가득했다. 기다리는 사람들은 통증으로 얼굴을 찡그렸다. 간호사는 진료실과 대기실을 오가며 환자를 호출했다. 진료실로 들어간 환자만큼 대기자는 줄었지만 곧 새로운 환자가 빈자리를 메꿨다.
“다음 분 들어오세요.”
대기실 맨 앞자리에 앉아 있던 한 중년 여성이 간호사의 호출에 천천히 몸을 일으키며 진료실로 들어갔다. “여기 앉으세요. 표정을 보니 많이 안 좋으시군요. 어디가 아프신가요?”
의사는 환자의 표정을 보고선 어떤 상태인지 알았다. 하지만 환자가 이야기하는 증상을 듣고 싶었다. “선생님, 왜 이러죠. 배가 너무 아파요.”
그녀는 얼굴을 찡그렸다. 이마에는 땀이 흘렀지만 닦을 수는 없었다. 아픈 배를 움켜 쥔 손을 이마에 가져갈 수 없었다. “아주머니, 어떻게 아프세요?”
의사 존 스노(John Snow)는 환자의 얼굴을 바라보며 청진기를 귀에 꽂았다. 진찰을 하기 위해 그녀에게 손짓했다. “설사가 심하고 목이 너무 말라요. 어제는 저희 남편이 그러더니 오늘은 제가 그러네요. 아이고, 배야. 선생님, 뭐가 잘못된 거죠?”
그녀는 금방이라도 울음을 쏟을 것 같은 눈으로 의사를 바라보았다. 의사는 환자의 배와 등에 청진기를 대고 상태를 확인했다. “아주머니, 이 약 드시고, 물 많이 드세요. 그리고 오늘 하루는 집에서 푹 쉬어야 합니다.”
스노는 난감했다. 2~3일 전부터 환자가 밀려들었는데, 동일한 증상을 보이고 있었다. 환자들에게는 말하지 않았지만 콜레라(cholera)2)가 분명했다. 이미 사망자도 나왔다. 발병 첫 주에는 93명이었는데, 열흘이 지나자 500명 이상으로 늘었다. 빠른 상승세였다. 스노는 옛날의 악몽이 떠올랐다. 5년 전인 1849년에는 콜레라로 5만 명의 사상자가 나왔기 때문이다.
‘음~! 이대로는 안 되겠어. 원인을 찾아야 해.’
스노는 진료실을 나가는 환자를 보며 다짐했다.
콜레라의 원인은 어디에 있는 거지?
존 스노의 고민은 깊었다. 지금까지 콜레라는 공기로 옮겨진다고 알려져 있었다. 하지만 찾아오는 환자 증상을 보면 ‘공기를 통한 전염’이라고 보기에는 도저히 설명되지 않았다. 공기를 통한 전염이라면 증상이 기관지 쪽이어야 하는데 다들 내장에 증상을 보였기 때문이다. 더군다나 환자들 대부분이 심한 설사를 동반하고 있었다.
‘환자들이 보이는 증상을 기반으로 원인을 찾아야 해!’
스노는 낮에는 진료를 하고 저녁에는 원인을 찾기 위한 연구에 몰두했다. 얼마 전, 의사 윌리엄 파(William Farr)3)가 사망자의 규모와 상황을 인터뷰한 기사가 신문에 실렸다. 그는 콜레라의 원인을 공기로 보고 있었다. 스노는 윌리엄 파가 사용한 기초 데이터를 확보했다. 데이터는 감염에 따른 사망자 수와 주소가 전부였다. 스노는 단순히 사망자의 인적 사항과 인원만 들어 있는 데이터를 보자 난감해졌다. 좀 더 원인에 접근할 만한 정보가 있을 것으로 생각했기 때문이다. 그는 책상에 놓인 데이터를 멍하니 바라보았다. 순간 주소가 눈에 들어왔다. 책장을 뒤져 런던 지도를 꺼냈다.
1) 존 스노(1813년 3월 15일~1858년 6월 16일): 빅토리아 여왕 시대 영국의 의사.
2) 콜레라(cholera): 수인성 전염병, 설사와 탈수 증세를 보임.
3) 윌리엄 파(William Farr): 1807~1883년, 영국 전염병 학자, 의료 통계 창시자 중 한 사람.
존 스노의 “콜레라 지도”
스노는 첫 번째 줄에 나와 있는 사망자의 주소를 지도에서 찾았다. 그 주소 위에 검은 사각형을 표시했다. 이어서 두 번째 줄에 나와 있는 감염자의 주소를 찾고 검은색 사각형을 표시했다. 데이터에 나와 있는 순서대로 한 줄씩 한 줄씩 지도에 위치를 표시해 나갔다. 그중에는 한 가족으로 보이는 숫자도 있었다. 2명 이상의 사망자가 있는 주소에는 그 수만큼의 검정 사각형을 층으로 표시했다. 그 방식으로 데이터 전체를 지도에 표시했다.
스노는 사각형이 표시된 지도를 자세히 들여다보았다. 표시된 검은 사각형은 특정 지역을 중심으로 몰려 있었다. 해당 지역은 지도 중심부에 있는 ‘브로드 가(Broad Street)’였고, 그 중앙에 ‘공용 펌프(Pump)’가 있었다. 공용 펌프는 시내 곳곳에 있지만, 사망자가 표시된 검은 사각형은 이 펌프를 중심으로 퍼져 있었다.
“그래! 바로 이거야. 이곳이 콜레라가 발생된 최초 지역이야. 이 물이 오염되었을 거야. 이 물을 길어다 마신 사람들에게 복통과 설사가 일어난 거야. 틀림없어!”
스노는 지도에 표시한 사각형과 펌프를 살펴보며 콜레라가 발생된 최초 지역이 이 곳임을 확신했다.
확신을 확인하고 조치하다
확신은 추측에 불과하다. 데이터를 지도에 옮겨서 사망자의 분포로 확신한 것이다. 확실해 보였지만 그래도 확인은 해야 했다. 스노는 검은 사각형이 표시된 집들을 찾아갔다. “혹시, 브로드 가에 있는 공용펌프에서 물을 길어 드시나요?” 이 질문에 모든 사람이 ‘맞다’고 대답했다. 콜레라의 원인이 공용 펌프에 있는 것이 확실해졌다. 이제 원인을 알았으니 대책을 세워야 했다. 사람들이 더는 브로드가의 공용펌프에서 물을 마시지 못하게 해야 했다.
당시 공용 펌프는 시에서 관리하고 있었다. 스노는 사망자가 표시된 지도와 윌리엄 파가 사용한 기초 데이터를 들고 시청 담당자를 찾아갔다. “안녕하세요! 감독관님. 여기 이 지도를 봐주세요.”
스노는 지도를 탁자에 펼치며, 검은 사각형이 표시된 지역을 가리켰다. “여기 이 검은 사각형은 무엇이죠?”
담당자는 스노가 보여준 지도에 표시된 검은 사각형을 가리키며 물었다. “사각형의 위치는 사망자의 주소를 표시한 것이고요. 개수는 사망자 수입니다. 사망자 관련 데이터는 의사인 윌리엄 파로부터 구한 것입니다.”
스노는 담당자에게 사각형의 의미와 데이터의 출처를 설명했다. “음, 이 점들이 사망자의 수를 의미한다면…….”
시청 공무원은 콜레라 감염 지역이 표시된 지도를 한참 내려다보며 곰곰히 생각했다. 스노가 지도에 사각형을 표시한 후 보여주었던 모습과 별반 다르지 않았다. “이 점들이 브로드 가를 중심으로 퍼져 있군요. 가만 있자, 이 거리가 콜레라의 중심지겠네요.”
담당자는 지도를 보며 나름대로 추측을 해 나갔다. “맞습니다. 잘 보시면 브로드 가 중간에 공용 펌프가 하나 있습니다. 저는 검은 사각형이 표시된 집을 찾아다니며 물어보았습니다. 다들 이곳에서 물을 길어 먹었다고 합니다. 이번 콜레라의 발생 원인은 공용 펌프입니다. 분명 이곳의 물이 오염되었을 것입니다. 이곳을 폐쇄해야 합니다.”
스노는 원인인 공용 펌프를 가리키며 폐쇄해야 한다고 설득했다. 설명을 들은 담당자도 스노의 이야기에 수긍했다.
“당신의 말대로 펌프를 폐쇄해야겠군요. 그런데 폐쇄는 어떤 방법으로 해야 할까요?”
“간단합니다. 물을 긷는 데 사용하는 펌프의 손잡이를 제거하면 됩니다. 그러면 아무도 그 펌프에서 물을 받지 못할 테니까요.”
“좋습니다. 그렇게 하겠습니다.”
담당 공무원은 스노의 의견대로 펌프 손잡이 제거를 허가했다. 다음 날 브로드 가의 공용 펌프의 손잡이는4) 제거되었다. 이후 콜레라 환자도 급격히 줄어들었다. 런던 소호 지구를 오가는 사람들의 표정은 밝아졌고, 사람들의 발걸음도 가벼워졌다. 스노의 병원에 배를 움켜잡고 오는 환자는 거의 사라졌고 그 자리를 일반 환자가 채웠다. 브로드 가에 있는 이 펌프는 현재도 보존되고 있다.
존 스노의 “콜레라 지도”, 데이터를 다르게 보았다
동일한 데이터였다. 통계학자 윌리엄 파(William Farr)가 사용한 데이터와 존 스노가 사용한 데이터는 같은 것이다. 윌리엄 파는 콜레라가 공기를 통해 전염된다는 이론5)에 따라 기온과 관련된 그래프를 보여주었다. 반면 존 스노는 환자의 상태를 보고 음식물과 관련이 있음을 추측해 동일한 데이터를 지도에 표시하였다.
지도에는 사망자 수만큼의 블록을 주소지 위에 그렸다. 지도는 표나 그래프에서는 보여 줄 수 없는 사망자의 위치와 밀집도를 보여주었다. 사망자는 브로드 가에 몰려 있었고, 그 중심에 펌프가 놓여 있었던 것이다.
통계주보는 표 형식으로 만들어진 데이터다. 누구는 온도와의 관련성을 그래프로 그려서 설명했고, 누구는 지도에 그려서 원인을 밝혀냈다. 동일한 데이터지만 어떤 방식으로 적용하는 가에 따라 다른 결과를 보여준다.
적용방식이 달랐던 것은 무엇 때문일까? 그것은 개인의 경험과 사회적 관념일 것이다. 윌리엄 파는 기존 입장인 공기 전염에서 접근을 했고, 존 스노는 환자의 상태를 보고 원인을 살폈다. 결국 의사인 존 스노의 진료 경험과 관찰이 콜레라 지도를 만들게 한 것이다. 같은 데이터라도 다르게 보는 열린 시각이 필요하다.
4) 존 스노(1813년 3월 15일~1858년 6월 16일): 빅토리아 여왕 시대 영국의 의사.
5) 콜레라(cholera): 수인성 전염병, 설사와 탈수 증세를 보임.
인문학 속 데이터, 사람을 향하는 데이터
대기 흐름 지도출처 : https://earth.nullschool.net
요즘 미세먼지가 많다. 기상청은 지역별로 시간대별로 ‘보통, 나쁨, 아주 나쁨’으로 단순 구분하다가 색깔을 통해 시각적으로 보여주고 있다. 이제는 같은 데이터를 지도 위에 시간에 따른 미세먼지의 변화를 같이 보여준다. 먼지의 변화와 심각성을 같이 알게 되었다. 같은 데이터를 표로 보여줄 때보다 시간의 흐름에 따른 상태 변화를 지도와 같이 보여줄 때, 데이터의 가치가 한단계 더 업그레이드된다.
혹시 우리가 보유한 데이터 중에 시간과 주소 항목이 있다면 지도 위에 올려보자. 이제까지 보지 못했던 인사이트를 보여줄 것이다. 우리의 감(感)이 데이터와 만나면 그 감은 과학이 될 수 있다.
데이터는 흔적이다. 데이터를 어떻게 적용할지 고민할 때가 있다. 그럴 때면 주변을 둘러보고 사람을 생각하자. 데이터에 담긴 흔적에 사람을 추가하면 만들어질 정보의 가치는 더욱 빛날 것이다.