DATA와 DATE

정말로 그래서 그런 거예요?

데이터의 양이 급속도로 증가하고 있습니다. 이럴수록 ‘생각 엔진’이 좋은 사람이 빛을 봅니다. 생각이 데이터에 끌려가는 게 아니라 생각이 데이터를 끌고 가야 합니다.

글 _ 강양석 (책 《데이터로 말하라》의 저자)


비판적 사고력이란
“이 표 좀 봐봐, 자네 보고서의 주장과는 전혀 다른 결과를 보이고 있는데?”
데이터를 근거로 삼아 여러분의 생각을 바꾸려는 사람이 있을 겁니다. 이때, 어떻게 하나요? 앞선 대화에서 나의 보고서가 맞다면, 상대방이 표 데이터를 잘못 분석한 거겠죠. 이땐 여러분이 직접 나서서 그 데이터를 해석해주고 보고서가 옳다는 결과를 도출할 수 있어야 합니다. 때로는 여러분이 데이터를 들이밀며 상대방의 생각을 바꿔야 하는 경우도 있을 겁니다. 상대방이 근거로 삼은 데이터를 분석해보고 잘못된 결과를 바로 잡아 줄 수 있어야 하죠. 결과적으로 두 경우 모두 데이터에 대한 비판적 사고력(Critical Thinking)을 갖추는 게 중요합니다.
일반적으로 ‘비판적 사고력’이라 함은 상황, 목적, 의사결정 사이의 관계가 합리적인지 간파하는 능력을 말합니다. 비판적 사고력은 특히 데이터를 해석할 때 매우 중요한 역할을 하는데요. 원인과 결과가 서로 명확한 인과관계를 갖고 있는지 파악해야하기 때문입니다.






데이터와 비판적 사고력
데이터의 관점에서 ‘비판적 사고력’을 갖춘다는 게 어떤 의미인지 알아볼까요? 위의 두 가지 데이터를 살펴봅시다. 여러분의 직장 동료가 위 데이터를 기반으로 ‘가난할수록 출산율이 떨어진다’라는 결론을 내렸습니다. 여러분은 이 결론에 동의하나요?
좌측에 제시된 ‘소득 구간별 분만 인원 변화’ 그래프만을 보면, 앞선 주장은 틀린 게 없어 보입니다. 한데 우린 두 가지의 그래프를 모두 보고 있습니다. 두 그래프 간의 묘한 상관관계를 해석한다면, ‘출산율이 떨어진다’란 결과에 대해 ‘가난’이 아닌 다른 원인을 도출할 수 있습니다.
먼저, 우측 그래프를 통해 ‘산모의 연령이 갈수록 높아진다’는 사실에 주목해야 합니다. 특수한 경우를 제외하면 일반적으로 나이가 많을수록 연차가 쌓이고, 소득 수준도 높아집니다. 경제적 여유가 생깁니다. 20대 중반의 사회 초년생보다 30대 중반의 경력자들이 조금 더 경제적으로 여유로운 것처럼요. 즉, 좌측 그래프상에서 소득 하위의 출산율이 낮은 건, 부부의 연령대가 어려서 일수도 있습니다. 돈이 없어서가 아니라 아직 아이를 낳을 시기가 되지 않았기 때문인 겁니다. 저소득이란 원인이 무조건 저출산이란 결과로 연결되는 게 아니라, 그 사이에 ‘연령’이란 또 다른 원인이 포함되어 있는 걸 확인할 수 있어야 합니다.
예전처럼 결혼하면 무조건 아이를 빨리 낳는 풍토가 아니라, 부부간에 충분히 신혼생활을 즐기는 흐름이 반영됐을 수도 있습니다. 일찍부터 아이를 낳아서 여러 명을 키우는 게 아니라, 여유를 갖고 한 명만 낳아서 잘 키우자는 사회적 변화가 반영됐을 수도 있고요. 다양한 이유로 출산 연령 자체가 높아졌고, 연령이 높아지니 출산할 때쯤 경제적 여유가 생겼다고 해석할 수도 있습니다. 이 경우 위 데이터를 통해 소득 수준에 따른 출산율의 변화에 주목할 게 아니라, 출산 연령이 왜 높아졌는지에 대한 분석이 우선시되어야 하죠. 비판적 사고력을 통해 똑같은 데이터를 보고도 결과에 대한 원인을 새롭게 찾아낸 것입니다.

 
 

데이터 사용의 첫걸음
서두에서 설명했듯이 비판적 사고력이 중요한 이유는 데이터의 양이 날로 증가하기 때문입니다. 각 데이터들이 말하는 인과관계를 명확하게 해석하고 분석하지 못한다면, 데이터로 의사 결정을 하는 건 위험한 발상일 수 있습니다. 괜히 건드렸다가 내 생각이 잘못됐음을 증명하는 꼴이 될 수도 있으니까요. 잊지 마십시오. 데이터에 대한 비판적 사고력은 올바르게 데이터를 사용하는 첫걸음입니다.

2020-09-01

WORK > JUMP UP 카테고리의 다른 글 보기

    최상단으로 가기