데이터가 진짜, 팩트는 가짜인 시대
상태바
데이터가 진짜, 팩트는 가짜인 시대
  • 김인현 대표
  • 승인 2019.06.28 05:11
  • 조회수 825
  • 댓글 0
이 콘텐츠를 공유합니다

남양주 밀실 살인 사건

2010년 11월 17일, 남양주의 신축 아파트. 밤 11시경에 남편은 집으로 돌아왔다. 새벽에 나와서 골프를 친 후 일행들과 저녁을 먹고 귀가한 것이다. 그리고 안방에서 처참하게 살해되어 있는 부인을 발견하였다.

▶ 피해자는 아침 8시 쯤 지인과 20여분간 통화한 기록이 있었다.
아파트 CCTV에는 남편이 새벽에 집을 나가서 밤늦게 들어오는 모습이 기록되어 있었다.
남편의 핸드폰에도 골프장까지 이동하고 돌아온 위치 기록이 남아 있었다.
당일 해당 아파트의 CCTV에는 총 188명이 기록되어 있었다. 경찰은 188명을 전부 조사했지만, 수상한 행적을 보인 사람은 없었다.
아파트 현관에 설치되어 있는 출입장치에는 아무도 기록되어 있지 않았다.

찰은 충분한 데이터를 확보할 수 있었고, 데이터를 분석하면 사건을 쉽게 해결할 것이라고 생각했었다. 데이터가 말해주는 팩트는 다음과 같다.
 

피해자는 8시 30분 이후에 살해되었다.
남편은 그 시간에 현장에 없었다.
아파트에 오간 사람은 188명이다. 그런데 그 중에 용의자는 없다.
아파트 현관으로 들어온 사람은 아무도 없다.

팩트는 살인 사건이 발생한 것인데, 데이터는 아무도 살인하지 않았다고 말하고 있었다. 결국 이 사건은 아직까지도 미해결로 남아 있다. CCTV에 찍힌 사람들만이 현장 아파트 근처에 있었다고 믿어도 될까? 또는 기록된 CCTV 또는 현관 출입 장치의 데이터를 변경할 수는 없었을까? 핸드폰의 위치 데이터는 사람의 위치와 항상 같은 것일까?

확실한 것은 데이터가 말해주는 것은 실제로 일어난 사실과 다르다는 것이다. 그럼에도 데이터를 믿고 내린 판단으로 해당 사건은 미제가 되었다. 데이터는 거짓을 말하지는 않지만 조작된 데이터는 거짓을 가리킬 수도 있다.

 

SK와이번즈 염경엽 감독의 판단

SK 투수였던 다익손은 롯데 전에서 6과 3분의 2이닝 동안 5피안타 3실점으로 시즌 2승을 따냈다. 삼진은 11개를 잡았고 최고 구속은 149km를 기록했다. 염경엽 감독은 다익손이 승리를 기록했음에도 투구 속도 데이터에 주목했다. 최고 구속이 더 나와야 한다고 생각했다. 그리고 미국의 트랙맨 업체의 의뢰해서 지난 2년 간의 구속데이터를 뽑았다. 지난 2년간 다익손 투수의 구속은 염경엽 감독의 기대치에 맞는 것이었다. 과거와 지금의 데이터를 비교해보면 다익손 투수의 구속은 떨어지고 있었다. SK와이번스는 다익손을 방출하기로 결정했다.

그리고 작년에 LG트윈스와 재계약에 실패하고 대만에서 뛰고 있었던 헨리 소사와 재계약을 맺었다. 헨리 소사는 KBO리그 복귀전에서 4이닝 동안 홈런 세 방을 맞으면서 8실점으로 무너졌다. 염경엽 감독은 데이터분석팀에게 소사의 투구 기록 분석 보고서를 요구했다. 랩소도와 트랙맨 시스템으로 분석한 결과 구속, 회전수, 익스텐션, 릴리스 포인트 등은 모두 정상이었다. 사실은 소사가 패전 투수가 된 것이었지만, 데이터는 소사의 투구가 괜찮았다고 말해주고 있었다.

염경엽 감독은 사실이 아니라 데이터를 믿었다. 헨리 소사를 다시 기용했고 NC전에서 6이닝 10탈삼진 무실점으로 호투했다.

다익손의 팩트는 승리였다. 하지만 데이터는 구속 저하를 의미했다.
소사의 팩트는 패배였다. 하지만 데이터는 정상 컨디션이라고 말해주고 있었다.
염경엽 감독은 팩트가 아니라 데이터를 믿고 의사결정했다.
염경엽 감독에게는 데이터가 진짜고 팩트가 가짜였던 것이다.

 

데이터 경제는 이미 와 있다

두 가지 에피소드에는 공통점이 있다. 경찰과 프로야구 감독은 전문가이다. 전문가들은 이제 팩트가 아니라 데이터를 진짜로 믿고 데이터를 기반으로 의사결정한다. 모든 일에서 데이터를 찾고 데이터를 분석하여 결론을 찾아내려고 하는 것은 패턴화되어 있다. 일의 종류에 따라서 사용하는 데이터가 다를 뿐이다.


남양주 사건에서 당일 아파트에 출입한 사람은 188명이 전부였을까? 현관으로 출입한 사람은 과연 없었을까? 데이터가 말해 주는 것을 그대로 믿었기 때문에 다른 의심을 하지 않았고 그것이 어쩌면 사건이 미제에 빠진 원인이 되었을 수도 있다. 데이터가 과연 진실을 말하고 있는가를 판단하기 위해서는 데이터의 생성과 관리를 짚어봐야 한다. 남양주 사건에 남아 있는 하나의 가능성은 데이터를 의심하는 것이다.

경엽 감독이 사용한 데이터는 사실 10개 구단 모두가 활용할 수 있는 것이었다. 어떤 감독은 데이터를 보조 수단으로 활용하고 자신의 감을 더 믿기도 한다. 데이터를 이해하고 데이터를 분석할 수 있는 능력에서 차이가 있을 수도 있다. 확실한 것은 데이터를 기반으로 투수 운영을 하고 있는 SK와이번스가 KBO리그에서 압도적 1위로 순항하고 있다는 점이다. 현실세계에 나타나는 하나 하나의 사건은 우연일지도 모른다. 데이터 기반 의사결정은 바람직한 결과를 얻을 확률을 높여준다.


데이터 경제는 이미 와 있다. 데이터를 확보하고 관리하는 것은 당연한 일상이 되었다. 올바른 데이터를 확보하고 관리하는 것 그리고 데이터를 이해하고 올바른 판단을 내리는 것은 사람의 몫이다. 데이터 활용 능력이 사람과 조직의 성과를 좌우한다.

- 끝 -

 


 

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.