4차 산업혁명, 데이터 품질 확보 없이는 진전 어렵다 - 데이터 품질과 4차산업의 미래
상태바
4차 산업혁명, 데이터 품질 확보 없이는 진전 어렵다 - 데이터 품질과 4차산업의 미래
  • 이진우 부사장
  • 승인 2018.11.20 04:36
  • 조회수 2287
  • 댓글 0
이 콘텐츠를 공유합니다

 

4차산업이 다양한 방면에서 힘을 발휘하기 위해서는 이를 뒷받침해주는 풍부한 데이터의 확보가 중요하다. 하지만 방대한 데이터도 품질이 보장되지 않는다면 무용지물이다. 그러므로 데이터 품질을 4차산업의 핵심적인 요소로 생각하고 이를 향상시키려는 활동이 일상적으로 이루어져야 한다.

4차 산업혁명으로 인해 데이터 활용이 많아질수록 품질에 대한 요구는 증가한다. 특히 생성보다는 활용 시점에 맞춘 데이터 품질 관리가 필요하다. 생성 당시에 정확하고 효율적인 방법으로 데이터를 축적하는 것도 중요하지만 이러한 데이터가 활용에 적합한 형태로 관리되고 있는지를 다각적인 각도에서 검토하고 최적화하는 데이터 품질 향상 프로세스를 일상적으로 정착하는 것이 중요하다.


데이터 품질 향상을 위한 국내외 다양한 움직임들

4차 산업혁명은 다양한 정보의 융복합이 필요하다. 자체적으로 보유한 데이터로는 부족하여 외부로부터 많은 데이터를 수집하여야 한다. 이를 위해 정부에서는 공공기관이 보유한 데이터를 일반에게 제공함으로써 산업에 활기를 불어넣으려고 시도하고 있다.

누구나 제약없이 자유롭게 사용할 수 있는 데이터를 오픈데이터라고 한다. 오픈데이터의 확대는 미국이나 유럽에서도 중요한 정책과제로 인식되고 있다. 미국에서는 오픈데이터에서 필요한 데이터를 찾아주고 사용에 편리하도록 가공해주는 기업이 늘어나고 있다. 영국에서는 오픈데이터의 상태를 측정하기 위해 OBI(Open Data Baremeta Index)를 제시하고 있다. 한국은 OBI에서 비교적 높은 점수를 받고 있지만 실제로 활용될 수 있는 오픈데이터는 아직 많이 부족하다.

정부의 무상 데이터 공급도 중요하지만 일정한 대가를 받고 데이터를 거래하는 데이터거래소가 활성화 된다면 데이터 활용이 더욱 가속화될 것이다. 데이터거래소는 데이터 품질 확보에도 긍정적인 효과를 발휘하게 된다. 불량한 데이터는 자연스럽게 거래에서 배제되기 때문에 데이터 품질 확보에 더 많은 노력을 기울일 수 밖에 없다. 물론 처음부터 모든 데이터의 품질이 확보되지는 않겠지만 데이터 유통과정에서 잘못된 데이터들은 자연스럽게 걸러지게 된다.

데이터거래소는 원하는 데이터를 사고 파는 시장이 형성된다는 점에서 환영 받을 일이지만, 데이터 표준의 측면에서도 중요한 역할을 수행한다. 여러 데이터를 서로 융복합 하려면 표준의 준수가 필수적이다.

중요한 데이터는 국내뿐 아니라 국제적인 표준에 따라 생성되고 유통되어야 가치를 발휘할 수 있다. 데이터 거래가 활성화될수록 데이터 표준에 대한 요건도 더욱 강화될 것이다.

이미 국제표준기구인 ISO에서도 데이터 품질이나 데이터 표준에 대한 논의가 이루어지고 있다. 특히 데이터에서 중요한 위치를 차지하는 객체(사람, 기관, 상품) 즉, 마스터데이터에 대하여 국제적으로 유일하게 식별할 수 있는 체계를 만들려는 시도가 이루어지고 있다(ISO8000:100 Series). 또한 데이터 품질관리를 위해서 갖추어야 할 최소한의 기능을 정의하여 제시하고 있다(ISO8000:60 Series).


4차 산업혁명 흐름의 핵심, 데이터 품질

데이터 품질 확보는 많은 시간과 노력이 필요한 작업이다. 방대한 데이터의 품질을 관리하려면 사람의 힘으로는 부족하다. 이미 데이터 품질 관리에 다양한 도구들이 도입되어 적용되고 있다.

하지만 이러한 도구들은 인간이 제시한 기준에 의하여 단순한 점검을 반복적으로 수행할 뿐이다. 반면 AI를 통해 품질을 확보하려는 접근도 이루어지고 있다. 4차산업의 문제를 4차산업의 기술을 통해 해결해보려는 시도이다. 인간이 인지할 수 없는 데이터 오류를 통계 분석 등의 알고리즘을 통해 발견하려는 것이다. AI는 인간의 한계를 넘는 대량의 데이터를 다양한 방법을 통해 검증해볼 수 있기 때문이다.

아직까지 자율주행 자동차의 운전석에는 사람이 앉아 있어야 한다. 예기치 못한 사태에 대응하기 위해서다. 이러한 감시 기능을 AI가 대신할 수 있다면 인간은 일에서 해방될 수 있다. AI가 AI를 감시하도록 하고 인간은 지루하고 집중력이 필요한 작업에서 해방되어 보다 창의적인 작업에 매진할 수 있다. AI에 의한 AI를 위한 AI의 데이터 품질이 이루어진다면 인간은 데이터 품질의 문제에서 어느 정도 자유로워질 수 있다. 하지만 AI를 전적으로 신뢰할 수 있는 시대가 도래하려면 아직 시간이 필요할 것으로 보인다.

4차산업에 활용되는 데이터는 품질이 완벽한 상태가 아니다. 어딘가에는 오류가 존재한다고 가정하는 것이 옳은 접근이다. 이를 찾아내고 제거하려는 노력이 없다면 언젠가는 커다란 사고로 이어진다. 그리고 이는 4차산업 전체를 흔드는 위협으로 다가올 것이다.

문제는 데이터 수집은 일순간에 이루어질 수 있지만 데이터 품질 확보에는 많은 시간과 노력이 필요하다는 것이다. 데이터 품질에 대하여 일찍부터 준비하는 기업은 4차 산업혁명의 흐름을 탈 수 있지만, 준비가 소홀한 기업은 오류 데이터로 인해 기회를 상실하게 될 것이다.

현대의 급속한 시장 흐름 속에서 한번 기회를 놓치며 이를 만회하는 것은 거의 불가능하다. 스마트폰으로 시장의 흐름을 바꾼 애플과 삼성전자와 달리 준비가 부족했던 노키아나 모토로라는 더 이상 시장에서 만나볼 수 없다.


기업, 데이터 품질 소홀히 하면 4차 산업혁명에서 영원히 뒤쳐질 것

데이터가 중요한 자산으로 인식되고, 데이터 거래가 활성화되고, 데이터 제공 기업이 확대될수록 4차산업은 힘을 받게 된다. 바꾸어 말하면 4차 산업혁명이 진행될수록 데이터 관련 분야는 활성화될 것이다. 그리고 그 중에서 데이터 품질 확보가 중요한 자리를 차지하게 된다.

데이터 품질을 준비하는 기업은 4차 산업혁명에 주도적인 역할을 수행하게 되겠지만, 데이터 품질을 소홀하게 생각하는 기업은 4차 산업혁명에서 영원히 뒤처지는 결과를 초래할 것이다. 4차 산업혁명은 누구에게는 기회이고 누구에게는 위협이다. 변화에 올라타기 위해서는 많은 준비가 필요하다. 하지만 데이터 품질이 확보되지 않는 기업은 기회를 놓치게 된다는 점을 명심해야 한다.

- 끝 -

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.