4차 산업혁명, 데이터 품질 확보 없이는 진전 어렵다 - 실시간 데이터의 오류 감지와 대응 방안
상태바
4차 산업혁명, 데이터 품질 확보 없이는 진전 어렵다 - 실시간 데이터의 오류 감지와 대응 방안
  • 이진우 부사장
  • 승인 2018.11.02 04:43
  • 조회수 1714
  • 댓글 0
이 콘텐츠를 공유합니다

4차 산업혁명에 적용되는 기술은 인간보다 뛰어난 성능을 보이기도 하지만 아직은 부족한 부분이 존재한다. 자율주행자동차의 경우에도 운전석에 사람이 앉기를 요구하는 것은 자동화된 기술력이 아직은 완벽하지 않기 때문이다. 그 중 한 축을 이루는 것이 데이터의 품질 확보 어려움이다.

데이터의 진정성, 어떻게 파악하나

데이터 품질의 문제는 축적된 데이터뿐만 아니라 실시간 데이터에서도 나타난다. 아파트에 살다 보면 한밤중에 느닷없이 화재경보가 울리는 경우가 있다. 대다수의 경우 실제적인 화재라기보다는 경보장치의 과도한 반응이 원인이다.

이러한 일이 반복되면 실제 화재가 발생하여 경보가 울렸는데도 아무도 대피하지 않는 늑대소년 같은 경우가 발생한다. 공장, 사무실, 가정 등에 AI 기능이 첨가된 자동화 시설이 증가할수록 이러한 상황은 더 많이 발생하게 된다. 실제로 발생하지 않은 상황을 잘못 인지하여 과도한 대응이 이루어지는 것이다.

이를 피하기 위해서는 입력되는 실시간 데이터의 진정성을 판단할 수 있는 품질 점검 기능이 필요하다. 물리적 환경에서 작동하고 있는 IoT 단말로부터 수집되는 데이터는 다양한 오류의 위험에 노출되어 있다. 물리적 오작동, 간섭, 작동 환경의 변화 등이 주요한 데이터 오류의 원인이다.

물리적 오작동은 IoT 단말 자체에 결함이 있는 경우, 외부 자극에 의한 훼손, 노후화 등을 통해 발생한다. 중요한 것은 그 원인이 무엇이든 오작동에 의해 발생한 데이터를 인지하고 보정하거나 제거해야 한다는 것이다. 이를 위해서는 실시간 모니터링이 필요하다.

간섭은 주로 통신의 문제이다. IoT 단말에서 발생하는 데이터를 수집되는 과정에서 물리적, 전기적 자극에 의해 변형이 이루어지기 때문이다. 특히 무선으로 데이터를 전송하는 경우 간섭의 위험성이 높다. 공장자동화에서 무선이 제한적으로 활용되는 것은 공장 내부뿐 아니라 외부로부터 다양한 간섭의 가능성이 존재하기 때문이다.

무선통신기기가 많아질수록 서로 간의 간섭 위험성은 높아진다. 비행기 운행 중에 전자장비의 사용을 통제하는 것도 통신 간섭으로 인해 비행기가 오작동하는 위험을 방지하기 위해서다.

작동 환경의 변화는 물리적으로 열악한 환경으로 인한 영향도 있지만, 함께 작동하던 주변 장비의 교체 혹은 소프트웨어의 교체 등으로 인해 이전과는 다른 작동 환경이 만들어지기도 한다. 이런 경우 예전에는 발견하지 못한 오류가 발생한다. 환경 변화로 인하여 그전에는 경험하지 못했던 방식으로의 작동이 이루어지기 때문이다.

실시간 데이터의 오류 발생을 방지하기 위한 선행적인 조치는 이중화를 통해 이루어질 수 있다. IoT 단말 한 개에 의지하는 것이 아니라 여러 개를 통해 수집된 데이터를 상호 비교함으로써 데이터 오류를 최소화할 수 있다.

하지만 통신 간섭 등은 여러 IoT 단말에 동시적으로 영향을 미칠 수 있다. 이를 사전에 모두 감지할 수 없다면 사후적인 대응 체계를 확보해야 한다. 경험에 의한 학습이 이루어져야 한다는 의미이다.


통계, 이상패턴 파악 등을 통한 데이터 오류 대응 방안

우선적으로 적용할 수 있는 수단은 통계적인 방법이다. 정상적인 상황에서 발생하는 데이터를 통계적으로 처리하여 유효 범위 혹은 한계치를 도출하고 이를 벗어나는 경우에 대응하는 것이다.

정상적 데이터에서 벗어나는 이상징후를 다양한 측면에서 설정하여 점검할수록 데이터 오류를 발견할 가능성이 높아진다. 주기적으로 발생해야 할 데이터가 불규칙하게 수집된다거나, 동시에 발생해야 할 데이터 중 일부가 누락된다거나 하는 경우 등이 이에 속한다.

데이터가 그전과는 다른 이상한 패턴을 보일 경우 잠재적 오류로 보고 점검하는 접근도 필요하다. 카드 승인의 경우 평상시 사용하던 지역을 벗어나거나 평균적인 사용금액을 상회하는 경우 도난 카드로 추정하는 것과 마찬가지로, IoT 단말에서 들어오는 데이터가 정상적인 범위에 있다고 하더라도 패턴이 급격하게 달라졌다면 무엇인가 문제가 있다고 추정해야 한다는 것이다.

IoT 단말과 IoT 단말 혹은 데이터와 데이터는 서로 연관되어 있다. 앞에 있는 IoT 단말에서 변화가 발생하면 그 영향으로 관련된 다른 IoT 단말에서도 비슷한 성향의 데이터가 수집되어야 한다.

만일 구름이 증가한다면 기온은 하락할 것이다. 구름을 감지하는 IoT 단말에서 데이터 값이 증가되었다면 온도를 감지하는 IoT 단말의 데이터 값은 하락해야 한다. 이러한 상관관계가 정상적으로 나타나지 않는다면 이 또한 오류의 가능성이 높은 것이다.

여러 IoT 단말 혹은 여러 데이터 간의 상관관계를 상세하게 파악하고 있을수록 데이터 오류를 감지할 수 있는 가능성은 향상된다. 그리고 이를 위해서는 데이터와 상황을 연계시키는 학습을 통한 지속적인 감지 능력 향상이 필요하다.

실시간 데이터의 오류와 대응에 대한 경험이 축적되면 어떤 원인으로 인하여 어떤 종류의 이상징후가 발생하는지도 분석할 수 있다. 이를 통해 데이터 오류의 형태에 따라 적절한 대응방법을 모색할 수 있다.

정상 데이터, 비정상 데이터, 오류 원인 등에 대한 분석이 섬세하게 이루어질수록 오류 데이터를 감지하고 대응하는 체계가 효과적으로 정립될 수 있다.

- 끝 -

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.