마스터 데이터 관리 어떻게 도입할 것인가?
상태바
마스터 데이터 관리 어떻게 도입할 것인가?
  • 이호재 전무
  • 승인 2019.04.25 01:46
  • 조회수 14915
  • 댓글 0
이 콘텐츠를 공유합니다

데이터 품질은 마스터 데이터가 결정한다

기업의 데이터는 데이터 발생 흐름에 따라 마스터 데이터(Master Data), 거래 데이터(Transaction Data), 운영 데이터(Operational Data), 분석 데이터(Analytical Data) 등으로 구분한다. 마스터 데이터는 ‘기준 정보’로 부르기도 한다. 초기에는 주로 ‘기준 정보’라는 용어를 많이 사용했고, 최근에는 ‘마스터 데이터’라는 용어를 더 많이 사용하는 추세이다.

투이톡_데이터_1.jpg  
[그림 1] 데이터 흐름

▶ 마스터 데이터는 모든 업무에서 동일한 의미와 형태로 사용되어야 하는 데이터이다. 마스터 데이터는 다른 데이터가 생성되거나 활용될 때 참조하는 데이터이다. 즉 다른 데이터의 생성 및 활용의 기준이 된다.

▶ 거래 데이터는 업무의 수행 결과로 생성되는 데이터이다. 거래데이터를 비즈니스 관점으로 분류하여 구축한 데이터를 운영 데이터라고 한다. 운영데이터는 거래를 빠르고 정확하게 처리하는 것이 목적이다.

▶ 분석 데이터는 비즈니스 사건들의 연관성(relevance)을 찾아내기 위한 목적으로 구축되는 데이터이다. 분석 데이터는 운영 데이터를 활용 관점으로 분류하여 구축한다. 분석 데이터를 구축할 때 기준은 마스터 데이터를 따른다.

운영 데이터와 분석 데이터의 품질은 마스터 데이터 상태가 결정한다. 마스터 데이터의 데이터 항목에 중복이 존재하거나, 분류 기준이 명확하지 않는 등의 문제가 있으면 운영 데이터가 제대로 축적되지 못한다. 또한 분석 데이터도 전사 공통 관점으로 데이터를 쌓지 못하기 때문에 활용할 때 문제가 생긴다. 전사 데이터 품질을 잡기 위해서는 마스터 데이터의 품질을 확보하는 것이 우선이다.


데이터 웨어 하우스를 구축하여 데이터를 축적했지만 실제 분석 활용은 미흡한 사례를 흔히 볼 수 있다. 원인은 마스터 데이터를 정의하지 않은 상태에서 분석 데이터를 구축했기 때문이다. 기업의 비즈니스 관점에서 데이터 정의와 형식, 그리고 분석 관점 등을 일관된 체계로 갖추지 않고, 데이터를 구축한 결과이다. 데이터를 분석하는 사람마다 자기의 관점으로 데이터를 바라보고 분석한다면 그 결과는 전사적으로 공유하고 활용하기 어렵다.

데이터 품질 확보는 마스터 데이터 품질 확보로 시작되어야 한다. 마스터 데이터를 구축하지 않은 상태에서 데이터 품질관리는 사후 조치이다. 데이터 베이스에 축적된 데이터 품질을 검사하고 확인하여 오류를 발견하여 조치하는 활동이 중심인 것이다. 데이터가 기록되기 전에 데이터 품질을 확보하는 것이 바람직하다. 마스터 데이터는 데이터 사전 품질관리 기반을 제공한다.

 

마스터 데이터는 어떤 데이터인가?

 

투이톡_데이터_2.jpg
[그림 2] 마스터 데이터의 기준정보 대상, 분류, 선정 항목

마스터 데이터는 여러 부서가 사용하는 데이터이다. 또한 마스터 데이터는 비즈니스 가치 창출에 직접 기여한다. 마스터 데이터는 장기적으로 일관성을 유지해야 하는 데이터이다. 일반적으로 가공하여 생성되는 파생 데이터는 마스터 데이터가 아닌 경우가 많다. 마스터 데이터는 반드시 내부에서 생성되어야만 하는 것은 아니다. 외부에서 획득한 데이터라도, 비즈니스의 축이 될 수 있으면, 마스터 데이터에 포함된다.

마스터 데이터를 찾아내기 위해서는 비즈니스 모델과 비즈니스 프로세스 등에 대한 이해가 중요하다. 마스터 데이터는 세가지로 분류한다.

▶  마스터 기준정보는 전사 업무에 동일한 기준으로 사용되는 고객, 상품, 채널, 조직, CoA 등 중요 업무의 핵심 데이터이다.

▶ 컨트롤 기준정보는 데이터의 입력/집계/분석 시 편의를 위해 설계된 코드이다.

▶ 운영 기준정보는 업무프로세스 실행 결과 또는 산출식에 의해 생성 변경, 폐기되는 데이터로서 다른 프로세스 실행 시 참조되거나 입력 값으로 활용되는 데이터이다. 각종 요율정보가 포함된다.

 

마스터 데이터는 어떻게 관리할 것인가?

마스터 데이터 관리체계는 거버넌스, 운영 표준 및 IT인프라로 구성된다.
 

투이톡_데이터_3.jpg
[그림 3] 마스터 데이터 관리체계 프레임워크

1) 마스터 데이터 거버넌스

거버넌스는 마스터 데이터의 품질 및 일관성을 유지하고, 업무 변화에 신속하게 대응하기 위한 제반 관리규정을 정의한다. 기존 IT조직 중심의 사후적 거버넌스체계와 새로운 사전적 거버넌스 체계의 큰 차이는 첫째, 전사 차원의 거버넌스 활동을 수행하고, 둘째, 사전에 마스터 데이터 속성별로 관리 조직을 정의하고 R&R을 부여하며, 셋째, IT인프라를 활용하여 데이터 생성 시점부터 모니터링을 수행한다는 점이다.

- 원칙 및 정책: 마스터 데이터 운영 및 관리에 통일된 방향성을 유지하고, 일관된 의사결정을 위한 전사 공통 규정이다.

- 프로세스: 데이터 라이프 사이클 관리, 표준 체계관리, 품질관리, 데이터 흐름관리 및 메타데이터 관리 프로세스 등을 정의한다.

- 조직체계: 마스터 데이터 관리조직 및 역할을 정의하고 마스터 데이터 생성, 변경 및 폐기 등 운영 및 관리주체를 정의한다.

- 변화관리: 마스터 데이터 관리체계 정착을 위한 교육 및 협의체 구성 등을 정의한다.

투이톡_데이터_4.jpg
[그림 4] 데이터 거버넌스 프레임워크 및 구성 정의

2) 마스터 데이터 운영표준

운영표준은 데이터 표준 및 이에 기반한 데이터 구조와 값을 정의하고 데이터 통합을 위한 데이터흐름과 매핑을 설계하고 데이터 품질을 관리한다.

- 표준체계는 분류체계, 속성체계, 식별체계 및 표기표준으로 구성한다.

- 분류체계: MECE(Mutually Exclusive Collectively Exhaustive, 상호배제와 전체 포괄 원칙)에 의해 전사 차원의 일관된 기준에 의한 정보의 계층화와 구조화를 통한 분류체계를 수립한다.

- 속성체계: 마스터 데이터의 속성 중, 기업에서 관리하고자 하는 단위 정보 항목 및 정보 항목의 관리체계를 말하는 것으로 속성의 대상은 앞에 설명한 마스터 데이터 선정 기준에 따른다.

- 식별체계: 물리적 실체와 데이터를 일치시키고, 유일성 식별을 위해 고유한 코드 또는 번호를 부여하는 것으로 식별체계는 원칙, 채번 규칙, 코드체계를 정의한다.

- 표기표준: 데이터 항목과 데이터 값에 대한 표준으로, 동일한 정보 항목이 상이하게 이해하지 않도록 하고, 텍스트 형태의 데이터 값은 동일하게 식별하여 검색이 용이하도록 하기 위해 정의한다.

- 품질체계: 데이터 품질수준을 정량화하여 품질지표 정의, 데이터 품질, 적기 생성 여부 등을 관리하기 위한 운영지표를 선정한다.

- 데이터 통합: 속성별 마스터 데이터를 기준으로 관련 시스템 연계 정의, 인바운드, 아웃바운드 데이터 흐름을 정의하고 관리한다.

- 생애주기 프로세스: 거버넌스 영역이나 실제 마스터 데이터 별로 정의가 필요하므로 생성, 변경 및 폐기에 대한 업무절차와 기준은 운영표준에서 정의하는 것이 합리적이다.
 

투이톡_데이터_5.jpg
[그림 5] 마스터 데이터 운영 표준

3) 마스터 데이터 관리 시스템

IT인프라는 운영표준, 전사 거버넌스 체계를 통합관리 하기 위해 다양한 IT기술 요소를 포함한다.

지금까지 IT조직은 일부 품질 도구를 활용하여 사후적 품질관리 활동을 하였다. 그러나 이러한 방식은 완벽한 품질을 확보하는데 한계가 있다. 데이터 획득, 가공 및 활용하는 단계별로 실시간 모니터링을 할 수 있는 체계화된 마스터 데이터 관리체계 시스템(MDMS)이 필요하다.

전사 마스터 데이터 관리체계의 통합관리 및 명문화된 전사 거버넌스체계를 시스템화하여 데이터 품질의 상시 모니터링 체계를 확보하기 위해서는 선정된 마스터 데이터의 표준체계를 적용하여 마스터 데이터를 적재하기 위한 리포지터리(Repository)의 데이터 모델을 설계하고, 마스터 데이터의 운영체계관리 기능을 도출하여 마스터데이터 관리 시스템 구축에 반영해야 한다.
 

투이톡_데이터_6.jpg
[그림 6] 마스터 데이터 관리 시스템(MDMS)

 

마스터 데이터 관리 어떻게 도입할 것인가?

핵심 데이터 대상인 마스터 데이터를 선정하고 품질을 확보할 수 있도록 운영표준을 정의한다. 그리고 전사 데이터 거버넌스 체계를 통해 사전에 조직별로 R&R을 부여하고 마스터 데이터 관리체계 시스템(MDMS)을 활용하여 실시간 모니터링을 지원 한다.


마스터 데이터 관리 도입은 단순히 솔루션 도입으로 끝나는 일은 아니다. 데이터 정의와 형식을 표준화해야 한다. 데이터 생성과 유지 및 활용의 권한과 책임을 명확하게 정의해야 한다. 이러한 과정에서 부서간의 R&R 조정, 기존 프로세스의 변화 등이 수반되어야 한다.


 

- 끝 - 

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.