데이터거버넌스 변화와 대응 전략 2편 - 데이터거버넌스 구축 고려사항

데이터거버넌스의 확장

데이터거버넌스 정의는 “회사 자산으로서 데이터를 적절하게 처리할 수 있도록 의사결정 권리와 의무를 할당하는 전사적 프레임워크”, “데이터 자산 관리에 대한 권한, 통제 및 공유 의사결정(계획, 모니터링 및 집행)의 행사” 등 여러 가지로 기술되고 있다.

데이터거버넌스는 전사적으로 보유하고 있는 데이터에 대한 관리 정책, 지침, 표준, 전략 및 방향을 수립하고, 데이터를 체계적으로 관리하여 비즈니스 전략 목표 달성에 효과적으로 활용할 수 있도록 조직 및 서비스를 정의하는 관리체계를 의미한다고 할 수 있다.

데이터거버넌스는 다음 관점에서 중요하다.

▶ 데이터 품질을 확보할 수 없고, 의사결정에 데이터를 활용할 수 없다. 데이터 분석으로 인한 고객 맞춤 서비스, 실시간 오퍼링 등의 업무를 수행할 수 없다.

▶ 데이터 정의와 원천, 흐름 등의 기준의 일관성을 확보할 수 없다. 따라서 전사 차원에서 데이터 공유가 불가능하게 된다.

▶ 데이터의 안전한 관리 상태를 유지할 수 없다. 이로 인해 고객의 신뢰를 잃어서 고객 이탈이 발생할 수 있다.

▶ 법적으로 요구하고 있는 데이터 컴플라이언스를 준수할 수 없다. 이는 페널티 발생 또는 업무 강제 중단 등으로 이어질 수 있다.

▶ 보유하고 있는 데이터를 외부에 판매하거나 교류하는 비즈니스를 전개할 수 없다. 자체적으로 데이터의 기준과 품질, 보안 등급 등을 관리하고 있지 않기 때문이다.

데이터거버넌스는 디지털화 진전에 따라 범위가 확장되고 있다.

▶ 데이터의 확장

조직 내부에서 발생한 데이터로부터 조직 외부에서 발생한 데이터로 확장되고 있다. 오픈데이터, 소셜데이터 또는 협력 파트너의 데이터까지 융합되고 있다.

구조적 데이터에서 비구조적 데이터로 확장되고 있다. 거래처리 결과로서 생성된 데이터에서 센서 데이터, 로그 데이터, 모바일 데이터, 이미지 데이터, 음성 데이터 까지도 관리되어야 한다.

▶ 기능의 확장

조직의 데이터 관리 업무는 데이터 표준 및 모델관리, 데이터베이스 구축관리, 데이터 품질관리, 카탈로그 관리(또는 메타 데이터 관리), 마스터 데이터 관리, 프라이버시 관리, 데이터 생명관리 등 다양한 세부 업무들로 구성되며, 이들 기능은 더욱 확장되고 있다.

▶ 역할의 확장

전통적으로 데이터는 IT부서가 관리하여 왔다. 하지만 IT부서는 생성된 데이터를 효율적으로 그리고 안전하게 보관하는 역할만 수행할 수 있다. 전사적으로 데이터 공유를 위해서는 실제로 데이터를 발생시키고, 사용하는 비즈니스 부서가 중요한 역할을 해야 한다. 데이터 관련자는 IT부서에서 비즈니스 부서로 확장되고 있다. 구체적으로는 DA 또는 DBA가 주된 역할을 했지만, 지금은 데이터 오너, 데이터 스튜어드, 데이터 사용자 등의 역할과 책임 등도 정의하고 관리해야 한다.

▶ 용도의 확장

데이터는 주로 거래처리의 결과를 보관하는 기능과 거래에 따른 실적을 분석하는 용도로 사용되어 왔다. 지금의 데이터는 상황을 빠르게 인지하고, 분석하여 적합한 의사결정을 내리는 용도로 확장되고 있다. 용도의 확장에 따라 데이터프랩(Data Preparation)이 중요하게 되었고, 다양한 분석 및 시각화 소프트웨어 도입이 필요하게 되었다. 또한 실시간으로 데이터를 수집하고 이상 상황을 감지하는 모니터링 기능도 갖추어야 한다.

▶ 가치의 확장

데이터는 현재 비즈니스를 위한 수단에서 새로운 비즈니스를 창출하는 자산으로서 사용되기 시작했다. 기존 비즈니스의 결과로서 생성된 데이터로 인해 새로운 비즈니스 모델을 도입할 수 있게 된 것이다.

고려사항 1: 비즈니스 사용자가 거버넌스의 중심이 되어야 한다

데이터 분석 환경은 IT전문가 주도 환경에서 데이터를 필요로 하는 사용자들이 쉽고 빠르게 분석할 수 있는 셀프서비스 분석으로 변화 하고 있으며 비즈 사용자들이 데이터에 접근해야 하고, 똑같은 데이터에서 다양한 분석결과를 만들어내고 보관할 필요가 증대하고 있다.

더 많은 사용자들에게 데이터를 개방해야 하므로 보안과 권한 정책이 다양해지고 수많은 분석 데이터 세트에 대한 생명 주기 및 자원 관리의 필요성이 증가하고 있다.

새로운 데이터 분석의 흐름에 따라 데이터거버넌스는 ‘셀프서비스 데이터 분석을 위한 데이터 제공 및 관리’ 분야의 확장이 필요하고, 이를 통해 사용자의 데이터 활용이 활발해진다면 비즈니스 조직의 데이터 오너십이 강화되는 효과도 기대할 수 있을 것이다.

• 셀프서비스 분석을 위해 사용자가 원하는 데이터를 쉽게 탐색하여 적합한 권한에 의해 준비된 데이터를 독립되고 안전한 상태에서 다양한 분석을 시도해 볼 수 있도록 샌드박스(Sandbox)와 같은 분석 환경이 제공될 필요가 있음

• 이러한 환경에서 분석된 데이터 중 활발하게 활용되고 비즈니스 측면에서 유용한 정보는 정식 운영 환경에 제공되어 공유되기도 함

• 이 과정에서 데이터 탐색을 원활히 하기 위한 비즈니스 사용자 관점의 메타데이터 관리, 샌드박스에서 테스트 된 분석결과를 공유하기 위해 운영 환경으로 옮기기 위한 검토 프로세스와 조직의 역할과 같은 새로운 데이터거버넌스 절차와 기능이 요구됨

고려사항 2: 전사 통합 데이터거버넌스로 추진되어야 한다

효과적인 데이터거버넌스 구현을 위해서는 데이터가 정의되고 생성되는 순간부터 목적을 다해 폐기될 때까지 연속성을 가지고 관리되어야 하며, 통합 플랫폼을 기반으로 단위 거버넌스 프로세스들은 서로 연계되어야 한다.

현재 대부분 조직에서 데이터거버넌스의 구현을 위해 다양한 관리 시스템을 활용하고 있는데 시스템 간 프로세스 연계가 미흡하거나 일부 영역이 통합되지 않아 단위 거버넌스 프로세스로 운영되는 수준이다.

향후는 통합 플랫폼을 기반으로 단위 데이터거버넌스 프로세스를 연계하고, 빅데이터 환경에 적합한 다양한 데이터 소스의 수집을 자동화하는 방향으로 데이터거버넌스 시스템이 진화하고 있다.

• 데이터 카탈로그는 기존의 메타데이터 관리를 확장하여 비즈니스 사용자가 이해하고 활용할 수 있는 메타데이터와 IT 메타데이터를 연계하여 Search & Discovery 기능을 강화함

• 다양한 데이터 소스의 메타데이터를 자동으로 수집하고 관리하는 기능이 포함되어 효율적이면서도 오류를 최소화하는 방향으로 발전

• 기존 데이터 관리는 각각의 프로세스와 시스템으로 실행되어 개별적으로 관리되었으나, 최근에는 서로 연결하여 사용자가 의미 있는 비즈니스 목적을 쉽게 달성할 수 있도록 통합된 프로세스와 기능을 지원

• 동일한 플랫폼상에서 기능을 유기적으로 연결하여 사용자가 쉽게 관리할 수 있도록 제공

• 새로운 데이터의 식별, 연관 관계의 인지, 활용 유형 등을 수집하고 분석하는데 AI나 머신러닝이 핵심 역할을 할 것임

각각의 관리 기능은 서로 연계될 때 더욱더 효과적이며, 데이터 품질관리를 통해 오류가 예상되는 데이터 항목을 식별한 다음, 메타데이터를 통해 해당 정보를 확인하고 오류 여부를 판단할 수 있고, 오류 데이터가 발견된 경우 데이터 리니지를 확인하여 해당 데이터가 생성된 지점이나 다른 데이터와의 연관 관계, 사용 프로그램 및 수정 현황 등을 추적할 수 있을 것이다.

고려사항 3: 시각화가 적용되어야 한다

데이터 현황을 직관적으로 인지할 수 있도록 시각화 기능이 강화된 ‘보이는 데이터거버넌스’ 구현, 사용자를 지원하는 포털, 검색 기능의 강화 등 기업이 어떤 데이터를 보유하고 있는지, 어느 스토리지에 어떤 형식으로 저장하고 있는지, 누가 생성했으며 어디에서 활용되고 있는지 등을 한눈에 확인할 수 있는 시각화된 정보의 제공은 데이터거버넌스의 정착을 돕는 중요한 요소가 될 것이다.

성공적인 데이터거버넌스 구축 요소

기업이 데이터를 관리하는 환경은 전통적인 RDB 뿐만 아니라 하둡, NoSQL을 모두 사용하고 있으며 인프라 환경도 온프레미스와 클라우드를 혼용하는 경우가 증가하고 있다.

데이터베이스관리자는 유지 관리 업무와 함께 정보의 유형, 중요성, 규제 대상 여부, 가용성 수준, 관리 비용 등을 고려하여 기업의 데이터 환경을 전체적으로 최적화하기 위한 역량을 갖추어야 한다. 데이터베이스관리자가 기존의 DB 관리, 패치, 업그레이드, 튜닝 등 반복적인 작업이 아닌 아키텍처 설계, 데이터 전략 설계, App 개발이나 데이터 분석 지원과 같은 활동을 수행할 수 있는 환경이 준비되어야 한다.

성공적인 데이터거버넌스 구축을 위하여 비즈니스 니즈와 목적, 규제, 기술 발전 이니셔티브를 충족하는 비즈니스 초점의 프레임워크, 복잡/다양한 환경을 지원하는 기술, 체계적인 변화 프로그램과 주요 의사결정 프로세스 수립 등을 종합적으로 고려되어야 한다.

• 프레임워크: 조직의 데이터 원칙과 기준, 조직, 역할의 책임과 권한, 관리 프로세스, 적용 소프트웨어 환경, 기준데이터 정의 등의 관리 및 통제 방안

• 기술: 복잡하고 다양한 데이터 및 환경 하에 리스크, 처리비용 감소, 엄격한 규제에 대한 충족 등에 대한 조직의 인사이트를 강화할 수 있게 하는 기술 기반

• 변화 프로그램: 보다 효과적이고 효율적이며 지속 가능한 조직, 기술적, 문화적 변화를 추진하는 체계적인 프로그램

• 의사결정 프로세스: 리스크를 회피하고 적시의 적합한 비즈니스 의사결정을 위해 필요한 데이터를 수집하고 구조화하는 프로세스

디지털시대의 기업의 성과는 데이터 확보, 데이터 공유, 데이터 활용, 데이터 가치 구현 등으로 인해 차이가 발생할 것이다. 산업 경제에서는 물리적 자원을 잘 다루는 기업이 선도 기업이었다. 디지털 경제에서는 디지털 자원 즉 데이터를 잘 다루는 기업이 선도기업이 되고 있다. 데이터거버넌스를 갖추는 것은 데이터를 잘 다루는 기업이 된다는 의미이다.

좋은 데이터는 좋은 의사결정을 낳고, 좋은 의사결정은 좋은 성과로 이어진다. 성과가 좋으면 이는 다시 좋은 데이터를 만드는데 기여한다. 데이터거버넌스의 목표는 데이터사이클의 선순환 상태를 안정적으로 지속시키는 것이다. 데이터사이클에 반복에 의해 데이터거버넌스 수준이 높은 기업과 그렇지 않은 기업의 차이는 점점 벌어질 것이다.

데이터경제에서 기업 또는 기관은 다음 둘 중 하나만을 선택할 수 있다.

(1안) 데이터거버넌스를 도입하여 데이터를 잘 다루는 역량을 갖추어서 데이터로 인해 지속적으로 성장하는 기업이 되는 것
(2안) 데이터거버넌스를 도입하지 않음으로써 데이터를 활용하지 못하고, 점점 뒤처지는 기업이 되는 것.

이준한 이사 다른 콘텐츠 보기