정보 분류를 위해 알아야 할 것들
상태바
정보 분류를 위해 알아야 할 것들
  • 박현주 책임
  • 승인 2020.11.19 10:30
  • 조회수 4530
  • 댓글 0
이 콘텐츠를 공유합니다

정보가 쌓이면 그에 뒤따르는 것이 분류이다. 분류는 세상을 바라보는 관점이자 정보처리 능력을 향상시키는 수단이다. 기원전 3000년경 문자가 발명된 이래로 인류는 점점 더 많은 정보를 쌓아 왔다. 우리의 선조들은 원하는 서적을 찾기 위해, 그리고 학문을 깊게 탐구하기 위해 분류법을 창안하였다. 오늘날 우리는 정보의 홍수 속에 살고 있으며 분류의 중요성은 더욱 커지고 있다.

기업에서는 고객과 상품, 서비스 등을 특성에 따라 분류하고, 컨설팅 수행 시에는 기업 분석, 체계 수립을 위해 조직, 활동 등에 대한 분류가 선행된다. 4차 산업을 위한 데이터 연계, 표준, 인공지능 학습 등에서 분류는 필수적이다.

분류는 어려운 작업인데 어떠한 분류를 적용하느냐에 따라 결과에 미치는 영향력이 크기 때문이다. 같은 내용의 보고서라도 분류에 따라 전달력에서 차이가 나며, 기업에서는 상품과 서비스의 분류가 고객의 구매율에 커다란 영향을 미친다.

 

분류 요소

동서양 모두 가장 오래된 분류의 역사는 도서 분류인데, 이를 바탕으로 짐작할 수 있듯이 문헌정보학의 자료조직론에서 분류론을 다루고 있다. 이 중 모든 분야에 공통으로 적용 가능한 분류 요소와 원칙에 대해 알아보자

분류의 3요소는 피분류체, 분류원리, 분류지(分類肢)이다.

- 피분류체는 분류의 대상으로서 분류하고자 하는 자료 자체를 의미하며 유개념이라고 한다. 피분류체는 성질이 명확해야 하고, 하위 개념의 포괄을 위한 전개성이 있어야 한다.

- 분류원리는 나누는 기준 또는 관점을 의미하며 명확해야 하고, 동일 단계에서 유일해야 한다.

- 분류지는 분류원리에 의해 구분된 하위 개념(종개념)을 의미하며, 망라성, 상호배타성, 점진성을 갖추어야 한다. 망라성은 하위 개념인 분류지의 전체가 상위 개념인 유개념의 범위와 같아야 함을 의미한다. 상호배타성은 분류원리를 기준으로 할 때 서로 중복되지 않아야 함을 의미한다. 마지막으로 점진성은 상위 개념인 유개념에서 하위 개념인 종개념까지 점차적으로 진행되어야 하며, 중간 단계에서 뛰어 넘지 말아야 할 것을 의미한다.


분류 관점별 특징

분류를 나누는 기준인 분류원리는 분류의 목적에 따라 다양하게 정의되므로 특정 유형으로 한정할 수 없는데, 그렇다 하더라도 다음의 몇 가지 관점을 제시하여 분류원리를 정의하는데 도움을 주고자 한다.

- 기원에 따른 분류 : 분류의 대상물을 처음으로 생겨나게 한 원인 또는 원인과 관련한 특징을 기준으로 분류한다. 예를 들어, 우리말의 어휘는 어디에서 유래했는지에 따라 '고유어', '한자어', '외래어'로 분류되며, 빅데이터는 생산주체에 따라 ‘프로세스’, ‘기계’, ‘사람’으로 분류할 수 있다.

- 형태에 따른 분류 : 외형에서 나타나는 생김새나 모양에 따라 분류한다. 언어는 어절의 형태에 따라 ‘고립어’, ‘교착어’, ‘굴절어’로 분류되며, 빅데이터는 수집형태에 따라 ‘정형 데이터’, ‘반정형 데이터’, ‘비정형 데이터’로 분류된다.

- 속성에 따른 분류 : 대상 고유의 특징이나 현상적 성질에 따라 분류한다. 그레고리스톤의 고객분류에서는 고객의 기대와 태도에 따라 ‘경제적 고객’, ‘윤리적 고객’, ‘개인적 고객’, ‘편의적 고객’으로 분류한다. 재화는 지속 가능성에 따라 ‘비내구재’, ‘반내구재’, ‘내구재’로 분류하기도 한다.

- 기능에 따른 분류 : 대상이 수행하는 역할과 작용을 기준으로 분류한다. 건설기계는 ‘적재기계’, ‘운반기계’, ‘다짐기계’ 등으로 분류되며, 도시는 도시가 수행하는 역할에 따라 ‘교육도시’, ‘교통도시’, ‘관광휴양도시’로 분류한다.

- 목적에 따른 분류 : 실현하려고 하는 일이나 쓰임새에 따른 분류이다. 선박은 사용목적에 따라 ‘상선’, ‘어선’, ‘특수선’, ‘군용선’으로 나뉘며, 토지를 ‘택지’, ‘농지’, ‘임지’로 구분하는 것은 용도에 따른 분류이다.

- 흐름에 따른 분류 : 시간의 흐름 또는 활동의 과정을 기준으로 분류한다. 상품은 생산과정에 따라 ‘원재료’, ‘중간제품’, ‘완제품’ 등으로 분류할 수 있다. 사회조사는 조사 시점에 따라 '횡단적 조사', '종단적 조사', '유사종단적 조사'로 분류된다.


분류 단계

분류는 여러 단계로 구성될 수 있으며, 단계별로 분류원리가 동일하거나 상이할 수 있다. 한국표준교육분류 중 교육수준에 대한 분류는 3단계로 구성된다. 대분류는 교육수준을 기준으로 하고, 중분류는 교육성격을, 그리고 소분류는 교육과정의 완성 여부를 기준으로 한다. 한국표준산업분류는 대분류-중분류-소분류-세분류-세세분류의 5단계 분류로 구성된다.

 

분류체계 사례

국제 표준분류에는 국제산업분류(ISIC), 국제상품분류(NICE), 국제특허분류(IPC) 등이 있다. 이는 국가 간 통계자료 비교 및 교류를 위해 만들어졌다.

통계청은 다양한 분류를 고시하고 있는데, 통계법 제22조에서 산업, 직업, 질병ㆍ사인(死因) 등에 관한 표준분류를 작성ㆍ고시하도록 규정하고 있다. 이에 따라 한국표준산업분류, 한국표준직업분류, 블록체인산업분류 등이 고시되었다.

과학기술에 대한 표준 분류는 과학기술정보통신부에서 고시한 국가과학기술표준분류체계가 있으며, 과학기술기본법 제27조에서 이에 대한 시행 및 지속적인 보완을 요구하고 있다.

4차 산업의 핵심분야인 공간정보는 국토교통부에서 공간정보분류체계를 제공하며, 공간정보 산업의 체계적인 육성을 지원하고, 원하는 정보를 쉽게 찾을 수 있도록 한다.

정보 분류를 위한 몇 가지 사항을 알아보았다. 분류체계는 정보를 조직화하는 뼈대의 한 축을 담당하고 있다. 뼈대가 약하면 본체는 곧 무너진다. 상기의 것들을 참고하여 분류체계를 정의한다면 튼튼한 뼈대처럼 좀 더 체계적으로 정보를 관리하고 활용하는 데 도움이 될 것이다.

 

 

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.