링크드오픈데이터(LOD)로 데이터 융합하기 위한 과제
상태바
링크드오픈데이터(LOD)로 데이터 융합하기 위한 과제
  • 투이컨설팅
  • 승인 2017.12.14 08:52
  • 조회수 2057
  • 댓글 0
이 콘텐츠를 공유합니다

투이컨설팅 이동욱 이사보



시맨틱웹의 등장

인터넷 라이브 스탯(http://www.internetlivestats.com)이 집계하고 있는 인터넷 규모를 나타내는 수치를 보면 2017년 10월 현재 웹 상에 12.6억 개의 사이트가 존재하며, 인터넷 사용자는 37억 명이 넘었고, 매일 2,200억 개의 이메일이 보내지며 1초에 49테라바이트의 트래픽이 인터넷에 발생되고 있다.  37억 명의 사용자들의 직간접 활동에 의해 인터넷에 수많은 데이터가 생성되고 있는 것이다.

이러한 정보의 바다인 인터넷 위에 올려져 있는 데이터는 대부분 웹페이지 형태로 표현되기에 인간이 보고 이해하는데 최적화 되어있으나 컴퓨터가 인식하는 데는 어려움이 많다. 인간은 웹에 표현된 글의 문맥, 이미지 등을 통해 의미를 파악하지만 표현된 데이터의 의미를 지정해주지는 않고 있어 컴퓨터에게 웹은 하나의 거대한 자연어 집합(비정형 데이터)일 뿐이다. 의미를 이해하지는 못하는 것이다.

이러한 웹의 한계를 해결하기 위한 시도로 나온 것이 시맨틱웹으로, 컴퓨터가 웹에서 표현하는 정보의 의미를 이해하고 처리하는데 목적을 두고 있다(출처: 위키백과). 시맨틱웹은 1998년 팀 버너스리가 제안한 후에 지대한 구현 노력이 있었으며 이를 구현하는데 다양한 방법이 연구되어왔다. LOD(Linked Open Data)는 그 중 하나의 대안으로써 주목을 받고 있다.


링크드오픈데이터의 개념

LOD(Linked Open Data)는 Linked Data와 Open Data의 합성어로 누구나 자유롭게 사용하고 재사용 및 배포할 수 있는 데이터를 웹에서 연결할 수 있도록 표준화한 형식이다(출처: 알기 쉬운 Linked Open Data, NIA).

LOD를 표현할 때 바로 시맨틱웹의 기술인 URI(객체의 명칭, 위치), RDF(정보자원 표현언어), SPARQL(RDF질의어) 등을 이용한다. RDF 형식으로 정보를 표현하고 웹 상에 저장하기에 누구나 LOD로 표현된 정보를 마음대로 쉽게 활용이 가능하며, 컴퓨터로 해당 정보의 의미를 이해할 수도 있다. 여기서 볼 수 있듯이, LOD 구축 시 기대효과는 오픈 API와 같이 해당 데이터 제공 사이트에 인증키를 받지 않고 제공되는 데이터를 가져다 이용할 수 있으며, 링크 정보를 이용하여 전세계 웹사이트로 확대하여 원하는 정보를 가져올 수도 있는 장점이 있다. 즉 웹 사이트를 공유된 데이터베이스로 활용할 수 있는 것이다.

예로, ①방송국 사이트에서 이순신 드라마 정보를 확인하고, ②이순신 장군 이름으로 한국사 웹사이트에서 인물정보를 검색하고, ③이순신 장군이 쓴 책 정보에서 난중일기 이름을 조건으로 ④국립중앙도서관 LOD에서 난중일기 책에 대한 상세 정보를 가져 올 수가 있다. 이와 같이 웹 상에 정보를 의미 검색하고 관련된 정보를 웹에서 찾아 내용 확인이 가능하다. 

그림1_LOD 이용 예시.png
▲ LOD 이용 예시(출처: LOD란 무엇인가? (주)리스트)


공공데이터 개방에서 링크드오픈데이터 활용

우리나라의 경우 공공기관 중심으로 2013년부터 본격적으로 LOD 방식으로 웹사이트에 데이터를 개방하고 있다. 아래 그림 ‘공공 데이터 포털, LOD서비스 소개’를 보면 현재 국립도서관 도서정보, 국립수목원 생물정보, 특허청의 특허정보 등 10여종이 대표적으로 제공되고 있다.
 
그림2_공공기관 주요 LOD 활용 서비스.png
▲ 공공기관 주요 LOD 활용 서비스(출처: 공공데이터포털 www.data.go.kr)

그러나 2017년부터는 관련 사업 진행이 거의 중단된 상황이다. 현재 LOD 서비스는 데이터 구축 및 검색 수준의 단계로 이를 활용한 서비스 제공에는 어려움이 있고 LOD를 몇 개 기관에만 구축되어 링크하여 활용할 만한 데이터가 부족한 상황이다. 

이러한 문제를 극복하고 LOD서비스를 정착하기 위해서는 
1) 일부 기관 정보뿐만 아니라 다양한 기관에서 핵심 주제에 대한 LOD를 구축해야 한다. 특히 국민들이 많이 사용하는 Killer정보(예: 지하철 시간표, 버스노선정보, 주택분양정보, 아파트 가격정보 등)에 대해서도 LOD로 개방하여 관련 데이터를 이용한 서비스가 자생적으로 개발될 수 있어야 한다(참고: 현재 이와 같은 Killer정보는 공공데이터포털에서 오픈 API등으로 개방 중임). 
2) 텍스트뿐만 아니라 이미지, 동영상 등 다양한 형태의 데이터도 활용할 수 있도록 콘텐츠 확대 구축이 필요하다.
3) 이러한 핵심 링크드 데이터를 이용하여 활용성이 높은 공공 LOD서비스를 정부 주도 차원에서 지속적으로 사업을 추진해야 한다. 
4) 아울러 LOD 서비스를 쉽게 구축할 수 있는 솔루션 개발, 관련 분야의 전문 인력 육성이 필요하다  


링크드오픈데이터를 활용한 공간정보 융합 사례

공간정보와 LOD를 활용하는 서비스 방안을 살펴보자. 수요가 많은 공간정보서비스에 LOD를 결합하여 제공할 경우 활성화가 촉진될 것이다. 2015년에 국토정보공사에서 운영하고 있는 국가공간정보포털(www.nsdi.go.kr) 사이트에는 채용정보를 LOD로 구축하여 지도 위에서 시범 서비스를 구현하였다. 해당 서비스는 기업정보를 해당 지도 위로 드래그하면 기업이 위치하고 있는 지역의 지도 정보가 나타나고 그 위에 기업정보를 LOD 뷰어((주)리스트 솔루션)로 보여준다.

그림3_LOD기반의 채용정보 지도 서비스.png
▲ LOD 기반의 채용정보 지도 서비스(출처: 국가공간정보포털www.nsdi.go.kr)

공간정보와 LOD의 결합 서비스는 앞으로도 발전할 가능성이 크다. 예로, 자녀들의 입학으로 인해 이사를 해야하는 부모들을 위해 학교 주변의 주택 매물, 생활시설, 교통시설 등을 온라인으로 확인하고 최적의 주거지를 찾는 LOD서비스를 생각할 수 있다. 이러한 서비스를 위해서는 사용자가 많이 찾는 정보들을 RDF 등으로 구축하고, 해당 정보를 지도 위에서 편리하게 쓰도록 사용자 편의 기능 등이 개발되어야 한다.

그림4_LOD를 활용한 생활정보 검색 지도서비스 예시.png  
▲ LOD를 활용한 생활정보 검색 지도서비스 예시


- 끝 - 



  내용은 '투이톡모바일 앱을 통해서도 확인하실  있습니다.
하루 5스마트해지는 시간~투이톡!!

 다운로드

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.