Picture from linkeddata.org


미래의 웹의 핵심기술이 될 Linked Data에 대해서 아십니까?  2009년 TED 미팅에서 팀 버너스리가 특히 강조를 해서 최근 그 관심도가 높아져만 가고 있는 Linked Data는 W3C의 공식 프로젝트 입니다.  위의 그림은 현재 데이터의 연결도인데, 굉장히 빠른 속도로 늘어가고 있습니다.

과거 이 블로그에서도 로이터 통신의 웹서비스 칼레이 4.0과 관련한 기술을 소개하면서 다룬 바가 있습니다.  당시에 칼레이(Calais)의 지원이 Linked Data의 활성화에 큰 도움이 될 것이라고 예상을 한 바 있는데, 불과 2개월 사이에 엄청나게 지원되는 포맷이 늘었습니다.  아래의 그림을 위의 그림과 비교를 해 보시기 바랍니다.


올해 1월 칼레이 4.0이 발표될 당시의 Linked Data

연관글: 2009/01/20 - 로이터 통신의 웹서비스 칼레이 4.0이 발표되었습니다


Linked Data는 차세대 웹의 가장 기본이 되는 데이터 네트워크가 될 것입니다.  Linked Data에 대한 자세한 정보는 아래 참고자료에 링크한 공식 홈페이지에서 구할 수 있습니다만, 위키피디아에서는 다음과 같은 기본적인 원칙을 따르는 것으로 설명하고 있습니다.

  • URI로 대표되며, 웹에 리소스로서 노출을 시킬 수 있는 어떤 것
  • HTTP URI를 이용해서 사람들이 이를 쉽게 찾아볼 수 있는 것
  • URI를 통해 참조를 했을 때 리소스에 대한 정보를 제공하는 것
  • 다른 리소스와의 링크를 포함하여 웹에서의 정보를 쉽게 찾아낼 수 있도록 함 (RDF 이용)

사실 Linked Data는 온톨로지(ontology)와 많은 연관성을 가지고 있습니다.  기존의 WordNet, FOAF, 그리고 SKOS를 엮는 것에서 출발하여, 이들의 정보 네트워크가 심화되는 방향으로 발전을 하기 시작했습니다.  사실 그동안 Linked Data는 대학이나 과학연구 수준에서만 채택이 되었고, 실질적인 상업적 이용에 사용된 사례가 거의 없었습니다.  그랬던 상황이 올해들어 급격하게 바뀌고 있는 것입니다. 

Linked Data를 이용하면 정보의 발행자가 자신의 컨텐츠를 위키피디아(Wikipedia), 지오네임즈(GeoNames), 인터넷무비 데이터베이스(Internet Movie Database, IMDB), Shopping.com과 같은 다른 Linked Data와 쉽게 연결이 가능하기 때문에, 이들의 연계를 통한 다양한 부가서비스 개발이 가능합니다.  앞으로의 차세대 웹을 이끌기 위한 가장 중요한 토양을 만들고 있는 것입니다.

결국 Linked Data에서 추구하는 방향은 시맨틱 웹과 마찬가지 입니다.  아무런 의미가 없는 섬과 같은 형태의 페이지들이 둥실둥실 떠다니는 것이 아니라, 페이지에 있는 데이터에게 생명력을 부여하고, 이들이 서로 연계가 되고 관계를 찾을 수 있도록 하는 것입니다.  비록 데이터를 만드는 사람들에게 약간의 노력이 필요하겠습니다만 ...

Linked Data에 대해 좀더 공부하시기를 원하시는 분들은 아래 참고자료를 읽어보시거나, 임베딩한 2009년도 TED 미팅에서 팀 버너스리의 강연을 들어보시기 바랍니다.




참고자료:

Linked Data 공식 홈페이지
Linked Data is Blooming: Why You Should Care by Richard MacManus

저작자 표시 비영리
신고

WRITTEN BY
하이컨셉
미래는 하이컨셉, 하이터치의 세계라고 합니다. 너무 메마르고 딱딱한 이야기보다는 글로벌 시대에 어울리는 세계 각국의 이야기, 그리고 의학과 과학을 포함한 미래에 대한 이야기의 세계로 여러분을 초대합니다.

받은 트랙백이 없고 ,

Home


세계적인 통신회사 로이터의 개방형 웹서비스인 칼레이(Calais)의 새로운 4.0 버젼 API가 1월 15일 발표되었습니다.  현재 개방형 환경의 언론과 미디어 분야에서 가장 선도를 하고 있는 서비스이자 기업이기 때문에 언제나 관심을 가지고 지켜보고 있는데요 ...  칼레이는 웹 3.0 기술과 관련해서도 가장 중요한 핵심기술로 간주되고 있는 시맨틱 웹과 관련해서도 많은 대안을 제시하고 있습니다.  기본적으로 정보와 지식을 발행하는 사람들에게 내용에 들어있는 사람이나 장소, 회사, 사실, 이벤트 등의 주요한 의미요소들을 카테고리화 할 수 있도록 합니다. 

Calais 4.0에서 달라진 점으로 눈에 띄는 것은 시맨틱 웹 커뮤니티의 팀 버너스리(Sir Tim-Berners Lee) 등이 지는 수년 간 지지를 해온 링크데이터(Linked Data) 웹 표준에 연결이 가능해진 점입니다.  사실 현재까지 표준이라는 이름이 무색하게 링크데이터(Linked Data)는 대학이나 과학연구 수준에서만 채택이 되었고, 실질적인 상업적 이용에 사용된 사례가 거의 없었다는 점을 감안하면, 이번 칼라이스의 지원은 큰 힘이 될 전망입니다. 

조금 더 세부적인 내용을 들여다 보면, 칼레이 4.0은 기초적인 메타태그 수준을 넘어서서 정보의 발행자가 자신의 컨텐츠를 위키피디아(Wikipedia), 지오네임즈(GeoNames), 인터넷무비 데이터베이스(Internet Movie Database, IMDB), Shopping.com과 같은 링크데이터(Linked Data) 자산을 제공하는 곳과 쉽게 연결할 수 있게 합니다.  또한 발행자가 시맨틱 메타데이터를 자신의 컨텐츠를 소비하는 주체인 검색엔진, 뉴스 전달자 등과도 공유할 수 있게 되어 있습니다.


칼레이 4.0 에서 새롭게 달라진 것들을 정리하면 다음과 같습니다.  그동안 칼레이가 주로 텍스트에서 시맨틱 데이터를 얻는데 촛점을 맞추었는데, 4.0 부터는 앞에서도 언급한 링크데이터(Linked Data)와의 연결이 가능해진 것과, 메타데이터를 공유하고 이를 결합하는 것과 같은 다양한 방법이 주어졌습니다.

칼레이 4.0은 약 25개 정도의 링크데이터(Linked Data) 엔티티 유형을 지원합니다.  로이터 통신 역시 자신들의 온톨로지(ontology)를 RDFS에 발행합니다.  로이터가 링크데이터(Linked Data)에 발행하는 데이터에는 여러 기업들에 대한 설명, 주식 정보, 기업들의 주요 경영진과 직원들 등의 정보가 포함됩니다.  이러한 데이터들을 외부의 개발자들이 얼마든지 이용할 수 있고, 프로그래밍할 수 있습니다.

이러한 측면에서 바라보면, 칼레이 4.0이 가지는 가장 큰 의미는 과거 아마존이 자신들의 고객정보와 상품정보를 공개하면서 AWS를 활성화시킨 것과 같이, 로이터의 막대한 데이터 자산을 개방하면서 아직까지 잘 활성화되지 않고 있는 링크데이터(Linked Data) 표준을 강력하게 지원하면서 시맨틱 웹으로의 전환을 강력하게 밀어붙이는 계기를 마련했다는 점을 꼽고 싶습니다.  현재까지 링크데이터(Linked Data)를 지원하는 주요 데이터 클라우드를 Richard Cyganiak 이 정리한 그림이 있습니다.   여기에 로이터의 데이터들이 추가가 되고, 동시에 이들을 활용할 수 있는 API 로서의 역할을 수행함으로써, 시맨틱 웹으로의 전환을 강력하게 추동할 수 있게 되기를 기대하는 것입니다.



또한, 각각의 문서들이 유일한 ID를 얻게 되며, 동시에 컨텐츠를 결합할 수 있으며, 뉴스나 정보의 발행자들은 단지 ID만을 이용해서 쉽게 외부의 집단 또는 파트너들과의 연결이 가능합니다. 

칼레이 4.0이 주는 의미는 지금까지의 변화에 비해 훨씬 큰 것으로 판단됩니다.  이 API를 활용한 다양한 혁신적인 서비스나 애플리케이션들이 2009년에는 많이 나올 것으로 기대하고 싶습니다.  특히, 이미 칼레이를 열성적으로 활용해서 차세대 웹 브라우저 플랫폼인 블루 스프루스(Blue Spruce)를 개발하고 있는 IBM의 움직임이 주목됩니다 (블루 스프루스에 대해서는 차후 따로 리뷰를 할 예정입니다). 



신고

WRITTEN BY
하이컨셉
미래는 하이컨셉, 하이터치의 세계라고 합니다. 너무 메마르고 딱딱한 이야기보다는 글로벌 시대에 어울리는 세계 각국의 이야기, 그리고 의학과 과학을 포함한 미래에 대한 이야기의 세계로 여러분을 초대합니다.

트랙백이 하나이고 ,