sonagi's blog!

Enabling Networked Knowledge! haklae.kim at gmail.com

Archive for the ‘링크드데이터’ tag

시맨틱웹, 링크드데이터, 새로운 것

4 comments

새로운 것을 소개하고 알리는 일은 즐거움이 될 수 있지만 새로운 고민거리를 던져준다.
웹 2.0이 유행과 비전 사이의 논쟁 속에 있었지만 (지금도 진행중이지만) 국내의 현실과 거리가 있었던 것도 사실이다.
웹 2.0은 비즈니스를 강조하지만, 국내에서 웹 2.0으로 성공한 기업이 얼마나 되는지 생각해 보면 성공한 모델은 아닌 것 같다. 그럼 그동안 ‘웹 2.0′이란 유행어를 빌려 만들어졌던 수많은 워크샵, 컨퍼런스는 어떻게 평가해야 할까?

새로운 정보를 공유한다는 측면에서 바람직하지만 대안을 제시하지 못했다는 문제가 있는 것일까?
생각해 보면 웹 2.0에서 주장하는 개념과 원칙들은 국내에서 성공하기 힘든 것이었는지 모른다. 한국에서 정보공유와 참여가 어느 정도 가능하고 활성화될 수 있을까? 불가능하지 않지만 특정한 서비스나 사이트에 사용자의 대부분이 몰려있는 상황에서 정보공유나 참여는 제한될 수 밖에 없다.

시맨틱 웹의 방향에서 보면 한국은 정말 힘든 곳이다. 영어를 사용하지 않으니 한국어 페이지나 데이터를 애써 처리하려는 사람도 없을 것이고, 오픈 API도 국내용이 될 수 밖에 없다. 더구나 데이터 공유도 쉽지 않다.
링크드 데이터는 기본적으로 레거시 데이터를 RDF나 OWL로 변환하는 작업이 필요한데 어떤 데이터를 변환할 것인가에 대한 의문이 생긴다. 해외 (국제적이니 단순 비교는 의미가 없지만) 사례 (WikipediaDBPedia)들은 기본적으로 활용할 수 있는 데이터가 많다는 장점이 있다.

웹2.0이 유행어로 치부되지 말아야 하는 이유는 “웹2.0에서 말하는 정보공유나 공개가 이루어지지 않았다면 Linked Data는 현실화되기 어려웠다”는 사실에 있다.

문제는…. 국내는 웹 2.0의 문제가 바로 시맨틱 웹-Linked Data의 문제로 연결된다는 것이다. 데이터를 시맨틱 웹 기반 언어로 표현할 수 없는 상황에서 시맨틱 웹에 대한 연구나 적용은 한계에 부딪칠 수 밖에 없다. 이것이 국내의 현실이고 풀기 힘든 문제이다.

이런 상황에서 해외 사례를 알리는 세미나/워크샵/컨퍼런스를 하는 것이 좋을까?
웹앱스콘기묘 세미나에서 Linked Data에 대한 소개를 했지만 국내에서 이와 관련된 새로운 움직임이 있는 것 같진 않다.

블로그를 통해 새로운 정보를 공유하는 것은 바람직하다. 그런데 새로운 행사나 이벤트를 만드는 것에 의문이 든다.
함께 힘을 모아서 한다는 것에 의미를 두어야 할까?

update. 쓰고 보니 아래 모임에 대한 고민으로 이해될 수도 있겠네요. 아래 모임은 이번주 내로 공식 페이지를 올리겠습니다.

Written by sonagi

February 11th, 2009 at 9:37 am

DC-2009 “Semantic Interoperability of Linked Data”

3 comments

올해 더블린코어 (Dublin Core) 컨퍼런스는 서울에서 개최된다.
작년에는 태깅, 포크소노미를 집중적으로 다루었는데 올해는 시맨틱 웹과 링크드 데이터를 핵심 주제로 선정했다.
적절한 시점에서 이슈가 되는 주제를 다룰 수 있는 기회가 될 것 같다. 다음은 컨퍼런스 소개 글 중에서..

(메타데이터와 온톨로지의 의미적 상호운용)
DC-2009 will focus on linked data and the enabling of the Semantic Web. Conference participants will explore the conceptual and practical issues in breaking the constraints of data silos and connecting pieces of data, information, and knowledge. Metadata is a key to these processes supporting publishing and interlinking structured data on the Semantic Web. There is a growing interest in the metadata community in connecting existing and future data contained in silos within and across organizations in a meaningful way that supports extraction and correlation of the data. The linking of data from disparate data silos presents technical and social challenges that will be explored at DC-2009 through full papers, project reports, posters, special sessions and workshops.

웹사이트가 오픈된지 며칠 되지 않기 때문인지 구체적인 프로그램은 아직 정해지지 않은 듯 하다.
계속 지켜보고 기회가 된다면 꼭 참석해야 겠다.

Written by sonagi

January 15th, 2009 at 7:43 am

Linked Data와 시맨틱 웹

leave a comment

링크드 데이터 (Linked Data)는 시맨틱 웹이 아니다.

“시맨틱 웹이 아니다” 시리즈는 많다. 인공지능, 지식표현, 심지어 웹2.0까지 많은 이론이나 현상이 시맨틱 웹과 비교된다. 시맨틱 웹이 다른 이론, 학문 또는 현상들과 반드시 차별화될 필요는 없다. 그러나 시맨틱 웹이 내일 당장 우리 눈에 보이는 것이 아니기 때문에 어쩌면 더 냉정한 접근이 필요할 수 있고, 이런 의미에서 차별화는 필요하다. 이런 생각이 오늘 일은 아니다. 2005년 Eric Miller의 발표자료 중 ” Semantic Web – Many things to many people” 타이틀에서 보듯이 많은 사람들이 제 입맛대로 시맨틱 웹을 해석해 왔다. The Blindmen and the Elephant 에서 여섯 명이 코끼리를 모두 다르게 말하듯이 시맨틱 웹은 더욱 혼란스러운 논쟁에 놓여 있었다.

시맨틱 웹이 무엇인지? 왜 이런 얘기가 나오게 되었는지 살펴보는 것이 필요하다. Tim Berners-Lee가 쓴 Design Issues를 보면 웹과 시맨틱 웹이 무엇인지 기술적 관점에서 이해할 수 있다. 최근 ‘데이터 웹’ 또는 ‘데이터 중심의 웹’이란 용어가 화두가 되고 있지만, 이것의 유래도 이슈 중에 하나인 Semantic Web Road map(1998)에서 찾을 수 있다.

Machine-Understandable information: Semantic Web

The Semantic Web is a web of data, in some ways like a global database. The rationale for creating such an infrastructure is given elsewhere [Web future talks &c] here I only outline the architecture as I see it.

이 문서를 읽어 보면 시맨틱 웹의 계층형 아키텍처가 어떻게 나왔는지 이해할 수 있을 것이다. 인용하였듯이 TBL은 비전을 제안하기 전부터 시맨틱 웹을 데이터 중심의 웹으로 정의하고 있다. 이 말은 그가 생각하고 꿈 꾸었던 웹이 문서 수준에서 머물지 않고 모든 데이터를 포함하는 데이터베이스와 같은 역할을 하게 될 것을 의미한다. 지금 어느 정도 되지 않았나?

문제는 “machine-understandable”이란 단어에 있지 않았을까 한다. 이에 대한 논쟁이 불 붙었던 적이 있었고 (국내외에서), 지금은 어느 정도 정리되었다고 생각하기에 여기에서 설명하고 싶지 않다.

정리한다면, 시맨틱 웹은 차별화될 필요가 있는데 이것은 올바른 이해를 바탕으로 한다. 유행을 만들고 상업적 목적으로 시도하는 모든 것이 의미없는 것은 아니지만 그래도 ‘기본’은 지켜야하지 않을까?

Linked Data의 의미는?

Linked Data는 시맨틱 웹 환경을 만들어가기 위한, 만들어내는 방법 (method)중의 하나이다. 위키피디아를 인용하면 다음과 같다.

Linked Data is a term used to describe a method of exposing, sharing, and connecting data on the Web via dereferenceable URIs.

역참조 할 수 있는(dereferenceable) URI를 통해 웹 데이터를 공개, 공유, 연결하는 방법

Linked Data는 웹과 시맨틱 웹을 연결하기 위한 기본에서 출발한다. 정확히 말하면, 웹 데이터와 시맨틱 웹 데이터를 연결하는 것을 말한다. 그 대상은 HTML 문서에서 웹 서비스에 이르는 모든 데이터를 포함한다. 웹2.0 사이트에서 제공하는 매쉬업 서비스는 Linked Data를 만드는 중요한 자원중에 하나이다.

다시 TBL의 글을 인용하면 Linked Data (2006/7)의 기본 원칙은 다음과 같다.

  1. Use URIs as names for things
  2. Use HTTP URIs so that people can look up those names.
  3. When someone looks up a URI, provide useful information.
  4. Include links to other URIs. so that they can discover more things

웹앱스콘에서 말했듯이 네 가지는 웹의 기본 원칙을 따르고 있다. 다시 강조하자면 HTTP와 URI는 웹의 기본이며 동시에 표준이다. 시맨틱 웹의 미래 모습은 표준을 기반으로 확장된 형태일 것이다. Linked Data에서 추가된 것은 RDF를 이용해 자원을 기술하고 의미적 링크를 표현하게 해 주는 것이다. 즉, Linked Data는 시맨틱 웹을 만들어가는데 기본 중의 기본이 될 것이다.

여러가지 정리해야 할 이슈들이 있고 의문스러운 문장들이 있다. “Linked Data와 시맨틱 웹”에 대한 주제는 다른 포스트를 이용해 계속 정리할 생각이다.

Written by sonagi

November 5th, 2008 at 10:26 am