sonagi's blog!

Enabling Networked Knowledge! haklae.kim at gmail.com

Open Data, Linked Data 발표자료

one comment

오픈 데이터, 링크드 데이터에 대해 개념적으로 소개한 자료입니다. 사례 중심으로 구성하였고, 시맨틱 웹의 필요성에 대해 다른 관점을 제시하려고 했습니다.

This content is published under the Attribution-Noncommercial-Share Alike 3.0 Unported license.

Written by sonagi

August 28th, 2012 at 3:13 pm

The Knowledge Graph – 시맨틱 웹 커뮤니티의 서운함

leave a comment

The Knowledge Graph가 발표된 후 뉴스가 쏟아지고 있네요. 기술적인 내용은 다른 포스트를 통해 공유를 하고 오늘은 시맨틱 웹 커뮤니티의 서운함(?)에 대한 이야기를 해 봅니다.

시맨틱 웹 소식을 주로 다루는 semanticweb.com에 자극적인 타이틀의 기사가 올라왔습니다. 구글이 GKG (Google Knowledge Graph)를 소개하며, 시맨틱 웹 커뮤니티의 공헌은 언급조차 하지 않았다는 겁니다.

기사 보기: Google Just Hi-jacked the Semantic Web Vocabulary (구글의 날치기  ^^)

Sean은 다음과 같은 리스트로 GKG가 시맨틱 웹 기술을 날치기했다고 주장합니다.

  • “Knowledge Graph” -> Linked Data Cloud
  • “Relationships Between things “ -> Linked Data
  • “ Naming things Better” -> Taxonomy
  • “Objects” -> Entities
  • “Ambiguous Language” -> Semantics
  • “Connecting Things” -> Linked data
  • “discover new, and relevant, things you like” -> Serendipity
  • “meaning”-> Semantic
  • “graph” ->  RDF
  • “things” -> URIs (Linked Data)
  • “real-world entities and their relationships to one another: things” -> Linked Data
 사실 틀린 얘기는 아닙니다. GKG를 어떻게 구현을 했는지 모르지만 시맨틱 웹 커뮤니티에서 연구하고 개발했던 것을 적용했을 가능성은 매우 높습니다. Sean이 비판하는 것은  구글이 새롭게 개념을 정리하거나 만든 것이 아니기에 시맨틱 웹 커뮤니티에 대한 Credit이 필요한데 이것을 무시했다고 지적합니다.
이런 일이 처음은 아닙니다. 몇 해 전 구글이 새로운 어휘를 개발한다고 했을 때, 그리고 Schema.org도 시맨틱 웹 커뮤니티에서 만든 어휘 대신 새로운 어휘를 정의하고, 연결 관계를 고려하지 않았었죠.  구글은 시맨틱 웹의 연관성을 부정하는 것일까요?
최근 구글의 Schema.org로 옮긴 Dan Brickley는 댓글에서 많은 사람들이 이런 일을 하고 있다고 언급합니다. FOAF를 만든 사람이고 시맨틱 웹에 대해 누구보다 이론과 실제를 알고 있기에 좋은 방향으로 진행되기를 기대해 봅니다. 최근 Dan은 BBC Academy의 발표에서 이런 말을 합니다. 어휘의 재활용은 온톨로지가 서로 연결되기 위한 핵심인데, schema.org처럼 종합 선물셋트가 필요하다고 주장합니다.

(at 14:10) In the RDF community, in the Semantic Web community, we’re kind of polite, possibly too polite, and we always try to re-use each other’s stuff. So each schema maybe has 20 or 30 terms, and… schema.org has been criticised as maybe a bit rude, because it does a lot more it’s got 300 classes, 300 properties but that makes things radically simpler for people deploying it. And that’s frankly what we care about right now, getting the stuff out there. But we also care about having attachment points to other things…

어떤 방식이 좋을까요? 사용자, 개발자의 입장에서 보면 schema.org처럼 모든 것을 제공해 주는 것이 편리하겠죠. 여러 어휘를 배우지 않아도 될 것이고, 주요 검색엔진에서 사용될 수 있으니 장점도 많을 수 있습니다. 왠지 구글의 모습에서 마이크로소프트의 예전 모습을 보는 것 같아 마음이 무겁습니다.
물론 중요하지 않은 이슈일 수 있습니다. 시맨틱 웹의 현실성에 대한 비판은 점차 줄어들 것이고, 도메인의 확장에 따라 지속적인 발전이 따라올 것이라 생각이 됩니다. 묵묵하게 할 일을 진행하면 되는 거겠죠. ^^

This content is published under the Attribution-Noncommercial-Share Alike 3.0 Unported license.

Written by sonagi

May 22nd, 2012 at 8:30 am

The Web: Too Big To Know? The Web: Too Big To Know?

leave a comment

Too Big to Know: Rethinking Knowledge Now That the Facts Aren’t the Facts, Experts Are Everywhere, and the Smartest Person in the Room Is the Room - by David Weinberger

제목만큼 생각을 깊게 만들 책일 것 같다.  David Weinberger는 내게 흥미로운 연구자였다. 저자는 웹2.0이 핫이슈가 되기 전에 folksonomy에 대해 심도있는 글을 소개했다.  ”Taxonomies to Tags: From Trees to Piles of Leaves” 는 2004년에 발간된 논문으로, 개인의 자발적인 참여에 의해 만들어진 태그가 집단지성으로 발현되는 주요한 social object임을 설명한다.

David Weinberger는 global information space로써 웹을 바라보며, 정보를 공유하고 조합하고 소비함으로써 지식화하는 과정에 있어 웹의 역할을 강조한다. 웹의 특성을 설명하기 위해 책과 비교한 구문은 (논쟁의 여지가 있지만), 비교적 명확하다.  책의 한계는 확장성과 연결성의 부재라 하는데,  책은 출판이 된 이후 개정판을 만들기 전까지 피드백이나 지식의 재생산에 한계가 있음을 말하며, 그 대안이 당연히 웹에 있다고 주장한다.

Books have beginnings because bound pages have a first page. “ The pages are sequenced,  to the ideas are presented in sequence.  “just as the slippery hold of the slotted screw driver became obvious only after the x-shaped Phillips-head screw became common,  many of the disadvantages of of bound books are becoming obvious only now that a medium with a different physics is taking hold.

어쩌면 이런 관점 때문에 자신의 직접 쓴 책에 대해 설명하는 기회를 제공하고 있는지도 모르겠다. 아래 동영상은 책에서 했던 자신의 생각을 설명하고 있어 전반적인 내용을 파악하는데 도움이 된다. 흥미로운 것은 David Weinberger도 Linked Knowledge의 중요성을 강조한다.

 

This content is published under the Attribution-Noncommercial-Share Alike 3.0 Unported license.

Written by sonagi

May 18th, 2012 at 9:46 am

Knowledge Graph: 시맨틱 웹 기술의 비판과 현실

leave a comment

 

구글이 올해초 소개했던 시맨틱 검색의 실체를 공개했습니다. 구글의 검색 기술을 시맨틱 웹과 연관지어 변화시킬 것이라는 루머는 그동안 계속 있었지만, Knowledge Graph를 통해 루머가 현실로 다가왔습니다.

구글의 검색엔진은 어떻게 발전할 것인가?

구글의 공식 블로그는 Knowledge Graph의 목표를 “Things, not strings“으로 요약하고 있습니다. 웹페이지에 텍스트로 표현된 “서울”이 “서울은 도시이다” 또는 “대한민국의 수도이다”로 인식될 수 있는 것이죠.  기계가 단어의 의미를 이해하는 것일까요? 현재 검색엔진은 웹 페이지를 수집하여 문자열을 분석하고 알고리즘적인 방법으로  해당 문자열의 의미를 부여합니다. 구글이 말하는 시맨틱 검색은 사람이 생각하는 것과 같이 문자열을 의미가 있는  ”Thing (사물)”로 인식할 수 있게 하는 것입니다.  Jack Menzel (director of product management at Google)이 CNN과 인터뷰에서 다음과 같이 말합니다.

 You, as a human, associate those words with their real-world meaning but, for a computer, they’re just a random string of characters. 

Knowledge Graph를 통해 구글 검색은 세 가지 혁신을 추구합니다 (by 구글 블로그).
1. Find the right thing (검색어의 의미를 이해하여 정확한 결과를 제공)
검색어에 대해 여러 가지 의미를 갖는 객체를 식별할 수 있는 정보를 제공해 줍니다. 예를 들어, “Apple”를 검색할 때, 회사인지 과일인지 구분하거나, 적어도 구분할 수 있는 기준을 제공해 줍니다.
2. Get the best summary (검색어와 관련된 주제 및 콘텐트에 대한 요약 정보 제공)
Wikipedia의 특정 주제에 대한 메타 정보 (Infobox)를 보듯이, 특정 인물이나 장소에 대한 enriched 정보를 볼 수 있습니다.
3. Go deeper and broader (검색을 통해 의도하지 않은 새로운 정보를 제공)
소녀시대의 Jessica를 검색했을 때, Jessica에 대한 enriched metadata를 넘어, f(x)의 크리스탈이 동생이라는 정보도 함께 제공해 줄 수 있습니다.

It’s just awful. 이런 것이 어떻게 가능할까요? 구글이 Knowledge Graph를 어떻게, 어떤 기술을 이용해서 구축할 것인지 이제 조금씩 공개가 되겠죠. 다만 구글의 비전이 시맨틱 웹이 지향하는 것과 동일하다는 것은 이견이 없습니다. 웹에 존재하는 모든 것을 Resource로 표현하고, 이들 사이의 명시적 관계 (explicit relationship)를 만드는 것은 온톨로지로 만들어지고, 이렇게 만들어진 온톨로지는 웹이라는 공간에서 자유롭게 연결되고 확장될 수 있습니다.

구글의 이런 움직임은 Freebase를 인수할 때 어느 정도 예상할 수 있었던 일입니다.  더불어 구글이 Schema.org (웹페이지의 메타데이터를 구조적으로 표현하기 위한 어휘 및 구조를 정의) 를 적극적으로 이끌어가는 모습에서 구글의 전략은 확실해 졌습니다. 구글은 앞으로 schema.org를 통해 웹을 더 구조적으로 만들고, 이렇게 표현된 웹페이지를 Knowledge Graph와 연결하여 의미적 연관성을 높여 나갈 것입니다. 구글 입장에서 보면, 기하급수적으로 증가하는 웹 데이터를 알고리즘적으로 분석하고 의미를 부여하는 작업을 손쉽게 해결할 수 있는 것이죠.

더불어 현재 진행되고 있는 Linked Data, Open Government Data를 통해 공유되는 거대한 데이터가 Knowledge Graph와 연결되기 시작한다면 Web of Data의 현실화가 멀게 보이지 않습니다. 물론 Knowledge Graph가 완성도를 높이기 위해 많은 시간이 필요할 것이고, 인스턴스 수준을 넘어 스키마를 연계하는 작업은 쉽지 않은 일입니다. 그렇지만 온톨로지를 구축하는 것이 어리석은 일이라고 했던 수많은 비판을 넘어 현실화된 결과를 보고 있듯이 변화는 꾸준히 오고 있습니다.

Siri와 Knowledge Graph… 이 정도면 시맨틱 웹의 킬러애플리케이션의 등장이라고 할 수 있을까요?

관련기사

Introducing the Knowledge Graph: things, not strings

Google revamps search, tries to think more like a person

 Google Search Just Got 1,000 Times Smarter

Google’s new Knowledge Graph: Three key features

 

This content is published under the Attribution-Noncommercial-Share Alike 3.0 Unported license.

Written by sonagi

May 17th, 2012 at 10:51 am

시맨틱 웹 서베이- Pew Internet Research (2010)

leave a comment

약 2년이 흐른 지금이지만, Pew Research Center에서 시맨틱 웹을 전망한 보고서에서 발췌했습니다.

2020년이 되면 시맨틱 웹은 어떤 모습일까요? 자료에 의하면 47%는 부정적이고, 41%는 긍정적입니다. 부정적인 의견이 약간 많네요. 최근 Siri, Google의 시맨틱 검색, BBC, Schema.org의 사례가 있었다면 조금 긍정적인 영향을 줄 수 있었을까요? Linked Data는 어떤 모습으로 현실화될까요?

표준화와 학술적인 연구 영역이라는 한계를 넘어 웹에 보편적으로 적용되고 사용될 수 있는 방법은 무엇일까요?

 

요약문: http://pewresearch.org/pubs/1584/semantic-web-tim-berners-lee-future-of-internet

전문 보기: http://pewinternet.org/~/media//Files/Reports/2010/PIP-Future-of-the-Internet-Semantic-web.pdf

This content is published under the Attribution-Noncommercial-Share Alike 3.0 Unported license.

Written by sonagi

May 8th, 2012 at 9:51 am

Posted in semantic web

Tagged with , ,

2012 Seoul Web Science Meetup 발표자료

2 comments

4월 30일에 있었던 Web Science Meetup 발표자료입니다. 아직 받지 못한 자료가 있는데 다른 포스트를 통해 공유하겠습니다. 이번 행사는 소규모의 토론 중심으로 진행하려고 했는데, 예상보다 많은 분이 등록하고 참석해서 발표가 중심이 되었습니다. 그동안 진행했던 어떤 행사보다 진지하게 발표와 질의응답이 이루어졌고 마지막 발표까지 많은 분들이 관심을 갖고 지켜보았습니다.

웹 사이언스‘의 개념이 낯선 환경에서 이런 시도가 지속될 수 있도록 관심과 참여가 필요합니다. 행사가 끝나면 항상 아쉬움이 있는데 행사를 준비하신 분, 소중한 발표를 해 주신 분, 그리고 소중한 시간을 나누어 청중이 되어 주신 모든 분께 감사를 전합니다.

한의학 온톨로지와 활용 시스템

View more PowerPoint from Haklae Kim

위키미디어 프로젝트에서의 커뮤니케이션

View more presentations from Haklae Kim

시맨틱 미디어위키: 위키의 새로운 시작

View more presentations from Haklae Kim

시맨틱 웹에서의 콘텐츠 검색(Contents search on the semantic web)

This content is published under the Attribution-Noncommercial-Share Alike 3.0 Unported license.

Written by sonagi

May 3rd, 2012 at 9:44 am

오픈데이터, 공공정보 공개, 시맨틱 웹 기술의 필요성

leave a comment

작년 11월에 열렸던 ConTech 2011에서 발표한 자료입니다. 공공정보의 공개의 필요성과 방향에 대해 정리했고, 기술적 관점에서 시맨틱 웹과 Linked Data에 대해 소개했습니다. 영어 발표를 아주 못해서 아주 민망했던 기억이 지금도 생생합니다.

공공정보의 공개는 정부의 투명성 제고에 도움이 될 수 있으나, 미국, 영국 및 유럽 국가들의 개방 정책과 국내의 상황은 조금 다르기 때문에 충분한 논의와 전략적 검토가 필요합니다.

View more presentations from Haklae Kim
덤으로 Slideshare에 올린 자료가 Featured에 등록되었다는 인증샷도 함께 올립니다 :) (자랑질)

Pulpit rock

This content is published under the Attribution-Noncommercial-Share Alike 3.0 Unported license.

Written by sonagi

April 19th, 2012 at 1:30 am

Posted in gov2.0,semantic web

I Love Semantic Web 그룹 생성

leave a comment

페이스북에 그룹을 만들었습니다. 요즘 시맨틱 웹과 관련된 얘기를 나눌 곳이 없는 듯 해서요.

“I love Semantic Web” – http://www.facebook.com/groups/401996396483615/

만들고 보니 “the”를 빼 먹었네요. 시맨틱 웹을 공부한지 10년이 넘었습니다. 많은 비판이 여전히 있지만 기술과 환경은 빠르게 변하고 있습니다. Major 검색업체인 구글, 야후, MS는 Schema.org를 통해 웹을 구조화하는 시도를 가속화하고 있고, 애플의 Siri는 그동안 시장성이 없다고 했던 NLP, 음성인식, Query Answering 기술을 적절히 조합하여 한숨에 차세대 기술의 핵심으로 인정받고 있죠. 아시나요? Siri의 주요 기술이 Active Ontology라는 것을.
최근 구글은 명시적으로 “Semantic Search”를 통해 검색 환경에 큰 변화를 줄 것이라 합니다. 구글이 이러한 시도를 할 수 있는 원동력은 Metaweb을 인수하면서 얻었던 Freebase, 그리고 The Knowledge Graph입니다. People, Places, Organization 등 객체에 대한 의미적 관계를 포함하는 데이터베이스이죠. 멀고 험난한 길임에 틀림없지만 기술은 서서히 진화합니다. 다만 국내에서 시맨틱 웹은 점점 잊혀진 기술인 것 같아 자극적인 타이틀을 넣었습니다. 정보를 공유하고 토론할 수 있는 공간이었으면 합니다. 오픈 그룹이니 누구나 참여할 수 있습니다. ^^ 많이 소문내어 주세요.

페이스북 계정이 필요합니다. 곧 위키나 블로그를 통해 공유할 수 있는 채널도 만들 생각입니다. ^^

This content is published under the Attribution-Noncommercial-Share Alike 3.0 Unported license.

Written by sonagi

April 2nd, 2012 at 10:39 am

Posted in semantic web

[행사안내] Korean Semantic Web Conference 2011

leave a comment

kswc2011

프로그램 보기

초대의글

최근 정보 기술의 발전 방향은 소셜 컴퓨팅(social computing), 모바일 컴퓨팅(mobile computing), 클라우드 컴퓨팅(cloud computing)으로 대표됩니다. 소셜 웹사이트에서 생성된 사용자의 참여와 상호작용은 웹 기반 데이터의 급속한 증가를 이끌어내었고, 모바일 환경과 결합되어 온오프라인을 연결하는 촉매제가 되고 있습니다.
SoLoMo (Social-Location-Mobile) 환경을 통해 다양한 기술적 도전이 이루어지고 있으며, 동시에 새로운 비즈니스 모델을 발굴할 수 있는 기회가 출현하고 있습니다. Big Data는 비즈니스 영역에서 서비스의 확장성과 효율성을 위한 핵심요소로 자리매김하고 있습니다. 반면 공공 분야는 공공기관이 보유하고 있는 대용량 데이터를 효과적으로 공개하고 관리하기 위해 Big Data에 대한 관심이 필요한 상황입니다. Kasabi, Socrata, 마이크로소프트의 Windows Azure Marketplace와 같은 공공 정보 기반의 데이터 마켓플레이스는 Big Data 기반의 새로운 비즈니스 사례입니다.
2011 Korean Semantic Web Conference는 시맨틱 웹 기술이 SoLoMo와 Big Data로 대표되는 IT 환경에 활용될 수 있는 가능성과 이슈에 대해 논의합니다. 시맨틱 웹에 대한 회의론에 대한 분석과 미래를 예측하며, 기업 환경에서 시맨틱 웹 기술의 필요성 및 적용 방안에 대해 살펴봅니다. 더불어 공공정보를 공개, 재활용, 분석하기 위한 시맨틱 웹 및 Linked Data 기술에 대해 논의할 수 있습니다.
2011년의 IT 환경을 정리하고 새로운 기술에 대한 예측을 위해 2011 Korean Semantic Web Conference에 초대합니다. 관심 있는 분들의 참여를 통해 다양한 의견과 지식이 공유될 수 있길 기대합니다.

  • 일시: 2011년 12월 07일 수요일 09:30 ~ 16:40
  • 장소: 연세대학교 공학원
  • 대상: 시맨틱웹, Linked Data, 오픈 데이터 등 차세대 컴퓨팅 기술에 관심이 깊은 모든 분들
  • 참가비: 무료
  • 주관: 웹사이언스 워크그룹
  • 주최: 웹사이언스 워크그룹, 국립중앙도서관
  • 후원: 국립중앙도서관, 마이크로소프트, 한국과학기술정보연구원, 탑쿼드란트코리아, KT

This content is published under the Attribution-Noncommercial-Share Alike 3.0 Unported license.

Written by sonagi

November 25th, 2011 at 11:28 am

LOD 2 워크샵

leave a comment

KAIST에서 개최된 Korea-Germany Joint Workshop for LOD2 Development and Application에 참석하고 있다. LOD2 프로젝트를 진행중인 University of Leipzig 와 KAIST 팀이 공동으로 주최하는 행사인데 제법 많은 사람들이 참석하고 있다. 금주 금요일 (19일)까지 진행될 예정인데, 하루만 참석할 수 밖에 없어 아쉬움이 있다. 그동안 연구된 내용들을 발표하고 있어 발표시간만으로 이해하는 것이 쉽지 않다. 주제도 쉽지 않고, 제법 자세한 내용들이 많아.. 좀 어렵다. 여전히 상업적으로 Linked Data나 Semantic Web을 어떻게 적용할 것인지 의문이 생긴다.

This content is published under the Attribution-Noncommercial-Share Alike 3.0 Unported license.

Written by sonagi

August 16th, 2011 at 2:15 pm

Posted in semantic web

Tagged with , ,