sonagi's blog!

Enabling Networked Knowledge! haklae.kim at gmail.com

Archive for the ‘semantic web’ tag

오픈 데이터와 링크드 데이터의 관계에 대한 소개 자료

one comment

솔트룩스에서 주관한 세미나에서 발표했던 자료입니다.
퇴근하고 가는 길이 많이 막혀 발표도 늦게 시작하고, 정신없이 떠들었던 기억입니다.
오픈 데이터를 효과적으로 활용하기 위해 기술적인 관점에서 Linked Data를 소개합니다. 오픈 데이터를 활용하기 위해 Linked Data가 반드시 필요한 것은 아니지만, 데이터를 의미있게 가공해서 사용하는 측면에서 실용적으로 적용할 필요가 있습니다. 슬라이드에선 개념적인 소개에 초점을 두었습니다.

Written by sonagi

December 27th, 2012 at 3:19 pm

짜잔.. SlideShare에서 Featured된 슬라이드

2 comments

Slideshare.net: 주로 파워포인트와 같은 발표자료를 공유하는 사이트

어제 slideshare에 올린 (바로 아래 포스트) 슬라이드가 Featured가 되어 웹사이트의 첫번째에 게시가 되었다.

페이스북에 올려 놓고 자랑질을 했지만 사실 축하받을 일인지도 모르겠다. 다만 이런 일이 소유의 시대서 공유의 시대로 변화하는 과정에 일어나는 현상이며 새롭게 만들어야 하는 스킬이라는 것을 느낀다.

하나의 창작물이 공유될 때 더 많은 사람이 가치를 느낄 수 있는 세상. 멋지지 아니한가?

Written by sonagi

August 31st, 2012 at 1:03 am

The Knowledge Graph – 시맨틱 웹 커뮤니티의 서운함

leave a comment

The Knowledge Graph가 발표된 후 뉴스가 쏟아지고 있네요. 기술적인 내용은 다른 포스트를 통해 공유를 하고 오늘은 시맨틱 웹 커뮤니티의 서운함(?)에 대한 이야기를 해 봅니다.

시맨틱 웹 소식을 주로 다루는 semanticweb.com에 자극적인 타이틀의 기사가 올라왔습니다. 구글이 GKG (Google Knowledge Graph)를 소개하며, 시맨틱 웹 커뮤니티의 공헌은 언급조차 하지 않았다는 겁니다.

기사 보기: Google Just Hi-jacked the Semantic Web Vocabulary (구글의 날치기  ^^)

Sean은 다음과 같은 리스트로 GKG가 시맨틱 웹 기술을 날치기했다고 주장합니다.

  • “Knowledge Graph” -> Linked Data Cloud
  • “Relationships Between things “ -> Linked Data
  • “ Naming things Better” -> Taxonomy
  • “Objects” -> Entities
  • “Ambiguous Language” -> Semantics
  • “Connecting Things” -> Linked data
  • “discover new, and relevant, things you like” -> Serendipity
  • “meaning”-> Semantic
  • “graph” ->  RDF
  • “things” -> URIs (Linked Data)
  • “real-world entities and their relationships to one another: things” -> Linked Data
 사실 틀린 얘기는 아닙니다. GKG를 어떻게 구현을 했는지 모르지만 시맨틱 웹 커뮤니티에서 연구하고 개발했던 것을 적용했을 가능성은 매우 높습니다. Sean이 비판하는 것은  구글이 새롭게 개념을 정리하거나 만든 것이 아니기에 시맨틱 웹 커뮤니티에 대한 Credit이 필요한데 이것을 무시했다고 지적합니다.
이런 일이 처음은 아닙니다. 몇 해 전 구글이 새로운 어휘를 개발한다고 했을 때, 그리고 Schema.org도 시맨틱 웹 커뮤니티에서 만든 어휘 대신 새로운 어휘를 정의하고, 연결 관계를 고려하지 않았었죠.  구글은 시맨틱 웹의 연관성을 부정하는 것일까요?
최근 구글의 Schema.org로 옮긴 Dan Brickley는 댓글에서 많은 사람들이 이런 일을 하고 있다고 언급합니다. FOAF를 만든 사람이고 시맨틱 웹에 대해 누구보다 이론과 실제를 알고 있기에 좋은 방향으로 진행되기를 기대해 봅니다. 최근 Dan은 BBC Academy의 발표에서 이런 말을 합니다. 어휘의 재활용은 온톨로지가 서로 연결되기 위한 핵심인데, schema.org처럼 종합 선물셋트가 필요하다고 주장합니다.

(at 14:10) In the RDF community, in the Semantic Web community, we’re kind of polite, possibly too polite, and we always try to re-use each other’s stuff. So each schema maybe has 20 or 30 terms, and… schema.org has been criticised as maybe a bit rude, because it does a lot more it’s got 300 classes, 300 properties but that makes things radically simpler for people deploying it. And that’s frankly what we care about right now, getting the stuff out there. But we also care about having attachment points to other things…

어떤 방식이 좋을까요? 사용자, 개발자의 입장에서 보면 schema.org처럼 모든 것을 제공해 주는 것이 편리하겠죠. 여러 어휘를 배우지 않아도 될 것이고, 주요 검색엔진에서 사용될 수 있으니 장점도 많을 수 있습니다. 왠지 구글의 모습에서 마이크로소프트의 예전 모습을 보는 것 같아 마음이 무겁습니다.
물론 중요하지 않은 이슈일 수 있습니다. 시맨틱 웹의 현실성에 대한 비판은 점차 줄어들 것이고, 도메인의 확장에 따라 지속적인 발전이 따라올 것이라 생각이 됩니다. 묵묵하게 할 일을 진행하면 되는 거겠죠. ^^

Written by sonagi

May 22nd, 2012 at 8:30 am

Knowledge Graph: 시맨틱 웹 기술의 비판과 현실

leave a comment

 

구글이 올해초 소개했던 시맨틱 검색의 실체를 공개했습니다. 구글의 검색 기술을 시맨틱 웹과 연관지어 변화시킬 것이라는 루머는 그동안 계속 있었지만, Knowledge Graph를 통해 루머가 현실로 다가왔습니다.

구글의 검색엔진은 어떻게 발전할 것인가?

구글의 공식 블로그는 Knowledge Graph의 목표를 “Things, not strings“으로 요약하고 있습니다. 웹페이지에 텍스트로 표현된 “서울”이 “서울은 도시이다” 또는 “대한민국의 수도이다”로 인식될 수 있는 것이죠.  기계가 단어의 의미를 이해하는 것일까요? 현재 검색엔진은 웹 페이지를 수집하여 문자열을 분석하고 알고리즘적인 방법으로  해당 문자열의 의미를 부여합니다. 구글이 말하는 시맨틱 검색은 사람이 생각하는 것과 같이 문자열을 의미가 있는  ”Thing (사물)”로 인식할 수 있게 하는 것입니다.  Jack Menzel (director of product management at Google)이 CNN과 인터뷰에서 다음과 같이 말합니다.

 You, as a human, associate those words with their real-world meaning but, for a computer, they’re just a random string of characters. 

Knowledge Graph를 통해 구글 검색은 세 가지 혁신을 추구합니다 (by 구글 블로그).
1. Find the right thing (검색어의 의미를 이해하여 정확한 결과를 제공)
검색어에 대해 여러 가지 의미를 갖는 객체를 식별할 수 있는 정보를 제공해 줍니다. 예를 들어, “Apple”를 검색할 때, 회사인지 과일인지 구분하거나, 적어도 구분할 수 있는 기준을 제공해 줍니다.
2. Get the best summary (검색어와 관련된 주제 및 콘텐트에 대한 요약 정보 제공)
Wikipedia의 특정 주제에 대한 메타 정보 (Infobox)를 보듯이, 특정 인물이나 장소에 대한 enriched 정보를 볼 수 있습니다.
3. Go deeper and broader (검색을 통해 의도하지 않은 새로운 정보를 제공)
소녀시대의 Jessica를 검색했을 때, Jessica에 대한 enriched metadata를 넘어, f(x)의 크리스탈이 동생이라는 정보도 함께 제공해 줄 수 있습니다.

It’s just awful. 이런 것이 어떻게 가능할까요? 구글이 Knowledge Graph를 어떻게, 어떤 기술을 이용해서 구축할 것인지 이제 조금씩 공개가 되겠죠. 다만 구글의 비전이 시맨틱 웹이 지향하는 것과 동일하다는 것은 이견이 없습니다. 웹에 존재하는 모든 것을 Resource로 표현하고, 이들 사이의 명시적 관계 (explicit relationship)를 만드는 것은 온톨로지로 만들어지고, 이렇게 만들어진 온톨로지는 웹이라는 공간에서 자유롭게 연결되고 확장될 수 있습니다.

구글의 이런 움직임은 Freebase를 인수할 때 어느 정도 예상할 수 있었던 일입니다.  더불어 구글이 Schema.org (웹페이지의 메타데이터를 구조적으로 표현하기 위한 어휘 및 구조를 정의) 를 적극적으로 이끌어가는 모습에서 구글의 전략은 확실해 졌습니다. 구글은 앞으로 schema.org를 통해 웹을 더 구조적으로 만들고, 이렇게 표현된 웹페이지를 Knowledge Graph와 연결하여 의미적 연관성을 높여 나갈 것입니다. 구글 입장에서 보면, 기하급수적으로 증가하는 웹 데이터를 알고리즘적으로 분석하고 의미를 부여하는 작업을 손쉽게 해결할 수 있는 것이죠.

더불어 현재 진행되고 있는 Linked Data, Open Government Data를 통해 공유되는 거대한 데이터가 Knowledge Graph와 연결되기 시작한다면 Web of Data의 현실화가 멀게 보이지 않습니다. 물론 Knowledge Graph가 완성도를 높이기 위해 많은 시간이 필요할 것이고, 인스턴스 수준을 넘어 스키마를 연계하는 작업은 쉽지 않은 일입니다. 그렇지만 온톨로지를 구축하는 것이 어리석은 일이라고 했던 수많은 비판을 넘어 현실화된 결과를 보고 있듯이 변화는 꾸준히 오고 있습니다.

Siri와 Knowledge Graph… 이 정도면 시맨틱 웹의 킬러애플리케이션의 등장이라고 할 수 있을까요?

관련기사

Introducing the Knowledge Graph: things, not strings

Google revamps search, tries to think more like a person

 Google Search Just Got 1,000 Times Smarter

Google’s new Knowledge Graph: Three key features

 

Written by sonagi

May 17th, 2012 at 10:51 am

Government Linked Data

leave a comment

Written by sonagi

July 5th, 2011 at 9:00 am

[행사안내] International Web Science & Technology Symposium

2 comments

KAIST에서 웹사이언스공학(http://webst.kaist.ac.kr/)이라는 새로운 전공을 출범시키면서 국제 심포지움을 2월 24일(목) 서울 임피리얼 팰리스 호텔에서 개최합니다. 이번 행사는 Wendy Hall, Nigel Shadbolt, James Hendler 등 웹 사이언스를 주도하는 핵심 연구자와 소셜 네트워크 분야의 저명한 연구자인 김용학, 강병남 교수, 시맨틱 웹 분야를 이끄는 김홍기 교수가 발표자로 초빙되었습니다. 사회학과 공학 관점에서 웹 사이언스를 어떻게 해석하고 조망할지 무척 기대가 됩니다. 행사에 대한 자세한 정보는 아래 링크를 참고해 주시기 바랍니다. (참석하고 싶은데 주변 상황이 어떨지 모르겠네요 ㅋ)

행사 홈페이지 및 사전 등록: http://webst.kaist.ac.kr/symposium2011/

웹사이언스 공학 (Web Science and Technology, WebST)은 웹을 연구 대상으로 하는 새로운 학문 분야로서 웹의 과학적, 공학적, 사회적 측면간의 상호작용 연구 등 학제간 연구를 수행합니다. 웹은 인류 역사상 가장 거대한 정보 구조물로 인류의 두뇌로 해석될 수 있습니다. 웹사이언스 공학 (Web Science and Technology, WebST)은 웹을 연구 대상으로 하는 새로운 학문 분야로서 세계 석학을 전임 교수로 초빙하여 관련 분야 연구를 통한 세계적 수준의 고급인력 양성 및 배출을 통해 웹이 인류에 이바지하기 위해 나아가야 할 방향을 탐구하는데 그 목적을 두고 있습니다.

웹은 우리 생활의 중심이 되어가고 있고, 산업과 비즈니스도 웹을 중심으로 개편되고 있습니다. 웹은 인류가 만들어낸 역사상 가장 거대한 구조물이며 “인류의 뇌”이기도 합니다. 이 거대한 구조물에는 수많은 사용자가 접속하여 지적 활동을 하기도하고 또한 각종 스마트 기기를 연결하여 그 자체가 쉴새없이 변화합니다. 무수히 많은 컴퓨터와 인간이 만들어내는 거대하고 다이내믹한 웹은 과학및 공학의 대상이 되고, 분산저장된 초대용량의 콘텐츠와 다양한 수준에서 추상화되는 네트워크는 다양한 학술적 호기심을 불러 일으키기에 충분합니다. 뿐만아니라 웹은 새로운 산업을 촉발시키고 기존 산업이나 비즈니스, 심지어 우리 삶의 형태를 바꾸어 놓기도 합니다.

끊임없이 진화하고 발전하는 웹은 여러분과 같은 우수하고 창의적인 인재들의 탐구적인 마인드와 열정을 기다리고 있습니다. 본 웹사이언스공학 심포지엄에서는 이 분야에 대한 국내외의 관심에 부응하여 세계적 석학들을 초빙함으로써 웹에 대한 다양한 시각 및 트렌드를 공유하고 미래 웹의 발전 방향을 모색하는 시간을 갖고자 합니다. 전세계적으로도 쉽게 접할 수 없는 좋은 기회이니 참석하셔서 유익한 시간 가지시길 바랍니다.

Written by sonagi

February 14th, 2011 at 8:36 am

Facebook ( Open ) Graph and the Semantic Web

leave a comment

Written by sonagi

June 10th, 2010 at 8:23 am

LOD Cloud의 성장 그래프

one comment

Written by sonagi

November 25th, 2009 at 9:28 am

Posted in semantic web

Tagged with , , ,

VoCampGalway2008

leave a comment

가끔 내가 DERI에 있는 것이 행복할 때가 있다.

아마 오늘이 그런 날 중의 하나일 것 같다. 밤새 잠을 제대로 못이뤄 무척 피곤하긴 하지만 여기 있는 사람들과 자유롭게 토론하고 배울 수 있는 것이 무척 즐거운 일이다.

이틀 동안 진행되는 캠프는 말그대로 자유롭게 토론하고 뚝딱뚝딱 이것 저것 해보는 식이다.

RDF, 온톨로지 어휘를 만드는 것이 목표로 참 여러 가지 아이디어들이 있었고 함께 만들고 있다.

참 쉽게 진행이 되는데 이렇게 만들어진 것이 나중에 힘을 받게 된다는 것을 생각하면 대단하다 싶기도 하다.

오늘 여기 있는 사람들은 유럽, 미국에서 왔는데 시맨틱 웹 분야에서 가장 활발히 움직이고 있는 젊은 연구자들이 아닐까 싶다.

대수롭지 않은 미팅을 통해 네트워크가 단단해지고 트렌드를 이끌어가는 것이 힘이다.

한국에서, 일본에서, 또는 중국에서 이렇게 할 수 없을까?

Written by sonagi

November 26th, 2008 at 1:06 am

int.ere.st 집중 분석 – OLLI님 감사합니다.

one comment

전혀 기대하지 않았던 소중한 포스트를 찾았다. 가끔 포스트에 댓글을 달아주신 OLLI님이 int.ere.st를 집중분석을 해 주셨다.

서비스를 하고 있지만 여전히 프로토타입 수준에 머물러 있는데 장단점을 자세히 분석해 주셔서 여러 측면에서 참고할 것이 많다.

세번에 걸쳐 분석을 했는데 해당 포스트를 직접 참고할 수 있다.

다음과 같은 결론을 제시하였다.

  • 가장 먼저 드는 생각은 보기보다 서비스를 이용하고 해석하기가 일반 사용자들에게는 너무 어렵다는 생각이다.
  • int.ere.st 2 에서 언급했듯이, Tag라는 매개체에서 더 나아가서 실질적인 정보를 담보할 수 있는 시스템에 대한 필요성이 느껴졌다.
  • 재미있고, 멋진 기능들이 있긴 하지만, 실제 사용자들에게 어떤 유용함을 줄 수 있는지는 잘 모르겠다. – 어, 이걸 어디에 쓰지? 라는 의문.
  • 하지만 3번의 문제를 해결해 줄 수 있다면, 좀 더 사용자들에게 다가갈 수 있는 서비스가 될 수 있지 않을까 한다.

결론에서 가장 중요한 점은 “어디에 쓰지?”가 아닐까 한다. 네 가지 모두 사용성에 대한 의문일 수 있고 사용자가 얻을 수 있는 혜택이 무엇인지에 대한 질문일수 있다. 처음 기획부터 이런 문제는 어느 정도 생각을 하고 있었고 “해결해야 하는데”라는 …

한참 버전 2를 개발하려고 진행중인데 OLLI님이 지적해 준 부분을 해결해서 더 좋은 모습과 기능을 보여줘야 겠다.

OLLI님 다시 한 번 감사드립니다.

Written by sonagi

August 28th, 2008 at 6:35 am