솔트룩스에서 주관한 세미나에서 발표했던 자료입니다.
퇴근하고 가는 길이 많이 막혀 발표도 늦게 시작하고, 정신없이 떠들었던 기억입니다.
오픈 데이터를 효과적으로 활용하기 위해 기술적인 관점에서 Linked Data를 소개합니다. 오픈 데이터를 활용하기 위해 Linked Data가 반드시 필요한 것은 아니지만, 데이터를 의미있게 가공해서 사용하는 측면에서 실용적으로 적용할 필요가 있습니다. 슬라이드에선 개념적인 소개에 초점을 두었습니다.
Archive for the ‘semantic web’ tag
오픈 데이터와 링크드 데이터의 관계에 대한 소개 자료
짜잔.. SlideShare에서 Featured된 슬라이드
Slideshare.net: 주로 파워포인트와 같은 발표자료를 공유하는 사이트
어제 slideshare에 올린 (바로 아래 포스트) 슬라이드가 Featured가 되어 웹사이트의 첫번째에 게시가 되었다.
페이스북에 올려 놓고 자랑질을 했지만 사실 축하받을 일인지도 모르겠다. 다만 이런 일이 소유의 시대서 공유의 시대로 변화하는 과정에 일어나는 현상이며 새롭게 만들어야 하는 스킬이라는 것을 느낀다.
하나의 창작물이 공유될 때 더 많은 사람이 가치를 느낄 수 있는 세상. 멋지지 아니한가?
The Knowledge Graph – 시맨틱 웹 커뮤니티의 서운함
The Knowledge Graph가 발표된 후 뉴스가 쏟아지고 있네요. 기술적인 내용은 다른 포스트를 통해 공유를 하고 오늘은 시맨틱 웹 커뮤니티의 서운함(?)에 대한 이야기를 해 봅니다.
시맨틱 웹 소식을 주로 다루는 semanticweb.com에 자극적인 타이틀의 기사가 올라왔습니다. 구글이 GKG (Google Knowledge Graph)를 소개하며, 시맨틱 웹 커뮤니티의 공헌은 언급조차 하지 않았다는 겁니다.
기사 보기: Google Just Hi-jacked the Semantic Web Vocabulary (구글의 날치기 ^^)
Sean은 다음과 같은 리스트로 GKG가 시맨틱 웹 기술을 날치기했다고 주장합니다.
- “Knowledge Graph” -> Linked Data Cloud
- “Relationships Between things “ -> Linked Data
- “ Naming things Better” -> Taxonomy
- “Objects” -> Entities
- “Ambiguous Language” -> Semantics
- “Connecting Things” -> Linked data
- “discover new, and relevant, things you like” -> Serendipity
- “meaning”-> Semantic
- “graph” -> RDF
- “things” -> URIs (Linked Data)
- “real-world entities and their relationships to one another: things” -> Linked Data
(at 14:10) In the RDF community, in the Semantic Web community, we’re kind of polite, possibly too polite, and we always try to re-use each other’s stuff. So each schema maybe has 20 or 30 terms, and… schema.org has been criticised as maybe a bit rude, because it does a lot more it’s got 300 classes, 300 properties but that makes things radically simpler for people deploying it. And that’s frankly what we care about right now, getting the stuff out there. But we also care about having attachment points to other things…
Knowledge Graph: 시맨틱 웹 기술의 비판과 현실
구글이 올해초 소개했던 시맨틱 검색의 실체를 공개했습니다. 구글의 검색 기술을 시맨틱 웹과 연관지어 변화시킬 것이라는 루머는 그동안 계속 있었지만, Knowledge Graph를 통해 루머가 현실로 다가왔습니다.
구글의 검색엔진은 어떻게 발전할 것인가?
구글의 공식 블로그는 Knowledge Graph의 목표를 “Things, not strings“으로 요약하고 있습니다. 웹페이지에 텍스트로 표현된 “서울”이 “서울은 도시이다” 또는 “대한민국의 수도이다”로 인식될 수 있는 것이죠. 기계가 단어의 의미를 이해하는 것일까요? 현재 검색엔진은 웹 페이지를 수집하여 문자열을 분석하고 알고리즘적인 방법으로 해당 문자열의 의미를 부여합니다. 구글이 말하는 시맨틱 검색은 사람이 생각하는 것과 같이 문자열을 의미가 있는 ”Thing (사물)”로 인식할 수 있게 하는 것입니다. Jack Menzel (director of product management at Google)이 CNN과 인터뷰에서 다음과 같이 말합니다.
You, as a human, associate those words with their real-world meaning but, for a computer, they’re just a random string of characters.
It’s just awful. 이런 것이 어떻게 가능할까요? 구글이 Knowledge Graph를 어떻게, 어떤 기술을 이용해서 구축할 것인지 이제 조금씩 공개가 되겠죠. 다만 구글의 비전이 시맨틱 웹이 지향하는 것과 동일하다는 것은 이견이 없습니다. 웹에 존재하는 모든 것을 Resource로 표현하고, 이들 사이의 명시적 관계 (explicit relationship)를 만드는 것은 온톨로지로 만들어지고, 이렇게 만들어진 온톨로지는 웹이라는 공간에서 자유롭게 연결되고 확장될 수 있습니다.
구글의 이런 움직임은 Freebase를 인수할 때 어느 정도 예상할 수 있었던 일입니다. 더불어 구글이 Schema.org (웹페이지의 메타데이터를 구조적으로 표현하기 위한 어휘 및 구조를 정의) 를 적극적으로 이끌어가는 모습에서 구글의 전략은 확실해 졌습니다. 구글은 앞으로 schema.org를 통해 웹을 더 구조적으로 만들고, 이렇게 표현된 웹페이지를 Knowledge Graph와 연결하여 의미적 연관성을 높여 나갈 것입니다. 구글 입장에서 보면, 기하급수적으로 증가하는 웹 데이터를 알고리즘적으로 분석하고 의미를 부여하는 작업을 손쉽게 해결할 수 있는 것이죠.
더불어 현재 진행되고 있는 Linked Data, Open Government Data를 통해 공유되는 거대한 데이터가 Knowledge Graph와 연결되기 시작한다면 Web of Data의 현실화가 멀게 보이지 않습니다. 물론 Knowledge Graph가 완성도를 높이기 위해 많은 시간이 필요할 것이고, 인스턴스 수준을 넘어 스키마를 연계하는 작업은 쉽지 않은 일입니다. 그렇지만 온톨로지를 구축하는 것이 어리석은 일이라고 했던 수많은 비판을 넘어 현실화된 결과를 보고 있듯이 변화는 꾸준히 오고 있습니다.
Siri와 Knowledge Graph… 이 정도면 시맨틱 웹의 킬러애플리케이션의 등장이라고 할 수 있을까요?
관련기사
- Introducing the Knowledge Graph: things, not strings
- Google revamps search, tries to think more like a person
- Google Search Just Got 1,000 Times Smarter
- Google’s new Knowledge Graph: Three key features
Government Linked Data
[행사안내] International Web Science & Technology Symposium
KAIST에서 웹사이언스공학(http://webst.kaist.ac.kr/)이라는 새로운 전공을 출범시키면서 국제 심포지움을 2월 24일(목) 서울 임피리얼 팰리스 호텔에서 개최합니다. 이번 행사는 Wendy Hall, Nigel Shadbolt, James Hendler 등 웹 사이언스를 주도하는 핵심 연구자와 소셜 네트워크 분야의 저명한 연구자인 김용학, 강병남 교수, 시맨틱 웹 분야를 이끄는 김홍기 교수가 발표자로 초빙되었습니다. 사회학과 공학 관점에서 웹 사이언스를 어떻게 해석하고 조망할지 무척 기대가 됩니다. 행사에 대한 자세한 정보는 아래 링크를 참고해 주시기 바랍니다. (참석하고 싶은데 주변 상황이 어떨지 모르겠네요 ㅋ)
행사 홈페이지 및 사전 등록: http://webst.kaist.ac.kr/symposium2011/
웹사이언스 공학 (Web Science and Technology, WebST)은 웹을 연구 대상으로 하는 새로운 학문 분야로서 웹의 과학적, 공학적, 사회적 측면간의 상호작용 연구 등 학제간 연구를 수행합니다. 웹은 인류 역사상 가장 거대한 정보 구조물로 인류의 두뇌로 해석될 수 있습니다. 웹사이언스 공학 (Web Science and Technology, WebST)은 웹을 연구 대상으로 하는 새로운 학문 분야로서 세계 석학을 전임 교수로 초빙하여 관련 분야 연구를 통한 세계적 수준의 고급인력 양성 및 배출을 통해 웹이 인류에 이바지하기 위해 나아가야 할 방향을 탐구하는데 그 목적을 두고 있습니다.
웹은 우리 생활의 중심이 되어가고 있고, 산업과 비즈니스도 웹을 중심으로 개편되고 있습니다. 웹은 인류가 만들어낸 역사상 가장 거대한 구조물이며 “인류의 뇌”이기도 합니다. 이 거대한 구조물에는 수많은 사용자가 접속하여 지적 활동을 하기도하고 또한 각종 스마트 기기를 연결하여 그 자체가 쉴새없이 변화합니다. 무수히 많은 컴퓨터와 인간이 만들어내는 거대하고 다이내믹한 웹은 과학및 공학의 대상이 되고, 분산저장된 초대용량의 콘텐츠와 다양한 수준에서 추상화되는 네트워크는 다양한 학술적 호기심을 불러 일으키기에 충분합니다. 뿐만아니라 웹은 새로운 산업을 촉발시키고 기존 산업이나 비즈니스, 심지어 우리 삶의 형태를 바꾸어 놓기도 합니다.
끊임없이 진화하고 발전하는 웹은 여러분과 같은 우수하고 창의적인 인재들의 탐구적인 마인드와 열정을 기다리고 있습니다. 본 웹사이언스공학 심포지엄에서는 이 분야에 대한 국내외의 관심에 부응하여 세계적 석학들을 초빙함으로써 웹에 대한 다양한 시각 및 트렌드를 공유하고 미래 웹의 발전 방향을 모색하는 시간을 갖고자 합니다. 전세계적으로도 쉽게 접할 수 없는 좋은 기회이니 참석하셔서 유익한 시간 가지시길 바랍니다.
Facebook ( Open ) Graph and the Semantic Web
VoCampGalway2008
가끔 내가 DERI에 있는 것이 행복할 때가 있다.
아마 오늘이 그런 날 중의 하나일 것 같다. 밤새 잠을 제대로 못이뤄 무척 피곤하긴 하지만 여기 있는 사람들과 자유롭게 토론하고 배울 수 있는 것이 무척 즐거운 일이다.
이틀 동안 진행되는 캠프는 말그대로 자유롭게 토론하고 뚝딱뚝딱 이것 저것 해보는 식이다.
RDF, 온톨로지 어휘를 만드는 것이 목표로 참 여러 가지 아이디어들이 있었고 함께 만들고 있다.
참 쉽게 진행이 되는데 이렇게 만들어진 것이 나중에 힘을 받게 된다는 것을 생각하면 대단하다 싶기도 하다.
오늘 여기 있는 사람들은 유럽, 미국에서 왔는데 시맨틱 웹 분야에서 가장 활발히 움직이고 있는 젊은 연구자들이 아닐까 싶다.
대수롭지 않은 미팅을 통해 네트워크가 단단해지고 트렌드를 이끌어가는 것이 힘이다.
한국에서, 일본에서, 또는 중국에서 이렇게 할 수 없을까?
int.ere.st 집중 분석 – OLLI님 감사합니다.
전혀 기대하지 않았던 소중한 포스트를 찾았다. 가끔 포스트에 댓글을 달아주신 OLLI님이 int.ere.st를 집중분석을 해 주셨다.
서비스를 하고 있지만 여전히 프로토타입 수준에 머물러 있는데 장단점을 자세히 분석해 주셔서 여러 측면에서 참고할 것이 많다.
세번에 걸쳐 분석을 했는데 해당 포스트를 직접 참고할 수 있다.
다음과 같은 결론을 제시하였다.
- 가장 먼저 드는 생각은 보기보다 서비스를 이용하고 해석하기가 일반 사용자들에게는 너무 어렵다는 생각이다.
- int.ere.st 2 에서 언급했듯이, Tag라는 매개체에서 더 나아가서 실질적인 정보를 담보할 수 있는 시스템에 대한 필요성이 느껴졌다.
- 재미있고, 멋진 기능들이 있긴 하지만, 실제 사용자들에게 어떤 유용함을 줄 수 있는지는 잘 모르겠다. – 어, 이걸 어디에 쓰지? 라는 의문.
- 하지만 3번의 문제를 해결해 줄 수 있다면, 좀 더 사용자들에게 다가갈 수 있는 서비스가 될 수 있지 않을까 한다.
결론에서 가장 중요한 점은 “어디에 쓰지?”가 아닐까 한다. 네 가지 모두 사용성에 대한 의문일 수 있고 사용자가 얻을 수 있는 혜택이 무엇인지에 대한 질문일수 있다. 처음 기획부터 이런 문제는 어느 정도 생각을 하고 있었고 “해결해야 하는데”라는 …
한참 버전 2를 개발하려고 진행중인데 OLLI님이 지적해 준 부분을 해결해서 더 좋은 모습과 기능을 보여줘야 겠다.
OLLI님 다시 한 번 감사드립니다.








