sonagi's blog!

Enabling Networked Knowledge! haklae.kim at gmail.com

Knowledge Graph: 시맨틱 웹 기술의 비판과 현실

leave a comment

 

구글이 올해초 소개했던 시맨틱 검색의 실체를 공개했습니다. 구글의 검색 기술을 시맨틱 웹과 연관지어 변화시킬 것이라는 루머는 그동안 계속 있었지만, Knowledge Graph를 통해 루머가 현실로 다가왔습니다.

구글의 검색엔진은 어떻게 발전할 것인가?

구글의 공식 블로그는 Knowledge Graph의 목표를 “Things, not strings“으로 요약하고 있습니다. 웹페이지에 텍스트로 표현된 “서울”이 “서울은 도시이다” 또는 “대한민국의 수도이다”로 인식될 수 있는 것이죠.  기계가 단어의 의미를 이해하는 것일까요? 현재 검색엔진은 웹 페이지를 수집하여 문자열을 분석하고 알고리즘적인 방법으로  해당 문자열의 의미를 부여합니다. 구글이 말하는 시맨틱 검색은 사람이 생각하는 것과 같이 문자열을 의미가 있는  ”Thing (사물)”로 인식할 수 있게 하는 것입니다.  Jack Menzel (director of product management at Google)이 CNN과 인터뷰에서 다음과 같이 말합니다.

 You, as a human, associate those words with their real-world meaning but, for a computer, they’re just a random string of characters. 

Knowledge Graph를 통해 구글 검색은 세 가지 혁신을 추구합니다 (by 구글 블로그).
1. Find the right thing (검색어의 의미를 이해하여 정확한 결과를 제공)
검색어에 대해 여러 가지 의미를 갖는 객체를 식별할 수 있는 정보를 제공해 줍니다. 예를 들어, “Apple”를 검색할 때, 회사인지 과일인지 구분하거나, 적어도 구분할 수 있는 기준을 제공해 줍니다.
2. Get the best summary (검색어와 관련된 주제 및 콘텐트에 대한 요약 정보 제공)
Wikipedia의 특정 주제에 대한 메타 정보 (Infobox)를 보듯이, 특정 인물이나 장소에 대한 enriched 정보를 볼 수 있습니다.
3. Go deeper and broader (검색을 통해 의도하지 않은 새로운 정보를 제공)
소녀시대의 Jessica를 검색했을 때, Jessica에 대한 enriched metadata를 넘어, f(x)의 크리스탈이 동생이라는 정보도 함께 제공해 줄 수 있습니다.

It’s just awful. 이런 것이 어떻게 가능할까요? 구글이 Knowledge Graph를 어떻게, 어떤 기술을 이용해서 구축할 것인지 이제 조금씩 공개가 되겠죠. 다만 구글의 비전이 시맨틱 웹이 지향하는 것과 동일하다는 것은 이견이 없습니다. 웹에 존재하는 모든 것을 Resource로 표현하고, 이들 사이의 명시적 관계 (explicit relationship)를 만드는 것은 온톨로지로 만들어지고, 이렇게 만들어진 온톨로지는 웹이라는 공간에서 자유롭게 연결되고 확장될 수 있습니다.

구글의 이런 움직임은 Freebase를 인수할 때 어느 정도 예상할 수 있었던 일입니다.  더불어 구글이 Schema.org (웹페이지의 메타데이터를 구조적으로 표현하기 위한 어휘 및 구조를 정의) 를 적극적으로 이끌어가는 모습에서 구글의 전략은 확실해 졌습니다. 구글은 앞으로 schema.org를 통해 웹을 더 구조적으로 만들고, 이렇게 표현된 웹페이지를 Knowledge Graph와 연결하여 의미적 연관성을 높여 나갈 것입니다. 구글 입장에서 보면, 기하급수적으로 증가하는 웹 데이터를 알고리즘적으로 분석하고 의미를 부여하는 작업을 손쉽게 해결할 수 있는 것이죠.

더불어 현재 진행되고 있는 Linked Data, Open Government Data를 통해 공유되는 거대한 데이터가 Knowledge Graph와 연결되기 시작한다면 Web of Data의 현실화가 멀게 보이지 않습니다. 물론 Knowledge Graph가 완성도를 높이기 위해 많은 시간이 필요할 것이고, 인스턴스 수준을 넘어 스키마를 연계하는 작업은 쉽지 않은 일입니다. 그렇지만 온톨로지를 구축하는 것이 어리석은 일이라고 했던 수많은 비판을 넘어 현실화된 결과를 보고 있듯이 변화는 꾸준히 오고 있습니다.

Siri와 Knowledge Graph… 이 정도면 시맨틱 웹의 킬러애플리케이션의 등장이라고 할 수 있을까요?

관련기사

Introducing the Knowledge Graph: things, not strings

Google revamps search, tries to think more like a person

 Google Search Just Got 1,000 Times Smarter

Google’s new Knowledge Graph: Three key features

 

This content is published under the Attribution-Noncommercial-Share Alike 3.0 Unported license.

Share your comments to Facebook

Written by sonagi

May 17th, 2012 at 10:51 am

Leave a Reply