불과 몇 년전만 해도 시맨틱 웹을 연구하는 사람들의 가장 큰 고민은 “데이터”에 대한 목마름이었다. 2002~4년 즈음 웹의 성장 속도는 상상을 불허할 정도로 빨라졌고, 정보과부하 (information overload) 현상을 해결하기 위한 활발한 시도가 있었다. 아이러니하게도 이 시기에 시맨틱 웹은 HTML 중심의 문서에 (조금은 자동적인) 의미를 추가하는 방식 (Semantic annotation)에서 해결 방법을 찾으려 했었다. 이런 방식이 일반 웹 사용자에게 고민을 던져주는 것을 알고 있었지만, 대규모로 크롤링을 하거나 데이터를 받을 수 없었다면 특별히 대안은 없었다.
웹2.0의 등장이후 시맨틱 웹 연구자들은 드디어 숨통을 튼다. 데이터 부족의 목마름은 소셜 웹 사이트에서 제공하는 공개형 API를 통해 어느 정도 해결할 수 있었고, 분산되어 있는 데이터를 통합하는 과정에서 생겨난 통합 이슈는 또 다른 도전을 해 볼 수 있는 기회를 제공해 준다. 물론 여전히 비판적인 시선이 존재하지만, Facebook의 Open Graph나 Twitter의 Annotation 등 일련의 움직임은 분명 나쁘지 않은 움직임이다.
더불어 웹2.0과 함께 주목받은 Linked Data는 학문 중심적 도메인 (DBpedia, DBLP Bibliography, Revyu)에서 또 다른 분야로 확장을 꽤하고 있다. 타이틀에 있듯이 “정부 데이터의 개방”이 그것이다. 오바마 정부의 Open Government Initiative의 일환인 Data.gov는 정부 데이터를 일관성있게 공개하여 재활용하는 것을 목표로 한다. 사이트에서 확인해 보면 매우 다양한 분야의 데이터가 공개되어 업데이트되고 있다. 이렇게 공개된 데이터를 기반으로 다양한 서비스가 만들어질 수 있으며, 데이터 사이의 결합 및 연결, 즉 데이터 매쉬업이 가능해진다. 시맨틱 웹의 역할은 데이터 사이의 연결을 넘어 통합까지 일관된 환경을 제공하는데 있을 것이다. 미국의 경우 Jim Hendler가 있는 Rensselaer Polytechnic Institute에서 적극적으로 시맨틱 웹 기술을 적용하는데 참여하고 있다.
정부 데이터는 시맨틱 웹을 연구하는 사람들에게 또 한번의 기회를 제공해 주려 한다. 국내에서도 Gov 2.0 활동이 Creative Commons Korea를 중심으로 활발하게, 그리고 열정적으로 이루어지고 있다. Gov 2.0과 시맨틱 웹에 대해선 다음 포스트에 조금 더 자세히 소개하려 한다. 아래 두 개의 슬라이드를 통해 대략적인 개념만 알아두면 그 다음을 예상하는데 도움이 되리라 생각한다.