sonagi's blog!

Enabling Networked Knowledge! haklae.kim at gmail.com

오픈 데이터와 링크드 데이터의 관계에 대한 소개 자료

one comment

솔트룩스에서 주관한 세미나에서 발표했던 자료입니다.
퇴근하고 가는 길이 많이 막혀 발표도 늦게 시작하고, 정신없이 떠들었던 기억입니다.
오픈 데이터를 효과적으로 활용하기 위해 기술적인 관점에서 Linked Data를 소개합니다. 오픈 데이터를 활용하기 위해 Linked Data가 반드시 필요한 것은 아니지만, 데이터를 의미있게 가공해서 사용하는 측면에서 실용적으로 적용할 필요가 있습니다. 슬라이드에선 개념적인 소개에 초점을 두었습니다.

This content is published under the Attribution-Noncommercial-Share Alike 3.0 Unported license.

Written by sonagi

December 27th, 2012 at 3:19 pm

Linked Data 사례: Civil War 150

leave a comment

This content is published under the Attribution-Noncommercial-Share Alike 3.0 Unported license.

Written by sonagi

December 14th, 2012 at 11:37 am

Posted in semantic web

Tagged with ,

Linked Data의 산업적 가치 & 사례

leave a comment

This content is published under the Attribution-Noncommercial-Share Alike 3.0 Unported license.

Written by sonagi

December 14th, 2012 at 11:33 am

Posted in semantic web

Tagged with ,

Korea Data Hub 가이드: 데이터 올리기

leave a comment

데이터 허브의 계정을 만들었으면 이제 데이터셋을 올려야겠죠. ^^

데이터 허브에서 데이터는 데이터셋 (dataset)과 리소스 (resources)로 구분합니다.

  • 데이터셋: 특정한 데이터를 포함하는 집합
  • 리소스: 데이터셋에 포함되는 단일 개체로 파일 단위의 데이터

데이터셋은 여러 개의 리소스를 포함합니다. 쉽게 말하면, 데이터셋은 리소스를 담을 수 있는 그릇의 역할입니다.  자, 데이터셋을 추가하는 것부터 시작합니다.

데이터셋은 데이터에 대한 일반적인 정보를 기술할 수 있습니다. 위 그림에 나타난 항목을 먼저 살펴보면,

  • Title: 데이터셋의 이름 (한글도 가능합니다)
  • Url: 데이터허브에서 데이터셋을 식별하기 위한 ID (영문만 가능합니다)
  • License: 데이터셋에 적용된 라이센스 (라이센스에 대한 설명은 다른 포스트에서 자세히 설명하겠습니다)
  • Description: 데이터셋의 설명
  • Group: 데이터셋을 포함하는 분류 또는 범주 (Group 메뉴에서 생성하거나 선택할 수 있습니다)

데이터셋의 설명을 추가했으면 이제 업로드할 데이터에 대한 설명을 추가해야 합니다. 데이터허브에 업로드할 수 있는 데이터는 세 가지 유형입니다.

  • 파일 links: 웹 상에 존재하는 파일의 URL
  • API: 데이터에 접근할 수 있는 API URL
  • 파일: 원본 파일을 직접 업로드

위에 세가지를 모두 리소스 (resource)라고 합니다. 데이터가 웹에 있다면 파일의 링크를 추가할 수 있고, 해당 파일을 직접 업로드할 수 있습니다.

이렇게 추가 (Add)를 하면 화면이 아래 그림과 같이 전환합니다. 해당 리소스에 대한 구체적인 설명을 입력하는 곳입니다. 파일에 대한 메타데이터를 입력할 수 있는 항목들입니다. 맨 아래에 extra field는 사용자가 메타데이터 항목을 정의할 수 있는 기능입니다. 현재 버전은 영문만 지원합니다.

이렇게 입력을 하고 “Save Change”를 누르면 데이터가 등록이 됩니다. ^^


This content is published under the Attribution-Noncommercial-Share Alike 3.0 Unported license.

Written by sonagi

October 17th, 2012 at 9:29 am

Korea Data Hub 가이드: 가입하기

2 comments

Korea Data Hub에 데이터를 업로드하려면 계정을 만들어야 합니다. 사이트 상단에서 “Register”를 클릭하면 다음과 같은 등록화면이 나옵니다. 등록 절차는 비교적 간단합니다. 로그인 (사용자 ID), 이메일 주소, 비밀번호만 입력하면 됩니다. 다만 로그인 (사용자 ID)은 3글자 이상, 영문명, 그리고 ‘-’ 또는 ‘_”의 조합으로 만들어야 됩니다. 저는 ‘haklae_kim’으로 만들었습니다. 

등록을 완료하면 “My Profile”로 이동하며, 아래와 같이 네 개의 정보 (이름, 가입일자, 이메일, API Key)를 보여줍니다. 검정색으로 처리한 부분이 API Key 인데, 데이터의 업로드, 업데이트를 프로그래밍 언어를 이용해 수행할 경우 반드시 필요한 정보입니다. 참고로 The Korea Data Hub에 다수의 데이터셋을 업로드할 때 API를 사용하는 것이 좋습니다. 이렇게 데이터를 업로드하면 왼쪽에 올린 데이터셋과 편집 활동이 숫자로 표시되고, 아래에는 최근 활동이 표시됩니다.

어렵지 않으니 지금 등록해 보세요!

 

 

This content is published under the Attribution-Noncommercial-Share Alike 3.0 Unported license.

Written by sonagi

October 17th, 2012 at 9:09 am

Posted in open data

Tagged with , ,

Korea Data Hub 사이트 오픈

leave a comment

Korea Data Hub (http://thedatahub.kr) 사이트를 오픈합니다.

Korea Data Hub는 오픈 데이터의 수집과 재사용을 위한 공유 플랫폼입니다. 우리가 사는 일상에서 데이터는 매우 중요합니다. 양질의 데이터가 있을 때, 개인과 사회는 효과적으로 의사결정할 수 있습니다. 버스 기다리는 시간을 줄이는 것부터 국가의 예산을 검증하는 수준까지 광범위합니다. 데이터를 소유한 개인이나 기관, 또는 포털과 같이 데이터를 수집, 가공해 서비스를 제공하는 사업자는 지금까지 훌륭한 기능을 제공했습니다. 그러나, 데이터의 공유에 소극적인 것도 사실입니다. 사용자의 참여에 의해 만들어진 데이터가 공유되면 새로운 가치를 만들 수 있습니다.

Korea Data Hub는 데이터의 공유를 활성화하는 것이 목표입니다. 최근 관심이 커진 열린 정부 데이터 (Open Government Data)는 정부가 소유하고 있는 데이터를 공유하고, 시민의 참여를 통해 정부의 투명성과 효율성을 높이기 위한 패러다임입니다. Korea Data Hub는 열린 정부 데이터 패러다임을 지원합니다. 정부 기관의 웹사이트 어딘가에 공개된 수많은 데이터는 재사용이 어렵습니다. 어떤 기관이 데이터를 보유하고 있는지, 어느 곳에 공개했는지 검토하는 것은 상당한 시간과 노력을 소모하게 합니다. Korea Data Hub는 정부 기관에서 공개한 데이터를 연계하고 검색이 가능할 수 있게 지원합니다. 사용하고 싶은 데이터가 있다면 Korea Data Hub에서 검색하고 해당 데이터를 다운로드 받거나 API를 통해 활용할 수 있습니다.

Korea Data Hub는 데이터의 공유 공간입니다. 데이터 플랫폼을 직접 구축할 수 없는 기관이나 개인이 데이터를 업로드하고 공유할 수 있습니다. 데이터를 공유하는 것은 관심있는 사람들의 참여를 이끌고, 이를 통해 새로운 네트워크를 만들 수 있는 기회가 됩니다. 더불어 공유된 데이터의 품질과 가치를 높일 수 있습니다. 데이터의 품질이나 효용성에 대해 염려는 공유한 이후에 해도 늦지 않습니다. 아무리 좋은 데이터라도 누군가의 컴퓨터에 잠자고 있다면 그 가치는 0입니다.

Korea Data Hub는 데이터에 관심있는 사람들의 참여와 협업이 밑바탕이 됩니다. 소수의 데이터 허브 관리팀을 구성하겠지만, 데이터의 수집과 공유는 “여러분“의 참여를 통해 만들어집니다. 가공되지 않은 데이터 (raw data)를 사용하고, 새로운 앱이나 사이트를 만드는 일은 쉽지 않습니다. 데이터를 어떻게 확보하는지, 데이터 소유자가 어떤 생각을 갖고 있고, 어떤 절차를 통해 공개하는지, 데이터를 어떻게 처리하는지 등 행정에서 프로그래밍에 이르는 다양한 어려움이 존재합니다.  Korea Data Hub Q&A는 데이터에 대한 모든 궁금증을 묻고 답할 수 있는 공간입니다. 경험이 공유되지 않는다면, 오늘 누군가가 고민하면서 해결했던 일이 내일 시작하는 사람에겐 똑같은 크기의 고민입니다.

오늘 1,895개의 데이터를 공유합니다. 데이터는 계속 증가할 것이라 믿습니다. 다만 여러분의 참여가 데이터 공유 플랫폼이 성장하는데 가장 중요한 사실임을 믿습니다. 데이터허브 팀이 개발중인 관련 코드는 모두 오픈소스로 공개할 예정입니다. 또한 데이터 수집을 위한 일련의 과정도 모두 공개할 예정입니다.

국내에서 데이터 공유를 외치는 것이 헛된 꿈이라 생각하지 않습니다.

This content is published under the Attribution-Noncommercial-Share Alike 3.0 Unported license.

Written by sonagi

October 16th, 2012 at 10:40 am

Posted in open data

Tagged with , , ,

초심

leave a comment

지식인은 나눌 수 있어야 한다.

누구를 지식인이라고 정의하기 어려울 수 있으나, 고등학교, 대학교 그리고 대학원을 마친 한 사람으로 지식을 공유해야 된다는 생각은 변함이 없다. 한량의 지식으로 나를 포장하기 보다 균형감 있는 지식의 전달자가 되고 싶다. (물론 올바른 지식을 쌓는 것이 먼저겠지만)

Image source: http://cfile23.uf.tistory.com/image/1455EA414D33A4BC2F0974

This content is published under the Attribution-Noncommercial-Share Alike 3.0 Unported license.

Written by sonagi

September 22nd, 2012 at 3:30 am

Posted in beautiful mind

Get the Data 사이트: 기획 의도

leave a comment

열린 데이터 (Open Data)란?

.. data that can be freely used, reused and redistributed by anyone – subject only, at most, to the requirement to attribute and sharealike.

열린 데이터에 대한 관심이 많아지고 있습니다. 정부에서 공개하는 공공 데이터 (public data)가 대표적이며, 분야에 따라 웹에 자유롭게 공개된 데이터도 같은 범주에 포함됩니다. 포털이나 상업용 사이트에서 제공되는 데이터에 비해 열린 데이터는 초보적인 수준에 머물러 있습니다. 데이터를 일관성 있게 처리하고 활용할 수 있는 도구, 데이터를 통해 얻을 수 있는 궁극적인 가치 또는 비즈니스 모델에 대한 고민도 충분하지 않습니다.  이런 생각을 토론할 수 있는 공간이 있을까요?

Get the Data 사이트는 열린 데이터에 대한 관심, 열정, 노력을 공유하기 위한 공간입니다.  사이트를 기획하며 생각했던 질문은 아주 단순했습니다.

  • 어떤 데이터가 공개되어 있을까?
  • 어디에서 데이터를 얻을 수 있을까?
  • 어떤 데이터를 사용해서 만든 서비스가 있을까?
  • 쓰기 좋은 형태로 변환은 어떻게 할까?
  • 데이터에 대한 질문을 누구에게 할까?
  • 어떤 아이디어를 함께 구현할 사람이 있을까?
  • 해외 사례는 어떤 것이 있을까?
  • 열린 데이터와 관련된 행사는 언제 있을까?

열린 데이터에 대한 관심이 있는 사람이라면 한번쯤 고민했던 질문이라고 생각합니다. 이런 궁금증은 시간차가 있겠지만, 누구나 고민할 수 있고, 또 누군가는 이미 해답을 찾고 다음 단계에 있을 수 있습니다. Get the Data의 기본 목표는 경험을 공유하여 시행착오를 줄이고, 더불어 집단지성을 이용해 더 나은 솔루션을 찾으려는데 있습니다. 이와 같은 목적을 위해 SNS, 메일링 리스트 등 다양한 도구를 고려할 수 있지만, 일반 사용자의 보편적 접근을 최대화하기 위해 질의응답식 인터페이스를 선택했습니다. 물론 다른 사이트나 커뮤니티와 연계할 수 있도록 지속적인 노력이 필요합니다.

아직 초라하지만 기능을 쉽게 이해할 수 있습니다. 이미지에서 볼 수 있듯이, 질문, 답변, 댓글을 추가할 수 있고, 투표를 통해 좋은 답글을 추천할 수 있습니다. 개발자라면 Stackoverflow 사이트를 알고 있을 텐데요. 거의 유사한 인터페이스와 기능을 갖고 있습니다.

열린 데이터의 새로운 가치는 다양한 사람, 데이터, 기술의 융합적인 연결을 통해 만들어질 수 있습니다.  현재의 데이터를 가장 효과적으로 분석하는 일은 데이터를 갖고 있는 기관이 더 잘할 수 있습니다. 그러나 데이터를 제공하는 사이트가 증가하고 공개된 데이터가 많아질수록 적합한 데이터를 탐색하고 선택하는 과정은 어려워집니다. 서로 다른 데이터를 연결한다면 데이터 수집, 가공, 분석 및 시각화 작업은 더욱 복잡해질 수 밖에 없습니다.  Get the Data는 이런 문제에 대한 답을 직접 제공할 수 없지만, 사람들이 문제를 해결할 수 있는 공간을 제공합니다.

열린 데이터의 가능성은 서로 다른 데이터를 연결하고 분석함으로써 생각하지 못한 창발적인 가치를 만들어내는데 있다고 생각됩니다.  Get the Data는 작은 노력이라도 기록하고 공유하여 새로운 가치를 만들어가려 합니다. 사이트에 대한 질문과 제안이 있으면 언제나 환영합니다 (haklae.kim@gmail.com).

This content is published under the Attribution-Noncommercial-Share Alike 3.0 Unported license.

Written by sonagi

September 4th, 2012 at 3:35 pm

Posted in open data

Tagged with , ,

Get the Data 사이트 오픈

leave a comment

 Get the Data 사이트: 열린 데이터의 수집, 사용, 처리, 가공에 이르는 다양한 이슈를 토론하는 공간

사이트를 오픈했습니다. 열린 데이터 (open data)에 대한 다양한 이슈를 논의할 수 있는 공간이 되었으면 합니다. 사이트의 기능은 매우 단순합니다. stackoverflow와 비슷하게 질문하고 답하고, 투표하는 것이 전부입니다.

열린 데이터의 사례는 해외에 많습니다. 미국 (http://data.gov)이나 영국 (http://data.gov.uk)의 대표적인 모범 사례 뿐만 아니라 세계 각국에서 열린 데이터를 효과적으로 활용하고 있습니다. 국내는 어떨까요? 서울시의 열린 데이터 광장 (http://data.seoul.go.kr)과 공유자원포털 (http://data.go.kr)이 대표적이며, 정부도 적극적으로 준비를 하고 있는 것으로 알고 있습니다. 다만, 데이터 소비자 관점에서 보면 아쉬움이 있는 것이 사실입니다.

Get the Data는 데이터 소유자/제공자와 소비자를 연결해 주는 공간입니다. 어떤 데이터가 어디에 있는지, 데이터를 개방할 필요가 있는지, 어떻게 활용할 수 있는지 등 열린 데이터와 관련된 다양한 이슈가 있습니다. 이런 이슈를 소수의 전문가가 아닌 시민과 커뮤니티의 참여를 통해 해결할 수 있었으면 합니다. 아래 그림에 간단히 요약했지만, Get the Data는 데이터 제공자와 소비자가 서로 필요한 부분을 상호보완해 줄 수 있는 공간이 될 수 있습니다. 데이터 제공자는 공개된 데이터를 홍보하고, 데이터가 실제 어떻게 활용되고 있는지, 활용하는데 어떤 이슈가 있는지 검토하여 새로운 정책을 수립할 수 있습니다. 반면 데이터 소비자는 원하는 데이터를 요청할 수 있고, 데이터를 활용하는 과정에서 발생할 수 있는 다양한 문제에 대한 솔루션을 찾을 수 있습니다. 이런 점에서 Get the Data집단지성으로 만드는 열린 데이터의 지식 베이스가 되었으면 합니다.

더불어 the data hub는 실제 데이터를 공유하고 다운로드 받을 수 있는 환경을 제공할 예정입니다. Get the Data에서 논의되는 데이터를 직접 얻을 수 있는 공간이 될 수 있습니다. 아직 베타 테스트 중인데 곧 오픈할 예정입니다.

 

 Get the Data에서 궁금한 것을 질문해 보세요! ^^

This content is published under the Attribution-Noncommercial-Share Alike 3.0 Unported license.

Written by sonagi

August 31st, 2012 at 1:05 pm

Posted in open data

Tagged with , ,

짜잔.. SlideShare에서 Featured된 슬라이드

2 comments

Slideshare.net: 주로 파워포인트와 같은 발표자료를 공유하는 사이트

어제 slideshare에 올린 (바로 아래 포스트) 슬라이드가 Featured가 되어 웹사이트의 첫번째에 게시가 되었다.

페이스북에 올려 놓고 자랑질을 했지만 사실 축하받을 일인지도 모르겠다. 다만 이런 일이 소유의 시대서 공유의 시대로 변화하는 과정에 일어나는 현상이며 새롭게 만들어야 하는 스킬이라는 것을 느낀다.

하나의 창작물이 공유될 때 더 많은 사람이 가치를 느낄 수 있는 세상. 멋지지 아니한가?

This content is published under the Attribution-Noncommercial-Share Alike 3.0 Unported license.

Written by sonagi

August 31st, 2012 at 1:03 am