sonagi's blog!

Enabling Networked Knowledge! haklae.kim at gmail.com

Archive for the ‘blog’ tag

ReadWriteWeb Korea 필진으로 참여합니다.

one comment

얼마전 ReadWriteWeb Korea 블로그가 공식적으로 오픈했습니다.

제 블로그도 관리를 제대로 못하는데 또 다른 블로그에 참여해야 하는 부담이 있지만 열심히 해야 겠죠.

주로 시맨틱 웹과 소셜 컴퓨팅에 관련된 소식 위주로 글을 쓸 생각입니다.

소나기 블로그엔 무엇을 써야 할런지 고민이 되네요.

Written by sonagi

June 23rd, 2009 at 8:24 am

Posted in life

Tagged with , ,

블로그를 하는 이유

2 comments

한동안 블로그에 글을 남기지 못하면 이런 말로 시작을 한다.

너무 바빠서~~ 한동안 글을 남기지 못했다…

그리고 이런 저런 변명을 하고 열심히 해야지 라는 말을 남긴다.

전업 블로그 운영자도 아니기에 어쩔 수 없지 않나 하는 생각을 하면서도 한편으로 글을 남기지 못할 때 불편한 마음이 들기도 한다.

왜 블로그를 하고 있는 것일까?

내가 썼던 글들을 다시 보는 일이 별로 없는 것을 생각하면 블로그는 내 정보를 관리하는 목적은 아닌 것 같다. 적어도 내 경우에 있어선.

그럼 무엇일까?

사람들과 정보를 공유하려는 것일까? 무엇인가 소통을 바라는 것일까?

맞는 것 같지만 코멘트, 트랙백이 없는 블로그임을 생각하면 그렇게 만족스러운 결과도 아닌 것 같다.

문득 지도교수님의 블로그를 가 보았다. 블로그의 주된 사용층 (30~40대)과 거리가 있지만 학부수업에 블로그, 위키를 사용하실 수 있는 몇 안되는 분이시다.

교수님께서 블로그를 시작하시면서 이런 말씀을 남기셨다.

블르그를 시작하면서 앞으로 글을 계속해서 써야겠다는 다짐은 하지만 남들이 기억 못하는 수 많은 블로그를 쏟아 내는 것보다 은하수처럼 많은 별 중에서도 기억에 남는 별과 같은 글을 썼으면 하는 욕심을 가지기 때문이다. 내 머리에 남아 있는 별들처럼 읽는 이의 기억에 남는 블로그를 많이 쓸 수 있을까?

2008년을 맞아 새로운 블로그 사이트를 마련하여 자주 글을 올릴 것을 약속한다. 이곳이 나의 정신 세계의 자취를 남기는 자리가 되면서, 동시에 찾아와 읽는 사람들에게 시간을 헛되게 쓰지 않았다는 생각이 들게 하면 좋겠다. 때로는 세상사에 대한 나의 넉두리도 늘어 놓아 스트레스 출구로도 사용될 것으로 본다. 아무튼 집이라면 주인이나 손님이나 모두 편안한 곳이어야 하므로, 나가는 기분이 들어 올 때보다 좋게 되도록 꾸며야 하는데 . . .

들어올 때 보다 나가는 기분이 더 좋은 블로그..소나기 블로그.. :) 헤헤.

Written by sonagi

August 29th, 2008 at 1:32 am

Posted in life

Tagged with ,

블로그 데이터셋

one comment

데이터 구하는데 힘드신 분들은 참고하세요.

This dataset consists of 3000 blog homepages, out of which 700 have been labeled as splogs, and another 700 as authentic blogs. This training set was used in results of three papers, with emphasis on identifying blogs, on detecting spam blogs, and on analysing the splogosphere.
This collection can be used in further experimenting with splogs, or for building filters that could be deployed in real world systems. We, and our academic and industrial collaborators have been using such filters to eliminate spam blogs, with good results.

The dataset consists of about 14M weblog posts in XML format from 3M weblogs collected by Nielsen BuzzMetrics for May 2006. The data is annotated with 1.7M blog-blog links (Please note that the complete dataset is over 10GB).

Breakdown (of posts) by language:

  • English 51%
  • Chinese 14%
  • Japanese 14%
  • Russian 6%
  • Spanish 3%
  • French 2%
  • Italian 2%
  • Unknown 3%

Written by sonagi

May 10th, 2007 at 10:52 pm

Posted in blog,semantic web

Tagged with , ,

스킨 바꾸기

leave a comment

몇 번째인지 모르겠다. 직접 만들 능력은 없고 하나하나 만족스럽지 않은 부분 때문에 몇 번째인지 모르정도로 스킨을 바꾼다.

이번엔 마지막이려나? 글쎄?

학교 다닐 때 마음 다잡는다고 머리를 빡빡 깍는 친구들을 보면

괜히 머리 갖고 장난 치지 마라

그랬던 것이 갑자기 생각난다. 블로깅이나 잘하지 왜 자꾸 스킨 장난질인지..

본업에 충실해야 하는 걸..

Written by sonagi

April 12th, 2007 at 3:00 am

Posted in blog

Tagged with , ,

[미완성]블로그에서 태그는 없다. 2탄-블로그에서 태그 사용 현황

3 comments

며칠 동안 블로그에서 태그 사용에 대한 문제를 갖고 고민하고 있었습니다.
아직 결론에 도달하지 못했지만 재미있는 현상을 찾을 수 있었습니다. 이미 del.icio.us와 같은 folksonomy-dependent 사이트에서 이와 비슷한 현상이 보고 되었던 것으로 알고 있습니다.

올블로그 상반기 100 블로그에서 태그를 뽑아낼 수 있는 블로그를 기준으로 조사를 했습니다. 수치는 약간씩 다를 수 있습니다. 태그를 뽑아내는 것이 전적으로 해당 블로그의 지원 여부에 좌우되기 때문에. ㅜ.ㅜ 아직 공식적인 자료가 아니라서 해당 블로그의 주소는 삭제했습니다.

  • 포스트 당 태그 수 : 전체 태그수 / 전체 포스트 수
  • 상위 7 태그의 포스트 수 : 상위 7 태그가 사용된 포스트의 총합
  • 상위 7의 비율 : 상위7 태그의 포스트 수/ 전체 포스트 수

잘못 계산했을 수도 있으니 댓글 부탁드립니다. 이렇게 계산을 하면 하나의 포스트에 평균적으로 사용하는 태그는 1.7개정도 됩니다. 일반적으로 포스트를 작성할 때, 약 2개 정도 태그를 사용하다고 볼 수 있을 것 같네요.
그리고 상위 7 태그의 비율의 평균은 44% 정도됩니다. 비율이 낮은 블로그는 태그를 다양하게 사용하고 각각의 태그의 편차가 크지 않음을 나타냅니다. 근본적인 이유는,아마도 블로그에서 다루는 주제가 광범위하면 상위 7의 비율은 낮아집니다. 반대로 특정 주제를 중심으로 포스팅을 할 경우 상위 7 태그의 비율은 높아집니다. 태그의 수가 포스트 수를 상회하는 것은 하나의 포스트에 복수의 태그를 사용했을 경우 나타날 수 있습니다. 상위 7 태그의 평균치는 44%정도입니다. 블로그에서 태그를 사용할 때도 Power Law 법칙이 성립한다고 할 수 있을 것 같습니다(약간 다른 실험을 해 볼 생각입니다).

Power laws are observed in many subject areas, including physics, biology, geography, sociology, economics, and linguistics. Power laws are among the most frequent scaling laws that describe the scale invariance found in many natural phenomena

하지만, “블로그에서 태그는 없다“에서 말한 의문은 여전히 남아 있습니다. 위에 데이터는 100개의 블로그 중에서 30개에 해당되는 것이고, 그나마 태그나 태그 클라우드를 추출할 수 있는 것에 한정되어 있습니다. 대부분은 태터툴즈를 사용하고 있는 것도 큰 특징입니다. 네이버, WordPress가 있긴 하지만 소수입니다.
태터툴즈에서 제공하는 기능도 만족스럽진 않습니다. 천 개 정도의 태그. 그리고 평면적인 태그 클라우드, 많은 분들이 비주얼한 태그 클라우드 플러그인을 개발하고 있는 것이 다행스러운 일이긴 합니다.

일반적인 현상은 볼 수 있었던 것 같습니다. 이것저것 해 볼 생각인데 의견 주시면 감사 :)

Prision Break, Season 2, Episode 13 기다리는 중…………………………….

Written by sonagi

November 27th, 2006 at 8:46 am

Posted in blog

Tagged with

스팸. 어찌하오리까

leave a comment

낚시성 제목을 붙였습니다.

한국에 다녀온 한 달 동안 관리하지 않은 결과, 댓글이 2000여건이  올라와 있습니다. 물론 대부분이 스팸으로 여겨집니다.

문제는 moderation 메뉴를 클릭해도 내용이 나오지 않습니다. 너무 많아서인지.

어떻게 댓글을 열어 해결할 수 있을지 모르겠네요. 알고 계신 분 도움 부탁드립니다.

댓글대신 메일 부탁드립니다. sonagi.kim at gmail.com

Written by sonagi

November 7th, 2006 at 9:02 pm

Posted in blog

Tagged with

Tagcloud.com 신규서비스 중지

leave a comment

블로그에서 태그는 글을 구분하고(글쓴이) 탐색을 위한 기능(글쓴이, 읽는이)을 제공한다.
태그를 보편화시킨 서비스가 태그구름(TagCloud)일텐데, 대표적인 사이트인 www.tagcloud.com의 서비스가 중지된 상태이다. sonagi 블로그를 위한 테스트에선 적당하지 않아 적용하진 않았지만 영문 블로그에선 꽤나 유명했을텐데.

수익성의 문제로 시작한 것이 신규 서비스 중단이라는 결과를 낳은 것이 아닌지. 그런데 수익모델을 생각하면 답답하긴 하네요. 태그구름을 유료로 사용하긴 힘들겠죠. 대부분 블로그에서 이미 지원하고 있으니.

Written by sonagi

August 13th, 2006 at 10:43 pm

Posted in blog,web 2.0

Tagged with ,

태그와 온톨로지 놀이

one comment

가끔 Flickr에서 flickring을 합니다.
이 사진~ 저 사진 보고, 한가하면 거기에 붙어있는 태그들도 함께 봅니다.
태그라는 것이 직관적인 생각을 단어로 표현한 것이기 때문에 사람들이 하나의 사진을 보고 어떤 생각을 했는지 쉽게 알 수 있습니다.

사진의 제목과 생각할 수 있는 키워드가 비슷하다면 대부분 비슷한 태그가 만들어집니다.

그런데 전혀 엉뚱한 경우가 나올수도 있습니다. 오늘 제가 찾은 것은..다름 아닌 온톨로지입니다.

wood pile

제목은 “Wood pile”인데, 함께 있는 태그는 “art”, “drawing”, “paint” 등이 있습니다. 도무지 이 사진과 무슨 관계가 있는지 아리송하네요.

태그라는 것이 분명 사람의 주관적인 생각을 반영하고 기억하기 좋은 것은 장점입니다. 그런데 Social Software에서 태그를 만들 때(tagging) 각별한 주의가 있어야 하지 않을까 생각이 듭니다.

결국 태그/포크소노미(folksonomy)는 협업(collaboration)할 수 있는 기반이 되기 때문에 중요한 것이고, 이 특징으로 키워드와 구분할 수 있을테니까요.

그런데 어찌 보면 온톨로지를 추상화해서 그린 그림하고 비슷하긴 하네요. 고도의 추상화를 생각하고 “ontology”를 태그로 만들었을까요?

태그는 신중히! 태그는 낙서가 아니다.

Written by sonagi

May 8th, 2006 at 7:01 am

대한민국에게 DERI는 무엇인가?

2 comments

요즘은 계속 “?”만 던지게 됩니다. “?”를 남긴다는 것은 확신을 갖고 있지 않기 때문입니다.
확신이 있고 그것에 대한 비전이 있다면 물음표는 남기지 않을텐데요.

지난 1주일 동안 시맨틱 웹에 대한 논란(?)이 있었습니다. Holloblog님의 글에서 시작해서 제 글로 이어졌고 Channy님도 의견을 남겼습니다. 중간에 이경일님의 코멘트는 다양한 이슈를 던져주었습니다.

끝이 없는 논란일까요? 새로운 시작일까요? 일견 달라 보이지만 모두 웹의 발전에 대한 비전을 갖고 있고, 대한민국의 연구자와 시장이 함께 움직이길 희망하고 있습니다. 다만 의견의 차이는 “방향이 옳은지, 참여하는 사람이 비전을 갖고 있는지“에 있는 것 같습니다.

이경일님의 답변을 보면 마치 제가 4년 전에 다른 사람들에게 시맨틱 웹을 설명했던 모습을 떠올리게 됩니다. 확신에 차 있었고 분명히 핵심 기술일 것이라 의심하지 않았습니다. 물론 지금도 그 확신은 변하지 않았죠.

의견을 남겨 주신 분들도 광의의 비전에는 모두 동의하고 있을 것이라 생각합니다. 꼭 대립관계라고 할 수 도 없죠. 그런데 조금 더 솔직히 접근해 보죠. 시맨틱 웹을 연구하지 않는 분들이 보면 이 논란은 답이 없는 논란으로 비춰질 뿐일 것 같습니다. 왜 Holloblog님이 정책과 방향의 오류에 대해 언급했는지. 좀 더 솔직히 접근해 보았으면 합니다.
참고로 이경일님의 코멘트에 있듯이 저는 DERI(Digital Enterprise Research Institute) Galway에서 일하고 있습니다.
아마 이번 논란의 근원에는 DERI가 한국에 어떤 영향을 주고 있는지 부터 시작하는 것이 좋을 것 같습니다.

DERI international은 Galway, Innsbruck, Seoul, Stanford가 있습니다(홈페이지의 DERI Locations를 보세요). 적어도 현재까지. Galway와 Innsbruck은 처음부터 함께 시작했고, Seoul은 작년부터 참여했습니다. Stanford는 약간 성격이 다릅니다. 교환 프로그램이 있긴 하지만, Stanford에서 Galway나 Innsbruck으로 오는 경우는 드물죠.

DERI는 상당히 유기적인 협력 체제를 갖고 움직이고 있습니다. 서로 교환 프로그램을 이용해서 연구원이 자유롭게 움직일 수 있습니다. 이미 Seoul에도 몇 명의 연구원이 교환 프로그램을 통해 방문했습니다. 물론 서울에서도 Galway를 방문했죠. 제가 알기로 한국의 다른 연구자들이 DERI Seoul과는 별도로(?) 새로운 조직(DERI Korea, http://deri-korea.org)을 구성하는 것으로 알고 있습니다. DERI의 행정적인 측면인 제가 알고 있지 못하지만 적어도 연구소는 학교를 중심으로 하지 않았나 생각합니다. Innsbruck, Galway가 도시명이듯 Seoul도. 왜 DERI Korea라는 이름을 사용하지는 모르겠네요.
서로 다른 비전을 갖고 연구를 한다면 그것은 하등 문제가 될 것이 없습니다. 문제는 연구를 힘으로 정치력으로 생각하는 것이 문제가 되는게 아닌가 생각합니다. 연구자는 연구하면 됩니다. 누가 어떤 프로젝트를 하고, 어떤 그룹이 하고 그것은 전혀 문제가 될 것이 없습니다. 누가 하면 어떻습니까? 제대로 연구성과를 내고 그에 상응하는 힘을 갖는다면 옳은 것이 아닐까요?
누구는 되고, 누구는 안되고, “내가 하면 로멘스고 네가 하면 불륜이고”하는 정치적 농담이 연구분야에 있지 않았으면 합니다. 너무 순진한가요? 모두 알고 있는 사실을, 불가능한 사실을 혼자 바라고 있는지 모르겠습니다.

자, 이제 본론입니다. 본론은 아마도 짧게 끝내지 않을까 싶네요.

DERI! 상당히 좋은 연구소입니다. 제가 일하고 있는 것이 행운이라 느낄 만큼.
자유롭고 연구에 집중할 수 있는 분위기는 최고입니다.

그런데 내부 구성원이 천재들만 모여 있는 곳은 아닙니다. 우선 저부터 예외죠. 이곳의 장점은 자유와 협력에 있습니다. 생각을 자유롭게 할 수 있는 환경은 창의력을 높여주고, 공동으로 협력할 수 있는 것은 자신의 아이디어를 다른 사람의 그것과 결합하여 시너지 효과를 얻을 수 있게 해 줍니다. 거기에 확실한 리더가 있다는 것. 제가 Stefan이라 말하지만 여기 구성원 모두 Stefan을 존경합니다. 그의 생각과 리더로서의 자질에 대해 동의하고 있죠.
즉, DERI의 경쟁력은 세 가지 입니다(제가 본 Galway에 한정합니다. Innsbruck는 아직 못가봤습니다)

  • 확실한 리더
  • 체계적 연구 시스템
  • 전세계적인 협력 시스템

몇년 전 DERI에서 나오는 보고서는 “사실”이라 생각하고 무조건 다 읽어보고, 따라해 보려 했던 적이 있습니다. 때론 이해가 가지 않는 것이 많았는데, 지금에 와서 왜 그랬는지 이해할 수 있습니다. 여기도 수많은 시행착오가 있습니다. 그 시행착오는 다른 조직이나 기관과 협력을 통해서 해결하는 것이 협력 시스템의 장점이죠.

그럼 대한민국에게 DERI는 어떤 대상이 되어야 할까요? 당연히 협력 관계를 유지하면 좋겠지요. 그러나 DERI가 갖고 있는 조직문화와 협력에 대한 마인드를 이해하지 못하고 관계가 이루어진다면 얻을 수 있는 것은 많지 않을 것 같습니다.

우리나라가 갖고 있는 것이 대단한 것도 많지 않나요? 그것이 왜 세계적인 칭찬의 대상이 될 수 없는지 생각해 보게 됩니다. ‘니편, 내편’이란 것이 전세계라는 틀에서 보면 참 한심한 작태일 뿐입니다. 시맨틱 웹! 합리적인 방향으로 연구하면 되죠. 거기에 DERI라는 유명세를 지룃대로 이용하여 한국의 연구결과를 상품화하면 됩니다. DERI가 갖고 있는 것을 따라하는 수준을 넘어 대등한 관계로 연구를 하고, 결과는 최대한 DERI를 이용해 홍보하는 것이 최상의 전략이 아닐까 생각합니다.

언젠가는 한국에도 DERI 이상의 연구소가 생겨 전세계 연구자들이 끌어들일 수 있는 역량을 키워야 하지 않을까요?

웹을 연구하는 사람들이 하나로 모일 수 있다고 생각하진 않습니다. 그러나 공동체라는 마인드를 갖고 연구할 수 있지 않을까 생각해 봅니다.

Written by sonagi

May 4th, 2006 at 12:16 am

Web2.0 개인화 포털

leave a comment

RSS 기술을 이용한 개인화 포털이라고 하네요.
사이트에 가서 본 느낌은 여느 포털과 다르지 않다는 거네요. RSS 기술을 사용하는 것이 사용자에게 편리함을 제공하는지 우선 의문이 듭니다. 웹2.0의 바람을 타고 많은 변화가 일어나고 있지만, 정작 그 안에서 소외되는 느낌이 들기도 합니다.
기술이 발전할수록 사람이 편해지기 보다 더 배우고 활용해야 하는 노력을 남겨두는 것 같습니다.
피코디(http://www.pcodi.com)는 사용을 해 보고 평가를 해야 겠지요.
문득 웹 메일 계정에 있는 많은 기능들이 생각이 났습니다. 주소록, 임시저장함, 웹하드 등등. 이런 것들이 웹2.0이 아니어서 사용하지 않았을까요? 기술이 뒷받침하지 못해서였을까요?
결국은 모두 사람의 몫으로 돌아오는 것이 아닌지 모르겠습니다. 태그를 만드는 것도 기계 중심에서 사람 중심으로 옮겨왔듯이 기술의 최고봉에는 사람을 어떻게 움직이느냐가 있을 것 같은 생각을 했습니다.
당연한 것을 보고 엉뚱한 생각만 한 것 같네요.

Written by sonagi

April 13th, 2006 at 8:21 am

Posted in blog,web 2.0

Tagged with ,