ODP(Open Directory Project, a.k.a. Dmoz)의 현재에 관하여
ODP(Open Directory Project), 또는 Dmoz(directory.mozilla.org 에서 유래) 라 불리는 프로젝트는 WWW에 존재하는 웹사이트들을 volunteer 들의 수작업으로 categorize 시킨 것이다.
Dmoz는 이전에 RDF와 LDF(linked open data)에 관한 수업을 들을 때 빈번히 등장하는 키워드였지만 크게 관심이 가지 않았는데, 지난 27일, K대학의 한 연구실에서 ‘트위터를 이용한 검색어 추천’에 ODP를 활용했다고 하여 다시 찾아보게 되었다. (기업과제 발표였기 때문에 정확한 내용을 밝히기는 어렵다.)
생각해볼만한 이슈들
- 현재 웹의 성장 속도를 고려해봤을 때, volunteer들의 수작업만으로 과연 WWW의 디렉토리를 구성할 수 있을까?
- ‘Volunteer의 수작업’이란, 곧 ‘집단지성’, 또는 ‘crowd sourcing’ 유사하다고도 볼 수 있다.
- 그러나 유저들은 서비스를 위해 봉사해주지 않는다. SO처럼 뱃지나 점수제를 도입하거나, Foursquare처럼 gamification을 통한 재미를 주거나, 또는 MTurk처럼 금전적인 수익을 주는 등 유저에게 적절한 유인동기가 없으면 crowd는 움직여주지 않는다. (대표적인 예가 OSM이라고 생각함.)
- 단적으로 2012년 7월 29일 현재, Dmoz에는 ‘한국 정치‘에 관한 사이트가 총 9개 등록되어 있다.
- 디렉토리는 어떤 의미에서 필요할까?
- 구글은 2011년 7월을 기점으로 디렉토리 사용을 전면 폐기하였다.
- 언제부턴가 디렉토리 가지(branch)를 타고 내려가는 것보다 검색이 편하다는 consensus가 형성되고 있는듯.1
- 인간의 사고는 본디 수직적 구조(i.e., hierarchy)에 가까울까, 수평적 구조(i.e., network)에 가까울지 궁금.2
- 하나의 사이트는 반드시 하나의 카테고리에만 속해야할까?
Dmoz에 웹사이트를 등록하기 위해서는 다음과 같은 규칙을 따라야 한다:
“You should submit your site to the single most appropriate category that is directly relevant to your site’s content.”
- 단일 클래스 membership은 컴퓨터 파일시스템에서도 종종 지적되곤 하는 디렉토리 structure의 고질적인 문제.
- 패턴인식 계에서도, fuzzy clustering/classification은 이미 오랫동안 고민되어 온 문제.
- 웹사이트 뿐 아니라 단어 혹은 개념의 관계를 그릴 때도, 계층보다 네트워크가 효과적일 수 있겠다는 생각.3
Contents migrated from tistory on 2013-03-18, edited on 2013-03-28.
그렇다면, 디렉토리 구조는 어떤 경우에 유용할 수 있을까? ↩
구글의 Knowledge Graph도 그러한 관점에서 출발된 것일 수 있겠다. ↩