ODP(Open Directory Project), 또는 Dmoz(directory.mozilla.org 에서 유래) 라 불리는 프로젝트는 WWW에 존재하는 웹사이트들을 volunteer 들의 수작업으로 categorize 시킨 것이다.

Dmoz는 이전에 RDF와 LDF(linked open data)에 관한 수업을 들을 때 빈번히 등장하는 키워드였지만 크게 관심이 가지 않았는데, 지난 27일, K대학의 한 연구실에서 ‘트위터를 이용한 검색어 추천’에 ODP를 활용했다고 하여 다시 찾아보게 되었다. (기업과제 발표였기 때문에 정확한 내용을 밝히기는 어렵다.)

생각해볼만한 이슈들

  1. 현재 웹의 성장 속도를 고려해봤을 때, volunteer들의 수작업만으로 과연 WWW의 디렉토리를 구성할 수 있을까?
    • ‘Volunteer의 수작업’이란, 곧 ‘집단지성’, 또는 ‘crowd sourcing’ 유사하다고도 볼 수 있다.
    • 그러나 유저들은 서비스를 위해 봉사해주지 않는다. SO처럼 뱃지나 점수제를 도입하거나, Foursquare처럼 gamification을 통한 재미를 주거나, 또는 MTurk처럼 금전적인 수익을 주는 등 유저에게 적절한 유인동기가 없으면 crowd는 움직여주지 않는다. (대표적인 예가 OSM이라고 생각함.)
    • 단적으로 2012년 7월 29일 현재, Dmoz에는 ‘한국 정치‘에 관한 사이트가 총 9개 등록되어 있다.
  2. 디렉토리는 어떤 의미에서 필요할까?
    • 구글은 2011년 7월을 기점으로 디렉토리 사용을 전면 폐기하였다.
    • 언제부턴가 디렉토리 가지(branch)를 타고 내려가는 것보다 검색이 편하다는 consensus가 형성되고 있는듯.1
    • 인간의 사고는 본디 수직적 구조(i.e., hierarchy)에 가까울까, 수평적 구조(i.e., network)에 가까울지 궁금.2
  3. 하나의 사이트는 반드시 하나의 카테고리에만 속해야할까?
    • Dmoz에 웹사이트를 등록하기 위해서는 다음과 같은 규칙을 따라야 한다:

      “You should submit your site to the single most appropriate category that is directly relevant to your site’s content.”

    • 단일 클래스 membership은 컴퓨터 파일시스템에서도 종종 지적되곤 하는 디렉토리 structure의 고질적인 문제.
    • 패턴인식 계에서도, fuzzy clustering/classification은 이미 오랫동안 고민되어 온 문제.
    • 웹사이트 뿐 아니라 단어 혹은 개념의 관계를 그릴 때도, 계층보다 네트워크가 효과적일 수 있겠다는 생각.3

Contents migrated from tistory on 2013-03-18, edited on 2013-03-28.

  1. 그렇다면, 디렉토리 구조는 어떤 경우에 유용할 수 있을까? 

  2. 관련서적: Jeff Hawkins, On Intelligence 

  3. 구글의 Knowledge Graph도 그러한 관점에서 출발된 것일 수 있겠다.