엔터프라이즈

미 국회 도서관 1,700억 트윗 수집, 133TB 데이터 관리툴 찾아


  • 박지호

    • 기사
    • 프린트하기
    • 크게
    • 작게

    입력 : 2013-01-14 11:14:01

    미국 국회 도서관이 트위터의 '트윗'을 모아 검색할 수 있도록 할 계획이다. 현재까지 수집한 트윗 수만 1,700억 건에 달한다. 이 계획은 현재 한 가지 어려움에 부닥친 상태다. 방대한 자료를 관리할 적절한 빅 데이터 관리 툴을 찾지 못한 것.

     

    도서관은 컴퓨팅과 병렬 컴퓨팅도 생각해봤지만, 공공기간이 감당하기 부담스러운 비용 탓에 다른 방법을 모색한다는 내용이다. 이러한 어려움에도 불구하고 데이터 수집에 나선 이유는 “현재는 SNS 데이터 역시 책과 같은 가치를 가졌기 때문이다.”고 설명한다.

     

    이를 접한 업계의 반응은 뜨겁다. 미국 국회 도서관이 말한 내용을 보면, 현재 데이터 열람 요청만 400건을 넘긴 상황이다.

     

    앞으로 도서관은 새로운 트윗을 시간 단위로 수집할 계획이다. 2011년 2월 기준으로 하루 평균 트윗은 약 1억 4,000건 정도 된다. 지금까지 수집된 트윗의 용량은 133.2TB를 기록하고 있다.




    베타뉴스 박지호 ()
    Copyrights ⓒ BetaNews.net