'크기'에 해당되는 글 1건

  1. 2008.09.16 인터넷 크기 얼마나 될까? (6)
posted by 도이모이 2008. 9. 16. 08:30

사용자 삽입 이미지
흔히 무한 한 숫자를 이야기 할 때 '천문학적인 숫자'라는 표현을 사용한다. 하지만, 조만간 '인터넷적인 숫자'라고 이야기 해야 할지도 모르겠다. 구글이 수집 한 인터넷 페이지가 1조 페이지를 돌파 했기 때문이다. 이는 은하수에 떠 있는 별보다 2배나 많은 숫자이다. 인터넷 페이지가 폭발적으로 늘어나고 있다. 하지만, 이것이 우리에게 더욱 더 많은 정보를 줄지 그렇지 않은지는 아무도 모른다.

일반적으로 구글과 같은 검색 사이트는 링크를 따라 다니며 새로운 문서를 수집한다. 수집 된 문서는 불필요한 부분을 제거 한 후 데이타베이스에 보관하고 있다가 사용자가 검색을 하면 자기들만의 수학적 공식을 이용 해 순서대로 보여 준다
.

90
년대 후반까지만 해도 검색 엔진들은 수집한 웹페이지 양을 가지고 치열하게 경쟁하며 신경전을 벌였다. 빠르게 인터넷 사이트를 돌아 다니며 더 많은 문서를 수집하는 것이 최고 경쟁력이라고 생각했기 때문이다. 수집 결과는 실제보다 크게 부풀려 공개하거나 반대로 전혀 공개를 하지 않았다. 지금처럼 제3의 기관에서 객관적인 데이타를 제공 하는 곳도 없어 미심적인 부분이 있어도 그냥 믿는 수 밖에 없었다. 특히, 당시 1위 검색 사이트였던 알타비스타가 이런 분위기를 조장했다. 알타비스타는 서버용 칩을 제조하던 DEC (
Digital Equipment Corporation) 에서 알파칩의 성능을 홍보하기 위해 만든 사이트였다. 당시만 해도 무한 해 보이던 인터넷 페이지를 빠르게 수집 한 후 검색 창에 검색 결과를 빠르게 보여 주는 것이 그들이 가진 서버 칩의 우수성을 홍보하는 길이라고 생각했기 때문이다. 홍보의 효과를 높이기 위해 알타비스타는 http://altavista.digital.com 라는 DEC 의 서브 도메인을 사용했다. ( 알타비스타 성공 이후 오랜 시간이 흐른 후 거액을 주고 도메인을 구입 했다)
사용자 삽입 이미지

하지만, 2000년도가 되자 인터넷이 대중화 되면서 급격하게 페이지가 늘어나자 이들 사이트는 당황하기 시작했다. 늘어 난 페이지로 효과적으로 다루지 못해 만족 할 만한 검색 결과를 보여 주지 못 했다. 이 때 혜성처럼 등장 해 스타로 떠오른 사이트가 구글이었다. 구글은 페이지랭크라는 기법을 사용 해 다른 사이트로부터 링크가 많으면 믿을 수 있는 사이트라고 생각 해 상단에 검색 결과를 보여 주었다. 이는 사용자에게 매우 큰 호응을 얻어 현재의 구글을 만들었다.

현재 인터넷의 폭발은 구글이 처음 설계 되면서 예측하던 규모를 벗어나고 있다. 구글 조차도 색인을 시작한지 불과 10년만에 1조 페이지가 넘은 것에 놀라워하고 있다. 최근에는 불필요한 문서를 모두 제거하고 순수 색인하는 페이지만 하루 70억 페이지가 된다고 한다. 90 년대 후반 알타비스타들이 몇 년간 모았던 페이지의 70배 이상의 페이지가 매일 같이 만들어지고 있으며 이 속도는 점점 빨라지고 있다.

하루가 다르게 늘어나는 인터넷 페이지를 언제까지 구글이 효과적으로 검색 할 수 있을지는 아무도 모른다. 이미 구글이 주력하는 분야는 검색 품질 향상 보다는 스팸과의 전쟁이다. 너무나 방대 해 진 규모 때문에 획기적인 검색 기법을 도입 할 가능성도 적다. 앞으로, 개인화 검색을 강화하거나 시멘틱웹 업체 중 가시적인 성과를 보이는 업체를 인수 해 해당 기술을 흡수 하는 정도 일 것이다
.

하지만, 구글이 어떤 노력을 하던 점차 빨라지는 인터넷의 폭발을 계속적으로 흡수하기는 힘들 것이다. 특히, 인터넷 세상을 오염시키는 스팸, 펌질, 불건전 한 정보들이 난무 하면 할 수록 90년대 후반 검색 엔진 무용론이 나온 것처럼 가까운 시기에 구글 무용론이 나올 수 도 있다. 검색이 쓸모가 없어진다는 뜻은 인터넷에서 아무 정보도 찾을 수 없다는 뜻이고 이는 정보가 하나도 없는 인터넷 세상과 다를 바 없다.


트위터 주소: http://twitter.com/doimoi

댓글을 달아 주세요

  1. Favicon of http://digitalfish.tistory.com BlogIcon 넷물고기 2008.09.16 23:05  Addr  Edit/Del  Reply

    구글은, 어디까지 확장될지 모르겠네요. 세계는 부시소유가 아니라 구글소유라던데.. 그리고 추석 잘 세셨씅가요 ?, (그, 어디선가 조과장님의 사진을 봤죠. 블로그였던것 같은데, 한 몇년전에 찍은듯한. 머리가 좀 길어서 양갈래로 .. 어디서봤드라 ㅎㅎ)

    • Favicon of http://doimoi.net BlogIcon doimoi 2008.09.17 12:57  Addr  Edit/Del

      ㅋㅋㅋ 전자신문으로 보내지는 과거 사진 보고 이야기 하시는군요. 좀 오래 된 사진이죠? (독자 우롱이라는 말도 있던데.. )

  2. Favicon of http://kr.geek2live.org BlogIcon mjjin 2008.09.17 02:07  Addr  Edit/Del  Reply

    '구글이 어떤 노력을 하던 점차 빨라지는 인터넷의 폭발을 계속적으로 흡수하기는 힘들 것이다. 특히, 인터넷 세상을 오염시키는 스팸, 펌질, 불건전 한 정보들이 난무 하면 할 수록 90년대 후반 검색 엔진 무용론이 나온 것처럼 가까운 시기에 구글 무용론이 나올 수 도 있다. 검색이 쓸모가 없어진다는 뜻은 인터넷에서 아무 정보도 찾을 수 없다는 뜻이고 이는 정보가 하나도 없는 인터넷 세상과 다를 바 없다.'

    - 좀 이해하기 어려운 부분인데요... 그렇게 되리라고 비관적으로 생각하고 싶진 않습니다. 왜냐하면 구글의 알로리듬을 너무나 좋아하기에..:)

    • Favicon of http://doimoi.net BlogIcon doimoi 2008.09.17 13:01  Addr  Edit/Del

      전문가이신 민지님이 이의를 제기하시는 긴장 되네요.

      제가 미래를 예측하는 글을 가끔 쓰는데, 기본적으로 미래는 아무도 모릅니다. 인터넷의 미래와 구글의 미래도 아무도 알수 없자나요.

      다만, 제 생각으로는 지금 인터넷의 팽창 속도가 더욱 빨라지고 있어, 구글이 계속 알고리즘을 보정 한다고 해도 계속 지금과 같은 만족도를 줄 수 있을지는 좀 비관적입니다.

      이럴 경우 정말 정보 제앙이 올 수 있다는 것을 이야기 하고 싶었던 것 뿐이에요. ^^

  3. 헑... 2009.01.05 23:18  Addr  Edit/Del  Reply

    그러면 종이로 1조 페이지나 된다는 거네? 아무리 그래도 한 내용에 1페이지 이상인게 많을테니 적어도 3조~5조페이지쯤 될거 같다는 생각이

    • Favicon of http://www.doimoi.net BlogIcon doimoi 2009.01.08 07:57  Addr  Edit/Del

      저는 이 글 쓰면서 생각보다 인터넷 작네? 라는 생각을 했습니다. 숫자 개념의 크게 영향을 미치는 것이 돈이자나요. 우리나라는 다른 나라와 다르게 화폐 단위가 매우 크자나요. 일반인들도 아파트 사기 위해서는 수십억이 있어야 한다고 이야기 할 정도로 단위가 매우 크자나요. 근데, 달러와 엔화들은 모두 우리보다 1/1000 정도 단위가 적자나요.

      삼성전자 매출액이 수십조가 된다는 뉴스를 자주 듣는 우리들에게는 1조라는 것이 그렇게 큰 숫자로 느켜지지 않는거 같습니다 ^^