'pagerank'에 해당되는 글 1건

  1. 2009.06.03 구글 성공 만든 핵심 병기 페이지랭크 (13)
posted by 도이모이 2009. 6. 3. 08:30
며칠 전 국내 유명 블로거들의 구글 페이지랭크 (PageRank)가 변경 되어 블로거들 사이에서 페이지랭크에 대한 관심이 증폭 되었다. 구글의 핵심 기술이자 세계 1위 검색 사이트로 만든 가장 강력한 무기인 페이지랭크에 대해 알아보자.
 
 래리 페이지와 세르게이브린이 구글을 창업 한 1998년도만 해도 인터넷 검색의 최고 강자는 알타비스타 (Altavista)였다. 1위 포탈 사이트인 야후도 알타비스타의 기술을 빌려다 사용하고 있었다. 당시 다른 검색 사이트와 마찬가지로 알타비스타도 페이지 내의 글을 가지고만 검색 결과에 나타나는 순위 정했다. 알타비스타는 대략 다음과 같은 방법으로 웹페이지를 평가 한 다음에 점수를 부여 해 검색 결과 순위를 결정했다.
 
  • 제목에 해당 단어가 있으면 가중치가 붙는다
  • 굵게 처리 된 부분에 해당 단어가 있으면 가중치가 붙는다
  • 일반명사나 조사와 같은 평범한 단어가 아니라 특이한 단어가 일치 되면 가중치가 붙는다.
  • 검색 하려는 단어가 페이지 내에 가까이 붙어 있으면 가중치가 붙는다
  • 검색 하려는 단어가 여러 번 중복 되어 있으면 가중치가 붙는다
 
 실제 알타비스타의 검색 공식은 위에 것보다 복잡했지만 모두 페이지 내용을 보고 경중을 따지는 방식이기 때문에 내가 만든 웹페이지를 알타비스타 검색 결과 상위에 노출 하려고 하면 위에 규칙만 따라 웹페이지를 작성하면 되었다. 따라서 알타비스타는 아무런 내용 없이 이런 규칙만을 따라 만든 사이트가 검색 결과 상위에 배치 되는 문제로 큰 골치에 빠져 있었다.

 이때 구글은 페이지랭크라는 기술을 들고 나와 패러다임을 바꾸었다. 페이지랭크는 다른 웹페이지에 링크가 많이 걸려 있을수록 가치 있는 웹페이지로 인정 해 검색 결과 상위에 배치 준다. 페이지랭크는 구글 창업자인 래리 페이지와 세르게이브린 두 사람이 스탠포드 대학 시절 연구 논문을 작성하면서 아이디어를 얻었다. 많이 참조 된 논문이 가치 있는 논문이라는 학계의 오랜 정설을 따르고 있다.

페이지랭크의 가장 큰 장점은 다른 웹페이지와의 관계로 가치를 평가하기 때문에 혼자서 조작이 힘들다는 것이다. 여러 사람들이 연합 해 조작하는 것을 막기 위해 다양한 장치를 두었다는 특징도 있다.

  • 모든 페이지는 0~10까지 페이지랭크 값을 가진다. (신뢰성이 적은 사이트는 0, 높은 사이트는 10이다)
  • 모든 페이지는 링크를 걸면 해당 사이트에 페이지랭크를 부여해 준다 (다른 사이트로부터 링크가 많이 걸리면 내 페이지의 페이지랭크가 올라간다)
  • 내가 링크를 걸 때마다 링크가 걸린 사이트는 페이지랭크를 나눠서 부여 받는다 (예: 내 페이지 랭크가 10이며 내가 2군데로 링크를 걸어 주면 상대방은 각각 5만큼 페이지랭크를 부여 받는다. 따라서 페이지랭크를 높이기 위해 링크를 남발하거나 페이지랭크가 낮은 사이트로부터 링크가 되는 것은 도움이 되지 않는다)
조작이 어려운 페이지랭크의 특성으로 인해 경쟁자들이 악의적인 스팸 페이지로 고생 할 때 구글은 안전 할 수 있었다.

페이지랭크는 창업자들이 스탠포드 대학원 시절 발표 한 '대규모 하이퍼텍스트 웹 검색엔진의 해부', The Anatomy of a Large-Scale Hypertextual Web Search Engine)'을 기반으로 하고 있고 특허 권리는 스탠포드 대학에 있다.

연구자의 권리를 인정 해 페이지랭크 기술은 2010년까지 구글만 사용 할 수 있다. 구글을 만든 핵심 경쟁력 무기인 페이지랭크가 내년이면 다른 사업자도 사용 할 수 있게 된다. 구글이 계속적인 경쟁력을 유지 할 수 있을지 궁금해지는 대목이다.

트위터 주소: http://twitter.com/doimoi

댓글을 달아 주세요

  1. Favicon of http://www.39flower.kr BlogIcon 꽃집아재 2009.06.03 16:12  Addr  Edit/Del  Reply

    전혀 모르고 있던 정보 고맙게 잘 보았습니다.
    앞으로도 좋은 포스팅 부탁드립니다.

    • Favicon of http://www.doimoi.net BlogIcon 도이모이 2009.06.09 08:24  Addr  Edit/Del

      감사합니다~ 페이지랭크 가치에 대해 정리해 보았는데 잘 쓴글 같나요? ㅋㅋ

  2. Favicon of http://mahabanya.com BlogIcon mahabanya 2009.06.03 19:52  Addr  Edit/Del  Reply

    구글에서 기술 독점권이 해제되어도 그 사이에 쌓아놓은 각종 기술의 장벽(페이지 랭크도 대략적인 컨셉과 예측이 있을 분 핵심 알고리즘이 완전히 공개되지는 않았으니)이 있어서 쉽게 권좌에서 내리긴 힘들 것 같습니다.

    • Favicon of http://www.doimoi.net BlogIcon 도이모이 2009.06.09 08:26  Addr  Edit/Del

      페이지랭크의 중요도가 과거에 비해 많이 줄어 든 것으로 알고 있습니다. 검색 알고리즘은 계속 발전 되기 때문에 페이지랭크도 알로리즘 중 하나로 전락한 것이죠. 함수가 1억개가 넘는다는 소문이 있을 정도니.. 말씀하신 것처럼 페이지랭크가 없어도 한동안 1위를 유지 할 거 같긴 해요 ^^

  3. Favicon of http://logfile.tistory.com BlogIcon 와이엇 2009.06.03 20:13  Addr  Edit/Del  Reply

    페이지 랭크 독점 권리가 없어져도 구글의 경쟁력이 워낙 강하기 때문에 문제 없으리라 생각하네요. 요즘 바쁘신가 봐요. 시리즈 3편은 언제 볼수 있나요. 계속 기다리고 있는데... ^^

    • Favicon of http://www.doimoi.net BlogIcon 도이모이 2009.06.09 08:28  Addr  Edit/Del

      빨리 써야 하는데 회사를 옮긴 다음에 바빠서 빨리 못 쓰네요. 와이엇님 기대를 실망시켜 드리지 않아야 하는데.. ^^

    • Favicon of http://logfile.tistory.com BlogIcon 와이엇 2009.06.09 12:44  Addr  Edit/Del

      일이 많으신가봐요. 천천히 하세요. 괜히 저 때문에 고생하시지 마시구요. ^^

  4. Favicon of http://www.ahura.co.kr BlogIcon 아후라 2009.06.04 08:02  Addr  Edit/Del  Reply

    이전 "알타비스타의 분석"부분을 읽으니.. 감회가 새롭네요.
    처음으로 홈페이지를 만들어 주었던 "이삿짐센터"홈페이지를
    위와 같은 검색가중치를 이용해서 알타비스타에서 항상 1위를 유지하곤 했습니다. ^^
    벌써 10년이 다되어 가네요.
    좋은 정보 감사합니다.

    • Favicon of http://www.doimoi.net BlogIcon 도이모이 2009.06.09 08:30  Addr  Edit/Del

      알타비스타가 하루 아침에 몰락할줄은 몰랐어요. 구글이 이렇게 빨리 성장 할지는 몰랐고요. 90년 후반과와 2000년대 초반의 인터넷 세상은 정말 천지개벽+별천지였던거 같아요 ^^

  5. eeko 2009.11.18 22:35  Addr  Edit/Del  Reply

    감사합니다

  6. wjdgnskd 2009.11.18 22:36  Addr  Edit/Del  Reply

    덕분에 살았습니다

  7. Favicon of http://www.unny.com BlogIcon montreal florist 2010.03.25 05:18  Addr  Edit/Del  Reply

    다른 사이트도 이제는 사용할 수 있게 됬군여, 그 사실은 몰랐네여

  8. 2010.03.26 07:04  Addr  Edit/Del  Reply

    비밀댓글입니다