<ul id="g60s4"><pre id="g60s4"></pre></ul>
<strong id="g60s4"><nav id="g60s4"></nav></strong>
<ul id="g60s4"></ul>
  • <tr id="g60s4"></tr>
  • 
    
  • 或者

    Google PageRank專利和李彥宏超鏈分析專利的區別

    作者:月光邊境 瀏覽:215 發布時間:2017-06-01
    分享 評論 0

    超鏈分析和PageRank的專利問題,才第一次知道百度總裁李彥宏曾經申請并獲得對于超鏈接分析的專利,我們姑且稱之為超鏈分析專利。而這個專利申請是在Google申請他們自己的PageRank專利之前。

      我以前對中文搜索引擎沒什么認識,真是孤陋寡聞。看到這篇文章,直覺是如果這兩個專利是相似的或有抄襲嫌疑,這牽扯到兩家公司的核心利益。對我這樣的搜索引擎優化人員來說,也能從中了解百度算法的一些內幕。所以馬上去看了李彥宏的專利申請,并再次閱讀了Google PR的專利申請。

      我的理解是,這兩個專利申請的區別在于,他們談的根本就是兩回事。要解決的問題和實施方法都不一樣,雖然研究對象是一樣的,都是鏈接。

      超鏈分析要解決的是文件與搜索關鍵詞的相關性。李彥宏提出的方法是,除了文件本身對關鍵詞的引用外,還需要考慮反向鏈接中的關鍵詞。

      具體來說,一個文件被索引進數據庫的時候,會連同指向這個文件的超鏈接,以及每個超鏈接當中使用的錨文字(鏈接文字),一同記錄在案。而搜索詞也會建立一個數據庫,每個詞連同含有這個詞的超鏈接,以及這些超鏈接所指向的文件一同被記錄在案。

      當一個關鍵詞被搜索的時候,含有以關鍵詞為鏈接文字的反向鏈接數目最多的那個文件或網頁,將被作為最相關的結果排在前面。

      這是基本思路,當然還有其他變量考慮進去。比如說搜索字符串含有幾個詞的時候,每一個詞都是搜索矢量的一個維度。

      我比較感興趣的是,在這篇專利申請中已經提到了詞干技術,而且提到了不同文字文件的相關性。

      而Google的PR專利顯然是專注在已經應用了超鏈分析之后還不能解決的問題。在Google的專利申請中,明確提到即使在考慮了指向文件的鏈接及鏈接錨文字之后,搜索引擎還有重要問題需要解決,那就是來自不同文件的鏈接有不同的權重值。

      你不能指望來自白宮網站的鏈接和非洲某小鎮上一個學生的個人網站上的一個鏈接,投票值相同。而Google PageRank就是衡量網頁重要性的一個方法。指向一個網頁的鏈接越多,而這些鏈接本身的權重越高,那么這個被指向的網頁的重要性及PageRank就越高。

      Google的專利申請當中給出了具體怎樣計算這一重要性指標,他們取名為網頁級別。網頁級別的計算需要進行多個循環的替代計算,才能得到近似于最終結果的PR值。

      Google PR是與搜索詞無關的,或者說與文件相關性無關的。它只描述某一個文件的重要性或地位。

      就目前所有搜索引擎的表現來看,可以肯定這兩個技術都已經被應用在排名算法中了,雖然可能名字不一樣。尤其明顯的是,雖然Google一直以PR為旗號,很少介紹它們的其他技術。但近一兩年來, Google算法中對鏈接分析,錨文字分析,詞干技術的重視越來越多。

    国产亚洲精品国产| 国产精品亚洲片夜色在线| 99精品视频在线观看re| 亚洲系列国产精品制服丝袜第| 国产精品va在线观看手机版| 亚洲午夜国产精品无码老牛影视| 国产精品欧美成人| 最新国产乱人伦偷精品免费网站| 日本精品视频在线观看| 久久国产精品免费网站| 国产精品国产三级国产AV麻豆| 亚洲av永久无码精品天堂久久| 精品国产日韩久久亚洲| 亚洲爆乳精品无码一区二区三区| 精品久久久久久无码人妻| 久久久精品免费国产四虎| 国产精品一区二区久久沈樵| 国产精品专区第二| 99re热久久精品这里都是精品| www.日韩av.com| 亚洲精品无码鲁网中文电影| 久久国产精品偷99| 国产精品高清全国免费观看| 久久国产乱子免费精品| 国产日韩一区二区三区在线播放| 国产产在线精品亚洲AAVV| 久久久久久精品久久久久| 青青草国产精品视频| 91精品国产网曝事件门| 香蕉在线精品一区二区| 欧美交A欧美精品喷水| 奇米精品一区二区三区在线观看| 精品免费久久久久国产一区| 久久精品女人天堂AV| 国产精品禁18久久久夂久| 国语自产拍精品香蕉在线播放| 日韩精品成人一区二区三区| 亚洲国产日产无码精品| 2019国产精品| 精品国产一区二区三区不卡 | 亚洲精品线在线观看|