PageRank算法
作者:紫色年華
瀏覽:1682次
發布時間:2017-04-19




在諸如Google一類搜索引擎中使用PageRank(PR值)來量化網站的排名,PageRank是一系列算法,能對每個網頁給出一個數值,表示網頁在互聯網中的重要性[5] 。PageRank的具體細節還沒有公開,該算法最早出現在其創始人的一篇論文中,是利用頁面相關性得分(RelevancyScore)+頁面等級得分(PageRank)來決定頁面的相關性與重要性。該算法首先找到所有與查詢關鍵詞相匹配的網頁,然后根據頁面因素等進行排名,最后通過PageRank得分調整網站排名結果[5] 。 假設網頁A有網頁t1,t2,····,tn的鏈接指向它,則PageRank的原始公式為:PR(A)=(1-d)+d(PR(t1)/C(t1)+····+PR(tn)/C(tn))其中d為阻尼系數(dampingfactor),一般設為0.85;PR(A)是網頁A的網頁級別 (PageRank);C(tn)是網頁tn的指向外部鏈接的總數量。公式可描述為:A網頁的PR值等于鏈向該頁面的所有鏈接頁面的PR值分別除以各自的外部鏈接數量的總和,再加上(1-d)。