<ul id="g60s4"><pre id="g60s4"></pre></ul>
<strong id="g60s4"><nav id="g60s4"></nav></strong>
<ul id="g60s4"></ul>
  • <tr id="g60s4"></tr>
  • 
    
  • 或者

    搜索引擎技術揭密:排序技術

    作者:小雞燉蘑菇 瀏覽:135 發布時間:2018-05-19
    分享 評論 0

        隨著"眼球經濟"席卷互聯網,成千上萬的資金迅速流向最能吸引瀏覽著眼球的搜索引擎市場.有大量調查顯示搜索引擎市場正處在高速發展時期,成為了未來幾年內最具發展潛力的產業之一.隨著Google、百度、中國搜索等各具特色的搜索引擎逐漸成為人們最常用的網絡工具,企業對搜索引擎的注意力也從"觀察"升級為"動武".


        隨著市場容量和使用者人數的不斷激增,如何完善搜索功能使之更加公平、公開、標準和人性化也就隨之成為了一個備受關注的話題.但是有一個矛盾體在這其中不斷的顯現出來:收費可以為搜索引擎公司帶來利潤,但同時會降低訪問者的體驗滿意度.如何權衡金錢和用戶需求之間的天平呢?


        Google成功的秘密


        到2004年為止,Google 已經連續兩年被評為全球第一品牌,Google成立僅五年時間,最初只是兩個斯坦福大學學生的研究項目.這不能不說是一個奇跡,就像比爾?蓋茨創制奇跡一樣.比爾?蓋茨能創造奇跡,是因為他看準了個人計算機軟件市場的趨勢,所以創建的公司叫Microsoft(微軟):Micro(小)Soft(軟件). 那么Google呢?在Google出來之前已經有一些很有成就的搜索引擎公司,其實力也很強,看來不只是Google看見了搜索的趨勢.Google究竟成功的秘密在哪兒?


        Google的成功有許多因素,最重要的是Google對搜索結果的排序比其它搜索引擎都要好.Google保證讓絕大部分用搜索的人,都能在搜索結果的第一頁找到他想要的結果.客戶得到了滿足,下一次還過來,而且會向其他人介紹,這一來一往,使用的人就多了.所以Google在沒有做任何廣告的前提下,讓自己成為了全球最大的品牌.Google究竟采用了哪種排序技術?PageRank,即網頁級別.


        Google有一個創始人叫Larry Page,據說PageRank的專利是他申請的,于是依據他的名字就有了Page Rank.國內也有一家很成功的搜索引擎公司,叫百度.百度的創始人李彥宏說,早在1996年他就申請了名為超鏈分析的專利,PageRank的原理和超鏈分析的原理是一樣的,而且PageRank目前還在Paten-pending(專利申請中).言下之意是這里面存在專利所有權的問題.這里不討論專利所有權,只是從中可看出,成功搜索引擎的排序技術,就其原理上來說都差不多,那就是鏈接分析.超鏈分析和PageRank都屬于鏈接分析.


        鏈接分析到底為何物?由于李彥宏的超鏈分析沒有具體的介紹,筆者唯一看過的就是在美國專利局網站上關于李彥宏的專利介紹.PageRank的介紹倒是不少,而且目前Google畢竟是全球最大的搜索引擎,這里以PageRank為代表,詳細介紹鏈接分析的原理.


        PageRank揭密


        PageRank的原理類似于科技論文中的引用機制:誰的論文被引用次數多,誰就是權威.說的更白話一點:張三在談話中提到了張曼玉,李四在談話中也提到張曼玉,王五在談話中還提到張曼玉,這就說明張曼玉一定是很有名的人.在互聯網上,鏈接就相當于"引用",在B網頁中鏈接了A,相當于B在談話時提到了A,如果在C、D、E、F中都鏈接了A,那么說明A網頁是最重要的,A網頁的PageRank值也就最高.


        如何計算PageRank值有一個簡單的公式:


        其中:系數為一個大于0,小于1的數.一般設置為.網頁1、網頁2至網頁N表示所有鏈接指向A的網頁.


        由以上公式可以看出三點:


        1、鏈接指向A的網頁越多,A的級別越高.即A的級別和指向A的網頁個數成正比,在公式中表示,N越大, A的級別越高;


        2、鏈接指向A的網頁,其網頁級別越高, A的級別也越高.即A的級別和指向A的網頁自己的網頁級別成正比,在公式中表示,網頁N級別越高, A的級別也越高;


        3、鏈接指向A的網頁,其鏈出的個數越多,A的級別越低.即A的級別和指向A的網頁自己的網頁鏈出個數成反比,在公式中現實,網頁N鏈出個數越多,A的級別越低.


        每個網頁有一個PageRank值,這樣形成一個巨大的方程組,對這個方程組求解,就能得到每個網頁的PageRank值.互聯網上有上百億個網頁,那么這個方程組就有上百億個未知數,這個方程雖然是有解,但計算畢竟太復雜了,不可能把這所有的頁面放在一起去求解的.對具體的計算方法有興趣的朋友可以去參考一些數值計算方面的書.


        總之,PageRank有效地利用了互聯網所擁有的龐大鏈接構造的特性. 從網頁A導向網頁B的鏈接,用Google創始人的話講,是頁面A對頁面B的支持投票,Google根據這個投票數來判斷頁面的重要性,但Google除了看投票數(鏈接數)以外,對投票者(鏈接的頁面)也進行分析.「重要性」高的頁面所投的票的評價會更高,因為接受這個投票頁面會被理解為「重要的物品」.從新浪、雅虎、微軟的首頁都有我網頁的三個鏈接的話,可能比我在其他網站找三十個鏈接還強.如果還有人不理解這個原理,就去想想有句成語叫:三人成虎.如果有三個人都說北京大街上有老虎,那么許多人會認為有老虎,如果這三個人都是國家領導人的話,那么所有人都會認為北京大街上有老虎.


        每個網頁都會有PageRank值,如果大家想知道自己網站的網頁PageRank值是多少,最簡單的辦法就是下載一個Google的免費工具欄


        每當你打開一個網頁,都可以很清楚的看見此網頁的PageRank值.當然這個值是一個大概數字.


        據Google技術負責人介紹,Google除了用PageRank衡量網頁的重要程度以外,還有其它上百種因素來參與排序.其它搜索引擎也是如此,不可能按照某一種規則來進行搜索結果的排序.


    国精产品一品二品国精品69xx| 老司机在线精品视频| 黑人无码精品又粗又大又长| 日韩精品国产自在久久现线拍| 欧洲国产成人精品91铁牛tv| 2020国产精品永久在线| 久久99国产综合精品免费| 亚洲AV无码成人网站久久精品大| 最新国产在线精品观看| 一区二区国产精品 | 久久亚洲精品11p| 99香蕉国产精品偷在线观看| 亚洲中文久久精品无码1| 一本久久a久久精品综合夜夜| 国产精品区一区二区三在线播放 | 久热中文字幕在线精品免费| 97精品视频在线观看| 久久丫精品国产亚洲av不卡| 午夜不卡久久精品无码免费| 久久久久久久国产精品电影| 久久亚洲精品中文字幕三区| 国产在线精品网址你懂的| 国产午夜精品视频| 国产小视频国产精品| 久久精品成人免费网站| 精品久久一区二区三区| 精品一区二区久久| 久久国产精品久久精品国产| 秋霞午夜鲁丝片午夜精品久| 久久99国产精品久久99果冻传媒| 久久99精品国产99久久| 久久国产精品鲁丝片| 日韩人妻无码精品久久久不卡| 亚洲AV成人精品网站在线播放| 久久久久久久99精品免费| 久久夜色精品国产网站| 久久精品国产清高在天天线| 在线电影国产精品| 久久成人国产精品免费软件| 2021久久国自产拍精品| 国产av影片麻豆精品传媒|