<ul id="g60s4"><pre id="g60s4"></pre></ul>
<strong id="g60s4"><nav id="g60s4"></nav></strong>
<ul id="g60s4"></ul>
  • <tr id="g60s4"></tr>
  • 
    
  • 或者

    搜索引擎是如何網頁是不是重復的

    作者:長瘦不老i 瀏覽:229 發布時間:2018-01-18
    分享 評論 0

      在互聯網中,信息的重復性是在所難免的。然而,搜索引擎怎樣識別重復信息?怎樣判斷哪些網頁的信息是原創的?哪些是復制的?怎樣認為哪些重復的信息是有價值的?哪些又是可以舍棄的呢?


      在網站中,重復信息主要包括轉載和鏡像內容兩大類。搜索引擎對頁面分析的時候,必須具備是被重復信息的能力。因為大量的重復信息不但占用巨大的服務器資源,而且還增加了用戶尋找信息的時間,降低了用戶體驗。但這并不意味著所有重復信息都是沒有用的。搜索引擎會認為轉載內容沒有原創重要,賦予原創內容更高的權重,而鏡像內容則幾乎忽略。


      轉載頁面是指與原創內容相同或相近的頁面。然而,搜索引擎如何識別轉載頁面呢?首先,它把網頁正文內容分為n個區域進行比較,如果其中有m個區域是相同或相似的,則認為這些頁面是互為轉載頁面。


      在確定頁面的轉載關系后,接下來,搜索引擎在結合頁面的最后修改時間,頁面權重等因素判斷原創頁面與轉載頁面。


      鏡像頁面是指內容完全相同的兩個頁面。和上述一樣,把內容分出n個區域,比對吼n個區域完全一樣則互為鏡像頁面。


      鏡像網站。下一上完全相同的網站,形成鏡像網站主要有兩種情況。一個多個域名或IP指向同一服務器的物理目錄。另外就是整個網站內容被復制到使用不同域名或者不同IP的服務器上。


      為了識別站點間是否互為鏡像網站搜索引擎首先判斷這些網站的首頁是否互為鏡像。然后綜合頁面權重,建立時間等諸多因素識別源網站。這也是為什么搜索引擎對于鏡像網站收錄極少,甚至不收錄的原因。


    国产在线视精品麻豆| 国内精品自线在拍2020不卡| 老司机亚洲精品影视www| 日韩福利电影在线观看| 国产成人精品综合| 精品国产男人的天堂久久| 中文字幕精品一区二区2021年| 麻豆国产精品无码视频| 亚洲国产精品久久66| 久久精品国产亚洲一区二区| 国产亚洲精品久久久久秋霞| 久久久WWW免费人成精品| 国产精品热久久毛片| 亚洲精品久久久www| 日韩成人精品日本亚洲| 中文字幕日韩三级| 中文字幕日韩精品有码视频| 国产成人精品午夜二三区| 国产精品亚洲精品日韩电影| 欧美精品大香伊蕉在人线| 在线精品国精品国产尤物| 精品国产一区二区三区四区| 亚洲国产精品成人久久久| 亚洲欧洲精品视频在线观看| 亚洲国产精品久久网午夜| 精品国精品无码自拍自在线| 国产精品2019| 色综合久久夜色精品国产| 亚洲精品国产国语| 国产va精品免费观看| 亚洲av永久无码精品秋霞电影秋 | 少妇人妻无码精品视频| 午夜精品久久久久久毛片| 亚洲国产精品人久久| 99无码精品二区在线视频| 99re热这里有精品首页视频| 91麻豆精品激情在线观看最新| 久久久久久精品成人免费图片| 国产精品99久久精品| 热RE99久久精品国产66热| 精品国产柚木在线观看|