<ul id="g60s4"><pre id="g60s4"></pre></ul>
<strong id="g60s4"><nav id="g60s4"></nav></strong>
<ul id="g60s4"></ul>
  • <tr id="g60s4"></tr>
  • 
    
  • 或者

    使用robots巧妙避免蜘蛛黑洞

    作者:月光邊境 瀏覽:110 發布時間:2017-08-15
    分享 評論 0

    對于百度搜索引擎來說,蜘蛛黑洞特指網站通過極低的成本制造出大量參數過多、內容類同但url不同的動態URL ,就像一個無限循環的“黑洞“,將spider困住。spider浪費了大量資源抓取的卻是無效網頁。

      如很多網站都有篩選功能,通過篩選功能產生的網頁經常會被搜索引擎大量抓取,而這其中很大一部分是檢索價值低質的頁面。如“500-1000之間價格的租房”,首先網站(包括現實中)上基本沒有相關資源,其次站內用戶和搜索引擎用戶都沒有這種檢索習慣。這種網頁被搜索引擎大量抓取,只能是占用網站寶貴的抓取配額,那么該如何避免這種情況呢?

    1.   我們以北京美團網為例,看看美團網是如何利用robots巧妙避免這種蜘蛛黑洞的:

    2.   對于普通的篩選結果頁,使用了靜態鏈接

    3.   同樣是條件篩選結果頁,當用戶選擇不同排序條件后,會生成帶有不同參數的動態鏈接,而且即使是同一種排序條件(如:都是按銷量降序排列),生成的參數也都是不同的。

      對于美團網來說,只讓搜索引擎抓取篩選結果頁就可以了,而各種帶參數的結果排序頁面則通過robots規則拒絕提供給搜索引擎。在robots.txt的文件用法中有這樣一條規則:Disallow: /*?* ,即禁止搜索引擎訪問網站中所有的動態頁面。美團網恰是通過這種方式,對spider優先展示高質量頁面、屏蔽了低質量頁面,為spider提供了更友好的網站結構,避免了黑洞的形成。


    久久精品国产第一区二区三区| 精品国产品香蕉在线观看75| 国产在线视精品麻豆| 久久这里的只有是精品23| 亚洲精品资源在线| 日韩精品久久无码中文字幕| 国产麻豆精品一区二区三区v视界 国产麻豆一精品一AV一免费 | 国产精品一区二区三区99| 日韩精品福利片午夜免费观着| 成人久久伊人精品伊人| 无码精品A∨在线观看无广告| 国产精品久久久久久久人人看| 91精品啪在线观看国产电影| 99精品视频观看| 午夜精品久久久久久中宇| 国产成人精品高清在线观看93| 亚洲精品中文字幕无码蜜桃| 亚洲综合av永久无码精品一区二区 | 老牛精品亚洲成av人片| 国产成人精品午夜福利在线播放| 精品成人乱色一区二区| 精品国产天线2019| 精品国精品国产自在久国产应用| 3d动漫精品啪啪一区二区免费| 久久Av无码精品人妻系列| 91在线精品亚洲一区二区| 精品亚洲成a人片在线观看 | 日韩精品一区在线| 精品在线一区二区三区| 视频一区二区精品的福利| 日韩免费观看的一级毛片| 午夜精品久久久内射近拍高清| 四虎成人精品国产永久免费无码| 无码精品人妻一区二区三区影院| 伊人久久无码精品中文字幕| 国产精品黄页免费高清在线观看| 国产日韩精品无码区免费专区国产 | 中文国产成人久久精品小说| 窝窝午夜色视频国产精品东北| 亚洲综合精品香蕉久久网| 国产精品99精品久久免费|