<ul id="g60s4"><pre id="g60s4"></pre></ul>
<strong id="g60s4"><nav id="g60s4"></nav></strong>
<ul id="g60s4"></ul>
  • <tr id="g60s4"></tr>
  • 
    
  • 或者

    巧用robots避免蜘蛛黑洞

    作者:月光邊境 瀏覽:166 發布時間:2017-07-28
    分享 評論 0

    對于百度搜索引擎來說,蜘蛛黑洞特指網站通過極低的成本制造出大量參數過多,及內容雷同但具體參數不同的動態URL ,就像一個無限循環的“黑洞”將spider困住,Baiduspider浪費了大量資源抓取的卻是無效網頁。

      比如很多網站都有篩選功能,通過篩選功能產生的網頁經常會被搜索引擎大量抓取,而這其中很大一部分檢索價值不高,如“500-1000之間價格的租房”,首先網站(包括現實中)上基本沒有相關資源,其次站內用戶和搜索引擎用戶都沒有這種檢索習慣。這種網頁被搜索引擎大量抓取,只能是占用網站寶貴的抓取配額。那么該如何避免這種情況呢?

      我們以北京某團購網站為例,看看該網站是如何利用robots巧妙避免這種蜘蛛黑洞的:

      對于普通的篩選結果頁,該網站選擇使用靜態鏈接,如:http://bj.XXXXX.com/category/zizhucan/weigongcun

      同樣是條件篩選結果頁,當用戶選擇不同排序條件后,會生成帶有不同參數的動態鏈接,而且即使是同一種排序條件(如:都是按銷量降序排列),生成的參數也都是不同的。如:http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqhek

      http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqi5c

      對于該團購網來說,只讓搜索引擎抓取篩選結果頁就可以了,而各種帶參數的結果排序頁面則通過robots規則拒絕提供給搜索引擎。

      robots.txt的文件用法中有這樣一條規則:Disallow: /*?* ,即禁止搜索引擎訪問網站中所有的動態頁面。該網站恰是通過這種方式,對Baiduspider優先展示高質量頁面、屏蔽了低質量頁面,為Baiduspider提供了更友好的網站結構,避免了黑洞的形成。


    国模和精品嫩模私拍视频| 亚洲av日韩片在线观看| 日韩美一区二区三区| 日韩AV无码不卡网站| 国内大量揄拍人妻精品視頻 | 99这里只有精品| 久久最新精品国产| 亚洲精品白浆高清久久久久久| 伊人精品久久久久7777| 日韩AV高清在线观看| 日韩一区二区电影| 国产69精品久久久久妇女| 日韩精品午夜视频一区二区三区| 内射精品无码中文字幕| 国产精品久久久久久久久软件| 国产精品九九九久久九九| 精品人妻无码区二区三区| 4444亚洲国产成人精品| 久久99精品国产麻豆| 久久久久成人精品无码中文字幕| 人妻少妇精品中文字幕AV | 国产精品反差婊在线观看| 精品一区二区视频在线观看| 91久久精品视频| 国产精品久久久久天天影视| 精品久久久久久中文字幕人妻最新| 亚洲精品在线免费看| 亚洲国产成人精品无码区在线网站 | 9久9久热精品视频在线观看| 黄床大片免费30分钟国产精品 | 日本精品高清一区二区| 人妻少妇无码精品视频区| 国内精品卡1卡2卡区别| 国产呦小j女精品视频| 国产精品午夜国产小视频| 久久久久九九精品影院| 思热99re视热频这里只精品| 精品一区二区三区视频在线观看| 亚洲精品无码久久久| 久久久精品波多野结衣| 国内精品卡1卡2卡区别|