簡單介紹幾種百度支持的返回碼




簡單介紹幾種百度支持的返回碼:
1)最常見的404代表“NOTFOUND”,認為網(wǎng)頁已經(jīng)失效,通常將在庫中刪除,同時短期內如果spider再次發(fā)現(xiàn)這條url也不會抓取;具體可參看百度百科:http://baike.baidu.com/subview/1629577/8000618.htm
2)503代表“ServiceUnavailable”,認為網(wǎng)頁臨時不可訪問,通常網(wǎng)站臨時關閉,帶寬有限等會產(chǎn)生這種情況。對于網(wǎng)頁返回503狀態(tài)碼,百度spider不會把這條url直接刪除,同時短期內將會反復訪問幾次,如果網(wǎng)頁已恢復,則正常抓取;如果繼續(xù)返回503,那么這條url仍會被認為是失效鏈接,從庫中刪除。具體可參照百度百科 http://baike.baidu.com/view/67792.htm
3)403代表“Forbidden”,認為網(wǎng)頁目前禁止訪問。如果是新url,spider暫時不抓取,短期內同樣會反復訪問幾次;如果是已收錄url,不會直接刪除,短期內同樣反復訪問幾次。如果網(wǎng)頁正常訪問,則正常抓取;如果仍然禁止訪問,那么這條url也會被認為是失效鏈接,從庫中刪除。具體可參看百度百科 http://baike.baidu.com/view/3731872.htm
4)301代表是“MovedPermanently”,認為網(wǎng)頁重定向至新url。當遇到站點遷移、域名更換、站點改版的情況時,我們推薦使用301返回碼,同時使用站長平臺網(wǎng)站改版工具,以減少改版對網(wǎng)站流量造成的損失。具體可參照百度百科 http://baike.baidu.com/subview/543614/7943668.htm
以上是百度站長平臺上官方發(fā)布的4中狀態(tài)返回碼,其實百度還支持有200的代碼。200代碼就是能正常訪問的意思。