抓取份額是搜索引擎蜘蛛花在一個網站上的抓取頁面的總的時間上限.對于特定網站,搜索引擎蜘蛛花在這個網站上的總時間是相對固定的,不會無限制地抓取網站所有頁面.
抓取份額的英文Google用的是crawl budget,直譯是爬行預算,我覺得不太能說明是什么意思,所以用抓取份額表達這個概念.
決定抓取需求的主要有兩個因素.一是頁面權重,網站上有多少頁面達到了基本頁面權重,搜索引擎就想抓取多少頁面.二是索引庫里頁面是否太久沒更新了.說到底還是頁面權重,權重高的頁面就不會太久不更新.
頁面權重和網站權重又是息息相關的,提高網站權重,就能使搜索引擎愿意多抓取頁面.
搜索引擎蜘蛛不會為了抓取更多頁面,把人家網站服務器拖垮,所以對某個網站都會設定一個抓取速度的上限,crawl rate limit,也就是服務器能承受的上限,在這個速度限制內,蜘蛛抓取不會拖慢服務器、影響用戶訪問.
服務器反應速度夠快,這個速度限制就上調一點,抓取加快,服務器反應速度下降,速度限制跟著下降,抓取減慢,甚至停止抓取.
所以,抓取速度限制是搜索引擎"能"抓取的頁面數.
小網站頁面數少,即使網站權重再低,服務器再慢,每天搜索引擎蜘蛛抓取的再少,通常至少也能抓個幾百頁,十幾天怎么也全站抓取一遍了,所以幾千個頁面的網站根本不用擔心抓取份額的事.數萬個頁面的網站一般也不是什么大事.每天幾百個訪問要是能拖慢服務器,SEO就不是主要需要考慮的事了.
抓取份額不夠,比如網站有1千萬頁面,搜索引擎每天只能抓幾萬個頁面,那么把網站抓一遍可能需要幾個月,甚至一年,也可能意味著一些重要頁面沒辦法被抓取,所以也就沒排名,或者重要頁面不能及時被更新.
要想網站頁面被及時、充分抓取,首先要保證服務器夠快,頁面夠小.如果網站有海量高質量數據,抓取份額將受限于抓取速度,提高頁面速度直接提高抓取速度限制,因而提高抓取份額.
抓取速度和抓取份額不是排名因素.但沒被抓取的頁面也談不上排名.
評論(0人參與,0條評論)
發布評論
最新評論