連通率為0的補(bǔ)救措施




既然為率,那么就是一個(gè)統(tǒng)計(jì)相關(guān)概念。我們不妨可以這樣理解一個(gè)網(wǎng)站的連通率:百度蜘蛛在抓取網(wǎng)站頁面的時(shí)候計(jì)算的一個(gè)概率,比如它抓取某網(wǎng)站中的N個(gè)頁面,這N個(gè)頁面都能打開并被蜘蛛成功抓取,這樣的連通率就是N/N=100%,反之蜘蛛抓取N個(gè)頁面有M個(gè)頁面能成功抓取,連通率就是M/N;
這里先說明幾個(gè)常識(shí):
1、不是網(wǎng)站被某算法懲罰而導(dǎo)致連通率為0,也不是網(wǎng)站流量下降而導(dǎo)致連通率數(shù)值很低;
2、連通率代表著百度蜘蛛獲取網(wǎng)站數(shù)據(jù)的情況,如果連通率數(shù)值很低或?yàn)?,那么可能連維持網(wǎng)站的正常收錄等都成問題;
3、假如網(wǎng)站被判定連通不了,那么如果讓一個(gè)連通不了的站點(diǎn)在百度中獲取排名,就會(huì)大大影響搜索用戶的體驗(yàn),于是百度就會(huì)采取對(duì)該站點(diǎn)有效引流的索引清除操作,一些站長(zhǎng)就會(huì)發(fā)現(xiàn)自己的網(wǎng)站索引量突然大幅度下降,甚至索引被短暫清0了,接著就是網(wǎng)站百度搜索流量大幅度下降,這種突發(fā)性的事件又會(huì)造成站長(zhǎng)們的揣測(cè),以為自己的網(wǎng)站被百度懲罰了,其實(shí)站長(zhǎng)們先應(yīng)該注意的是站點(diǎn)的連通情況?! ?/span>
上述概念中,我們需要注意在連通率很低或?yàn)?時(shí),我們抓住“百度蜘蛛”; “在抓取”; “N個(gè)頁面”; “M個(gè)頁面”; “都能打開并被成功抓取”這5個(gè)提取出的核心詞進(jìn)行分析。
(一)百度蜘蛛
1、謹(jǐn)防百度蜘蛛訪問被操控或禁止
2、預(yù)防措施
(1)完善聯(lián)系方式獲得百度站長(zhǎng)工具消息提醒
(2)利用抓取異常和抓取頻次工具觀察抓取情況
(3)抓取診斷工具是重中之重
為了保證網(wǎng)站對(duì)百度蜘蛛的穩(wěn)定訪問性能,日常我們需要養(yǎng)成定期抓取診斷的習(xí)慣
(二)在抓取
這是反映百度蜘蛛在抓取時(shí)的狀態(tài),百度的工具顯示的數(shù)值肯定都是抓取后計(jì)算出來的數(shù)據(jù),因此任何工具的連通率數(shù)據(jù)必定存在延遲性,另外這個(gè)計(jì)算過程也存在一定可能的錯(cuò)誤,所以我們看到任何工具中關(guān)于連通率的數(shù)據(jù),不要說“我網(wǎng)站用抓取診斷等工具檢查訪問情況都好好的,為什么連通率還是0”,因此除了上述建議的多抓取診斷測(cè)試外,自己可以加些監(jiān)控網(wǎng)站連接狀態(tài)的措施,筆者本人就曾經(jīng)接收了不少關(guān)于網(wǎng)站連接不通的提醒。這時(shí)我會(huì)及時(shí)跟網(wǎng)絡(luò)商溝通,然后及時(shí)用抓取診斷檢查蜘蛛的情況。
(三)N個(gè)頁面與M個(gè)頁面
這N、M個(gè)頁面,可能百度蜘蛛很湊巧就趕上高峰的時(shí)候或者一些假死頁面(執(zhí)行時(shí)間較長(zhǎng),超過蜘蛛的耐心),那么M這個(gè)數(shù)值就會(huì)很低,統(tǒng)計(jì)概率的東西大家都懂的,那么這時(shí)網(wǎng)站的連通率依舊很低或?yàn)?。因此若連通率為0,我們還可以知道自己應(yīng)該注意查看訪問日志,及時(shí)清理死鏈,或者并發(fā)連接數(shù)增大,或者增加內(nèi)存等等。
(四)都能打開并被成功抓取
這里主要注意DNS和空間的穩(wěn)定性。
1、DNS的問題
2、空間的穩(wěn)定性
連通率問題處理完畢后,如果你的網(wǎng)站索引由于連通率而非懲罰原因被清理了,處理完畢問題,可以在抓取頻次工具中提交增加抓取頻次的請(qǐng)求,將抓取頻次增加到一定額度(建議自己查看工具中對(duì)抓取頻次的說明后再根據(jù)網(wǎng)站實(shí)際情況調(diào)整),然后增加自己的網(wǎng)站數(shù)據(jù)更新頻率與質(zhì)量,加強(qiáng)與百度的數(shù)據(jù)溝通(如url提交、sitemap等等),很快就能恢復(fù)。