淺談304狀態碼解決辦法




一般以為:搜索引擎爬蟲會更青睞內容原創且更新頻繁的網站,并通過特定時間內對網站抓取返回的狀態碼來調整對該網站的抓取頻率。若網站在相稱一定時間內一直處于[304:沒有變化]狀態,那么引擎爬蟲可能會降低今后對網站的抓取次數。反之,若網站更新變化的頻率非常之快,每次抓取都能獲取新內容,那么日積月累,爬蟲的回訪率天然而然也會進步。
不管是抓取少仍是304,這都是一種現象,而不是題目泛起的原因。假設網站返回的都是200,就能達到晉升網站排名并帶來流量的目的么?比擬之下更應該思索產生304的原因是什么?調整304對網站能夠有什么樣的效果?不能忽視整體的目標而過分夸大過程的細節,單純為了200而去解決304。
一、304狀態是如何產生的?
服務器為了進步網站訪問速度,對之前訪問的部門頁面制定緩存機制,當客戶端在此對這些頁面進行哀求,服務器會根據緩存內容來判定頁面與之前是否相同,若相同就直接返回304,此時客戶端會直接調用緩存內容,不必重新進行二次下載,可以說304從某種角度起到了減少服務器帶寬并進步蜘蛛爬行效率的作用。
二、304狀態產生的原因?
1.頁面更新周期過長或基本不更新
2.純靜態頁面或強制天生靜態html
三、304狀態如何處理?
1.先對產生304頁面進行細分,到底是哪類頁面返回了304?這些頁面是否應該返回304?
2.這些頁面天生的方式是怎樣的?是否有更新機制?更新機制是否符合蜘蛛對網站的抓取頻率?
3.頁面更新區域的位置布置是否公道?是否位于該頁面主要內容的承載區域內?
有不少SEOer也對此情況做了如下分析:
304狀態碼泛起過多會造成以下題目:
1.網站快照更新停滯
2.收錄頁面減少
3.流量、權重下降
四、那么如何減少304返回碼呢?
首先內容更新方面要迎合搜索引擎蜘蛛。分析日志,把蜘蛛到訪的時間記實下來,可大致推算出蜘蛛到訪的頻率,然后以此為依據,更新文章:最好是原創+轉載,不能純采集。轉載也需要最新最好的優質資源。讓蜘蛛這個點過來能有吃的,從而返回更多200正常碼。
其次,最好有互動版塊。現在大網站基本已經都做了這方面工作,好比評論、留言等,大網站更新起來變化可能會很小,但是有了這些互動,用戶會在上面發些內容,網站會有良多新的內容。