百度算法大揭秘與最新算法調整




百度一直牢牢占據著國內搜索引擎霸主的位置。弄懂了百度算法,就意味著Hold住了網站排名和流量。曾經多少年來,無數SEOer為研究百度的算法嘔心瀝血,對于弄清百度排名算法成為了一代又一代站長的最高目標。
首先申明下,劉興時今天分享的內容要感謝圈內朋友趙一鳴、子墨柔情等人的大力支持。這一章節的內容比較長,劉興時這邊根據各方面數據整理的百度搜索引擎算法有260項,光整理此篇文章都花費了我半個月時間,這也印證了Swowhy好長時間都見不到劉興時的一個原因了。
百度算法從未對外公布過,以下算法心得均是劉興時8年來總結推測和資深站長提供。打算長期從事SEO工作的新手,強烈建議收藏哦,希望對大伙兒在操作SEO過程中有所幫助!哈哈,廢話不多說了,直接進入話題!
百度算法規則
劉興時曾幾何時,從來不相信百度的算法有那樣的神奇,但是百度確針對這一系列的算法做出了公告與K站降權的舉動,不得不讓我仔細分析百度算法的原理,以下幾個算法僅為劉興時個人推測。
百度綠蘿算法:我一直不相信百度綠蘿算法竟然可以算出來你的鏈接是否購買的,但是實際百度卻做到了,其中主要原理還是根據一個網站對另一個網站的鏈接判斷,是否有反向鏈接、鏈接個數來進行判斷。
百度石榴算法:石榴算法主要打擊的對象為低質量頁面,其中百度蜘蛛主要是根據網站html代碼來抓取的,并且搜索引擎根據文章的標簽(包含排版)、重復讀來進行判斷網站的質量。
百度星火計劃:星火計劃的原計劃是為了打擊抄襲者,其星火計劃的原理非常簡單了,也就是判斷重復讀來決定網站是否抄襲,同時百度蜘蛛也肯定了自己的抓取程序,目前正在往每一個網站時刻爬取靠攏。
百度瑞麗算法:2015年元旦,百度內部相關程序出現了一些故障,導致國內大量的CN和CC域名站點被K,而不少人預測這是瑞麗算法上線的結果。不過劉興時從種種跡象推測,瑞麗算法應該是一種誤傳。
收錄規則
要想有排名的前提下是收錄,要向收錄的前提下是有內容,所以很多網站內容太單一是很難被收錄,但也有網站明顯有內容就是不收錄的,我是這樣理解收錄的。
抓取:百度收錄一個網站或頁面的前提是網站被百度抓取過,也就是百度的機器來過你的站點,來你站點的前提是有一個入口,百度的入口有三個,第一自己提交、第二SEO外鏈、第三瀏覽器。瀏覽器大家可能不是很明白,當你的網站剛剛建立后,沒有人知道你的建站建立好了,自然百度也不會知道,唯一知道的就是你自己了,如果你使用百度瀏覽器打開你的網站,這也就意味著,百度瀏覽器已經知道了這個站點的存在,數據也就交給了百度搜索引擎,從而達到了抓取的效果。光抓取還是不夠的,不一定所有的內容都會被百度收錄,所以他們收錄也是要判斷內容標準。
識別:抓取了一個頁面,肯定是有內容的,如果說沒有內容是很難被收錄的,什么是沒有內容的頁面呢,比如登錄注冊頁面,這類頁面是屬于有內容沒有意義的頁面。直接會被列入到空白頁面,想這類頁面,我們的網站還是非常多的,比如:關于我們、聯系我們之類的頁面。
所以頁面肯定得有內容,并且是可識別的內容,什么叫可識別的內容,就是文字內容,百度搜索引擎是機器在識別,當遇到視頻、圖片、flash的時候,他們不知道視頻、圖片里面展現的內容是什么,所以無法識別,所以前期最好還是以文字為主。
釋放:最終才考慮到釋放出來,如果釋放出來后,這個時候你可以通過百度搜索你的URL,釋放你的頁面也是需要有條件的。
首先會判斷你的頁面站外推薦很多,這也就意味著這個頁面是高質量的頁面才會被站外推薦,容易被收錄,其次是被站內推薦,這也意味著是這個頁面是高質量頁面才會被站內推薦。說白了,要向釋放出來的內容,絕對是高質量的內容,除非發生了下面這種情況。
最容易被收錄的內容絕對是互聯網新聞源最多的內容,說白了就是抄襲者很多的內容是最容易被收錄的。這個時候太多人不容易理解了,抄襲越多越容易被收錄?
新聞內容是具有時效性的,當一篇新聞發布以后,馬上就有很多媒體轉載你的內容,而百度機器識別出來,很多新聞源有同樣的內容,也就被列入了新聞的話題頁面,從而這方面的內容收錄也就非常簡單了,不會等一天或幾天后才收錄,如果過幾天才收錄,這個新聞內容已經過時了,自然也就影響了百度的體驗。
排名規則
參與排名的規則并沒有想象中那么復雜,聽到這位大哥分析了以后,自認為有一定的價值,其實無非就幾個方面解決排名問題。
得分規則:得分規則是根據一個網站的總體信譽度,比如網站的原創度、網站的停留時間、網站的跳出率、網站的打開速度、網站圖片的處理、網站代碼的優化等綜合判斷,總體被稱為得分規則。
點擊規則:當你網站信譽度達到一個基礎標準后,你網站會出現一些非常長尾的關鍵詞,可能關鍵詞排名并沒有在首頁,這個時候就是根據點擊率的規則來計算排名的。如下圖所示,當一個關鍵詞展現量和點擊率達到一個比例后,你的排名就會上前一個等級。而這個比例是根據用戶的點擊來計算的,并非百度定義的,比如搜索“翻墻”這個關鍵詞,排名第二的網頁比第一的點擊率還高,自然排名第二的頁面會會給他排名第一。
鏈接規則:當你的一篇文章被站外鏈接過多推薦,這意味著這篇文章價值非常大,不然對方不會推薦,另外也被站內推薦多次,這也意味著這篇文章價值非常大,所以鏈接的規則就非常簡單的,但是由于百度綠蘿算法一直在打擊垃圾外鏈,所以在鏈接上,最好還是自然鏈接比較安全。
算法規則(附部分)
1、網站服務器的穩定性
2、網站服務器的安全性
網站服務器的安全是十分重要的,尤其對金融、旅游、移民等高利潤行業站點。
3、同IP下的網站越少越好
4、同IP下的網站無大量被K
5、同IP下的網站無大量被降權
6、轉移服務器會影響網站排名
網站搬家、網站轉移服務器會網站排名的,這里劉興時推薦采用網站流量點擊保護可以很大程度避免排名的下滑。
7、域名包含關鍵詞(拼音、英文)
就比如我做快速消費品網SEO排名,推薦域名中包含有seo等關鍵詞。
8、域名年齡越老越有排名優勢
9、域名主題的轉換直接影響排名
10、備案對網站排名穩定性的重要
11、最好采用DIV+CSS布局
12、表格布局避免過多嵌套
13、網頁編碼對網站的影響
14、整站生成靜態HTML
靜態化肯定是特別利于優化的,但是很多站長的空間沒有那么大,這里劉興時推薦可以采用偽靜態的優化手法。
15、動態URL的優化劣勢
16、目錄的層次不要太深
17、目錄名稱的優化
18、網頁URL不要太長
19、網站內容的原創性
20、避免大量內容重復
21、避免大量采集內容填充
22、避免大量頁面內容相似度太高
23、網站內容不要出現違法字眼
24、內容越豐富越有利于排名
25、內容被收錄的數量越多越好
26、頁面大小(建議小于100K)
頁面內容在滿足用戶需求的同時,盡量體積小些,比如百度的首頁大小才4K。
27、頁面避免出現太多圖片
28、網站sitemap時時更新與提交
29、新頁面產生的速率
30、網站Meta的優化設計
31、Deion的優化設計
32、Keywords的優化設計
33、避免太多無關的關鍵詞
34、網頁PR值對排名的影響
35、核心關鍵詞的選取
對網站核心關鍵詞一定要定位準確,快速消費品網(www.ksxfp.org)和fmcg雖然意思一樣,但是優化的時候一定要有個針對性。比如:快速消費品發展前景,快速消費品銷售管理,又能給用戶最為順暢方便記憶的標題。
36、擴展關鍵詞的選取
37、長尾關鍵詞的選擇
38、關鍵詞在網站TITLE上的使用
最好的關鍵詞在title顯示是一句通順的語句,既適合搜索引擎的匹配抓取,又適合用戶的瀏覽點擊。
39、保持網頁Title的唯一性
40、標題設計不要過長
這里主要是針對快照索引字節,對手機站的標題就需要更少點,畢竟現在移動端站優化也是主流方向,對移動站標題的設計就需要更少字節。
41、標題不要堆砌關鍵詞
42、標題的分詞描寫規則
43、標題描寫結合長尾關鍵詞
44、每個標題最好突出1-2個關鍵詞
45、關鍵詞在Meta Deion中的使用
可參考劉興時的SEO博客的deion寫法
46、關鍵詞在Meta Keywords中的使用
47、關鍵詞在H1、H2、H3標簽中的使用
48、一個頁面盡量只使用一個H1
很多人都在好奇為什么我的快速消費品網一直排名那么好,其實大家可以仔細點開我的每一個內頁,我的每一個內頁的標題都是在 H1中包裹的。
49、關鍵詞在頁面URL中的使用
50、在url中使用"-"連接關鍵詞,優化效果“_”等特殊符號。
51、關鍵詞與頁面內容的相關性
52、關鍵詞的加粗優化
53、關鍵詞的斜體優化
54、關鍵詞的下劃線優化
55、關鍵詞的跑馬燈優化
56、關鍵詞字體大小
57、圖片的關鍵詞優化 alt標簽
58、關鍵詞是否突出
59、關鍵詞的密度6%左右
其實網站關鍵詞密度這個事在網站優化過程中并沒有那么重要,劉興時優化網站的時候是不會刻意控制關鍵詞密度的,除非碰到一些競爭超級大的行