:前言
根據DCCI2010年中國互聯網站長生存與發展狀況調查的數據顯示,中國互聯網站長月收入在500元以下以及無收入的比例超過50[%],主要盈利模式仍以廣告為主,大多數的互聯網創業者面對著巨大的生存壓力,發展狀況令人擔憂。如何更快更好的改變他們當前面臨的困境,成為關系到互聯網整個生態圈長足發展的重要議題。而針對互聯網創業者,網站流量更是關乎于網站成敗的關鍵。互聯網創業者俱樂部是由百度發起成立,旨在幫助互聯網創業者健康發展、扶持互聯網創新力量、拓展互聯網創業者合作與發展空間;為熱愛互聯網,并有志投身互聯網的創業者搭建的非盈利平臺。而首次發布的《搜索引擎優化指南》為的就是幫助互聯網創業者在創業初期就步入正軌,用更為合理、科學的方式增加自身網站在搜索引擎中的收錄數,進而提升流量,為未來快速、健康發展奠定堅實的基礎。通過本指南,互聯網創業者將獲得明確、正規的搜索引擎優化標準,合理、可持續提升網站流量,獲得長久、穩定的發展,并促進行業的良性發展。
搜索引擎優化(Search engine optimization,簡稱SEO),指為了提升網頁在搜索引擎自然搜索結果中(非商業性推廣結果)的收錄數量以及排序位置而做的優化行為,這一行為的目的,是為了從搜索引擎中獲得更多的免費流量,以及更好的展現形象。而SEM(Search engine marketing,搜索引擎營銷),則既包括了SEO,也包括了付費的商業推廣優化。
SEO自從1997年左右出現以來,逐漸分化成兩類SEO行為:一類被稱為“白帽SEO”,這類SEO起到了改良和規范網站設計的作用,使之對搜索引擎和用戶更加友好,并從中獲取更多合理的流量。搜索引擎鼓勵和支持“白帽SEO”。另一類被稱為“黑帽SEO”,這類SEO行為利用和放大搜索引擎的策略缺陷(實際上完美的系統是不存在的)獲取更多用戶訪問量,而這些更多的訪問量,是以傷害用戶體驗為代價的,所以,面對后一種SEO行為,搜索引擎會通過一些策略進行遏制。
搜索引擎與SEO行為間是一種良性的共生關系,比如很多優質的網站是用Flash或者Ajax做的,搜索引擎就無法很好的爬取和索引。建站者在了解了SEO的一些基本原理后,可以通過對網站的合理優化,使這些優質資源更好的發揮其檢索效果,改善用戶的搜索體驗。同時,對于中國這樣的新興市場,傳統的中小企業對于如何觸網,如何做互聯網營銷,并無多少經驗,在廣大的互聯網創業者中,對于如何SEO也充斥著矛盾的輿論和猜想。讓更多人了解搜索引擎的工作機制,引導廣泛合理的SEO行為,讓認真做原創優質內容的創業者得到更多流量,令抄襲抓取別人內容的建站行為得到警惕,是百度作為中文搜索領域的領導者應有的責任和義務,只有這樣才能有效支持互聯網創新力量,使互聯網生態圈得到更加健康有序的發展。
需要指出的是,此次發布的《搜索引擎優化指南》,雖然聽取了部分站長的意見和建議,但仍有很大的提升空間。未來,我們會收集更多的建設性意見,來不斷的完善這一指南。
第二節:前期準備
域名注冊
域名是用戶對網站的第一印象,能否讓用戶迅速記住域名對網站發展非常重要。建議注冊域名時選擇容易讓用戶記憶、容易產生信任感的域名,這樣可以提高回頭率,并方便用戶推薦。
? 域名盡量簡短,越短的域名,用戶的記憶成本就越低
? ? 域名可以和網站主題或網站名稱相呼應,讓人看到域名就能聯想到網站內容,比如使用公司名稱、商標、網站名稱或者公司產品等信息來選擇域名
? ?使用何種形式的域名后綴對百度網頁搜索沒有影響,但域名后綴也需要考慮方便用戶記憶。.com、.cn、.net等常見的域名后綴用戶更容易記憶,一些不常見的后綴可能會讓用戶產生不信任感,增加用戶的判斷成本。
服務器、空間租用
服務器、空間的速度和穩定性直接影響網站的用戶體驗,也會影響搜索引擎的抓取。建議選擇服務穩定、速度快的服務器或者空間。
? 選擇有實力的正規空間商
服務器和空間的穩定性需要一定的技術實力來保障,一些沒有實力的空間商,可能無力提供良好的服務,服務的穩定性無法保證。甚至有空間商為了節省資源,故意屏蔽掉Baiduspider的抓取,導致網站無法被百度網頁搜索收錄。
? ?保證用戶的訪問速度和穩定性
? 根據網站規模和要提供的服務來決定選擇購買何種空間(服務器)
通常空間都會有流量、連接數以及功能上的限制,因為是多個網站共用一臺服務器,穩定性會受到影響,但價格便宜;服務器各種限制較少,可以更自主的管理,但價格較貴。可以根據自己的需求來進行合理的選擇。
? 根據用戶群分布選擇接入商
由于互通問題的存在,選擇接入商也很重要,如果用戶群主要在聯通,就盡量選擇聯通訪問較好的接入商,如果用戶群主要在電信,則選擇電信訪問較好的接入商。如果用戶群在全國,那就選擇一家互通處理的比較好的接入商。
在此提示站長:購買之前,可以先找一兩個空間商現有的客戶網站,測試訪問情況如何。
第三節:面向搜索引擎的網站建設
搜索引擎只是網站上一個普通的訪客,對網站的抓取方式、對網站/網頁的價值判斷,也都是從用戶的角度出發的,任何對用戶體驗的改進,都是對搜索引擎改進。對搜索引擎的優化,同時也會讓用戶受益。
面向搜索引擎的網站建設,主要分為三個部分:如何更好的讓搜索引擎收錄網站中的內容、如何在搜索引擎中獲得良好的排名、如何讓用戶從眾多的搜索結果中點擊你的網站。簡單來說,就是收錄、排序、展現。下面我們將從這三個方面分別介紹。
良好收錄
機器可讀
百度通過一個叫做Baiduspider的程序抓取互聯網上的網頁,經過處理后建入索引中。目前Baiduspider只能讀懂文本內容,flash、圖片等非文本內容暫時不能處理,放置在flash、圖片中的文字,百度無法識別。
建議使用文字而不是flash、圖片、Javascript等來顯示重要的內容或鏈接,搜索引擎暫時無法識別Flash、圖片、Javascript中的內容,這部分內容無法搜索到;僅在flash、Javascript中包含鏈接指向的網頁,百度可能無法收錄。
我們建議:
? 使用文字而不是flash、圖片、Javascript等來顯示重要的內容或鏈接
? 如果必須使用Flash制作網頁,建議同時制作一個供搜索引擎收錄的文字版,并在首頁使用文本鏈接指向文字版
? Ajax等搜索引擎不能識別的技術,只用在需要用戶交互的地方,不把希望搜索引擎“看”到的導航及正文內容放到Ajax中
? 不使用frame和iframe框架結構,通過iframe顯示的內容可能會被百度丟棄
上面例子中,雖然網頁上提供了很豐富的信息,但由于信息都在flash中,搜索引擎無法提取,對搜索引擎來講,這個網頁沒有任何內容。
網站結構
網站應該有清晰的結構和明晰的導航,這能幫助用戶快速從你的網站中找到自己需要的內容,也可以幫助搜索引擎快速理解網站中每一個網頁所處的結構層次。
網站結構建議采用樹型結構,樹型結構通常分為以下三個層次:首頁——頻道——文章頁。象一棵大樹一樣,首先有一個樹干(首頁),然后再是樹枝(頻道),最后是樹葉(普通內容頁)。樹型結構的擴展性更強,網站內容變多時,可以通過細分樹枝(頻道)來輕松應對。
理想的網站結構應該是更扁平一些,從首頁到內容頁的層次盡量少,這樣搜索引擎處理起來,會更簡單。
同時,網站也應該是一個網狀結構,網站上每個網頁都應該有指向上、下級網頁以及相關內容的鏈接:首頁有到頻道頁的鏈接,頻道頁有到首頁和普通內容頁的鏈接、普通內容頁有到上級頻道以及首頁的鏈接、內容相關的網頁間互相有鏈接。
網站中每一個網頁,都應該是網站結構的一部分,都應該能通過其他網頁鏈接到。
總結一下,合理的網站結構應該是一個扁平的樹型網狀結構。我們建議:
? 確保每個頁面都可以通過至少一個文本鏈接到達。
? 重要的內容,應該能從首頁或者網站結構中比較淺的層次訪問到。
? 合理分類網站上的內容,不要過度細分。
網站應該有簡明、清晰的導航,可以讓用戶快速找到自己需要的內容,同時也可以幫助搜索引擎更好的了解網站的結構。我們建議:
? 為每個頁面都加上導航欄,讓用戶可以方便的返回頻道、網站首頁,也可以讓搜索引擎方便的定位網頁在網結構中的層次。
通過面包屑導航,用戶可以很清楚的知道自己所在頁面在整個網站中的位置,可以方便的返回上一級頻道或者首頁也很方便。
? 內容較多的網站,建議使用面包屑式的導航,這更容易讓用戶理解當前所處的位置:網站首頁 > 頻道 > 當前瀏覽頁面
? 導航中使用文字鏈接,不使用復雜的js或者flash
? 使用圖片做導航時,可以使用Alt注釋,用Alt告訴搜索引擎所指向的網頁內容是什么
子域名與目錄的選擇
選擇使用子域名還是目錄來合理的分配網站內容,對網站在搜索引擎中的表現會有較大的影響。
我們建議:
? 在某個頻道的內容沒有豐富到可以當做一個獨立站點存在之前,使用目錄形式;等頻道下積累了足夠的內容,再轉換成子域名的形式
一個網頁能否排到搜索結果的前面,“出身”很重要,如果出自一個站點權重較高的網站,那排到前面的可能性就越大,反之則越小。通常情況下主站點的權重是最高的,子站點會從主站點繼承一部分權重,繼承的多少,視子站點質量而定。
在內容沒有豐富到可以做為一個獨立站點之前,內容放到主站點下一個目錄中能在搜索引擎中獲得更好的表現。
? 內容差異度較大、關聯度不高的內容,使用子站點形式
搜索引擎會識別站點的主題,如果站點中內容關聯度不高,可能導致搜索引擎錯誤的識別。關聯度不高的內容,放在不同的子域名下,可以幫助搜索引擎更好的理解站點的主題
? 域名間內容做好權限,互相分開,a. example.com下的內容,不能通過b. example.com訪問
子域名間的內容可以互相訪問,可能會被搜索引擎當做重復內容而進行除重處理,保留的url不一定是正常域名下的。
? 不要濫用子域名
無豐富內容而濫用大量子域名,會被搜索引擎當做作弊行為而受到懲罰。
規范、簡單的URL
創建具有良好描述性、規范、簡單的url,有利于用戶更方便的記憶和判斷網頁的內容,也有利于搜索引擎更有效的抓取您的網站。網站設計之初,就應該有合理的url規劃。
我們建議:
? 如果網站中同一網頁,只對應一個url
如果網站上多種url都能訪問同樣的內容,會有如下危險:
1、搜索引擎會選一種url為標準,可能會和正版不同
2、用戶可能為同一網頁的不同url做推薦,多種url形式分散了該網頁的權重
如果你的網站上已經存在多種url形式,建議按以下方式處理:
1、在系統中只使用正常形式url,不讓用戶接觸到非正常形式的url
2、不把Session id、統計代碼等不必要的內容放在url中
3、不同形式的url,301永久跳轉到正常形式
4、防止用戶輸錯而啟用的備用域名,301永久跳轉到主域名
5、使用robots.txt禁止Baiduspider抓取您不想向用戶展現的形式
? 讓用戶能從url判斷出網頁內容以及網站結構信息,并可以預測將要看到的內容
以百度空間為例,url結構中加入了用戶id信息,用戶在看到空間的url時,可以方便的判斷是誰的空間。url結構中還加入了blog、album等內容信息,用戶可以通過url判斷將要看到的內容是一篇博客,還是一個相冊。
? URL盡量短,長URL不僅不美觀,用戶還很難從中獲取額外有用的信息。另一方面,短url還有助于減小頁面體積,加快網頁打開速度,提升用戶體驗。
例子中的第一個url,會讓用戶望而卻步,第二個url,用戶可以很輕松的判斷是貼吧中關于百度的吧。
? 正常的動態url對搜索引擎沒有影響。url是動態還是靜態對搜索引擎沒有影響,但建議盡量減少動態url中包含的變量參數,這樣即有助于減少url長度,也可以減少讓搜索引擎掉入黑洞的風險
? 不添加不能被系統自動識別為url組成部分的字符
上面例子中,url中加入了“;”、“,”等字符,用戶在通過論壇、即時通訊工具等渠道推薦這些url時,不能被自動識別為鏈接,增加了用戶訪問這些網頁的困難度。
? 利用百度提供的URL優化工具檢查
百度站長平臺提供了URL優化工具,可以幫助檢查URL對搜索引擎的友好程度并提出修改建議。
利用站長工具
互聯網越來越龐大、復雜,百度為了更好的處理互聯網上的信息,提供了一些的面向站長的工具,合理的利用這些站長工具,可以起事半功倍的效果。
?百度站長平臺:
登錄zhanzhang.baidu.com獲取更多幫助信息。
? Sitemap :
百度站長平臺支持通過sitemap提交網站內容。通過sitemap可以讓百度更全面更快的發現鏈接,使得收錄更有效率。
? Ping:
Ping是針對blog內容的提交方式,實時通知搜索引擎blog上有新內容產生。目前主流的博客程序都支持ping,您只需要將百度的ping服務地址http://ping.baidu.com/ping/RPC2加入博客后臺并開啟ping功能即可。
? 死鏈刪除:
百度站長平臺支持通過sitemap向百度提交網站的死鏈列表。網站死鏈過多,不僅影響用戶訪問體驗,也影響百度對網站質量的判斷。通過死鏈刪除的接口可以讓百度更快更全面的發現網站死鏈,從而進行有效刪除。
注:提交需要刪除的網址后,需要做如下處理,才能被百度有效刪除:
1、使用robots.txt阻止其被抓取;
2、或者返回404狀態碼表示當前頁面不存在。
? 站長工具
-URL優化工具檢查
百度站長平臺提供了URL優化工具,可以幫助檢查URL對搜索引擎的友好程度并提出修改建議。
-網站安全檢測
百度站長平臺提供工具檢測網站是否被黑并提示站長,幫助修改。
? 什么是“網站被黑”?
網站被黑,是指黑客利用網站的程序、設置等方面的安全漏洞或管理員安全疏忽(如密碼復雜度低),未經管理員授權,對網站進行了篡改。
? 如何處理網站被黑?
1、分析系統日志、服務器日志,檢查自己站點的頁面數量、流量等是否有異常波動,是否存在異常訪問或操作日志;
2、檢查網站文件是否有不正常的修改,尤其是首頁等重點頁面;
3、網站頁面是否引用了未知站點的資源(圖片、JS等),是否被放置了外站的異常鏈接;
4、檢查網站是否有不正常增加的文件或目錄;
5、檢查網站目錄中是否有非管理員打包的網站源碼、未知txt文件等。
? 如何防止網站被黑?
1、定期檢查服務器日志等方式發現問題,檢查是否有可疑的針對非前臺頁面的訪問;
2、經常檢查網站文件是否有不正常的修改或者增加;
3、關注操作系統,以及所使用程序的官方網站。及時下載補丁,修補安全漏洞;必要時建議直接更新至最新版本;
4、修改開源程序關鍵文件的默認文件名,作弊者通常通過程序自動掃描某些特定的文件是否存在來判斷是否使用了某套程序;
5、修改默認管理員用戶名,提高管理后臺的密碼強度,使用字母、數字以及特殊符號多種組合的密碼;
6、關閉不必要的服務,以及端口;
7、關閉或者限制不必要的上傳功能;
8、設置防火墻等安全措施;
9、若問題反復出現,建議重新安裝服務器操作系統,并重新上傳備份的網站文件;
10、缺乏專業維護人員的網站,建議向專業安全公司咨詢;快速發現并處理被黑內容,并做好被黑的預防,非常體現一個網站的運營水平。
上述的幾點僅僅是初步的參考。做好網站的安全需要站長、管理員們的不斷努力。
? 百度搜索框提示功能
百度向站長開放免費“百度搜索框”代碼和“百度搜索框提示”代碼。
只需進行簡單的設置,即可將“百度搜索框(帶提示功能)”功能快速加入到您的網頁中。提升用戶在網站中的搜索體驗。
改版/換域名
網站改版、換域名在互聯網飛速發展的情況下是不可避免的,但處理不當,會造成重大的流量損失。改版、換域名需要考慮的第一要點就是如何保證老用戶不流失,當用戶訪問舊內容時,能引導用戶到新網站上對應的內容,避免出現用戶訪問不到以前收藏的網頁的情況。
我們建議在改版或者換域名時,將舊網頁301永久重定向到內容對應的新網頁,這樣百度更容易發現這個轉變,并迅速的將舊網頁積累的權值傳遞給對應的新網頁。
其他建議:
? 如非必要,不要做整站內容的完全更換
網站改版或者網站內重要頁面鏈接發生變動時,應該將改版前的頁面301永久重定向到改版后的對應的頁面
? 網站更換域名,應該將舊域名的所有頁面301永久重定向到新域名上對應的頁面
網站更換域名后,維持舊域名能穩定訪問盡可能長的時間,給用戶多一些時間記憶新域名
? 網站改版/更換域名后,請把新的URL/新域名下的URL,通過sitemap提交給百度,幫助百度更快發現和作出調整。
合理的返回碼
百度爬蟲在進行抓取和處理時,是根據http協議規范來設置相應的邏輯的,所以請站長們也盡量參考http協議中關于返回碼的含義的定義來進行設置。
百度spider對常用的http返回碼的處理邏輯是這樣的:
? 404
404返回碼的含義是“NOT FOUND”,百度會認為網頁已經失效,那么通常會從搜索結果中刪除,并且短期內spider再次發現這條url也不會抓取。
? 503
503返回碼的含義是“Service Unavailable”,百度會認為該網頁臨時不可訪問,通常網站臨時關閉,帶寬有限等會產生這種情況。對于網頁返回503,百度spider不會把這條url直接刪除,短期內會再訪問。屆時如果網頁已恢復,則正常抓取;如果繼續返回503,短期內還會反復訪問幾次。但是如果網頁長期返回503,那么這個url仍會被百度認為是失效鏈接,從搜索結果中刪除。
? 403
403返回碼的含義是“Forbidden”,百度會認為網頁當前禁止訪問。對于這種情況,如果是新發現的url,百度spider暫不會抓取,短期內會再次檢查;如果是百度已收錄url,當前也不會直接刪除,短期內同樣會再訪問。屆時如果網頁允許訪問,則正常抓取;如果仍不允許訪問,短期內還會反復訪問幾次。但是如果網頁長期返回403,百度也會認為是失效鏈接,從搜索結果中刪除。
? 301
301返回碼的含義是“Moved Permanently”,百度會認為網頁當前跳轉至新url。當遇到站點遷移,域名更換、站點改版的情況時,推薦使用301返回碼,盡量減少改版帶來的流量損失。雖然百度spider現在對301跳轉的響應周期較長,但我們還是推薦大家這么做。
我們建議:
? 如果站點臨時關閉,當網頁不能打開時,不要立即返回404,建議使用503狀態。503可以告知百度spider該頁面臨時不可訪問,請過段時間再重試。
? 如果百度spider對您的站點抓取壓力過大,請盡量不要使用404,同樣建議返回503。這樣百度spider會過段時間再來嘗試抓取這個鏈接,如果那個時間站點空閑,那它就會被成功抓取了。
? 有一些網站希望百度只收錄部分內容,例如審核后的內容,累積一段時間的新用戶頁等等。在這種情況,建議新發內容暫時返回403,等審核或做好處理之后,再返回正常狀態的返回碼。
? 站點遷移,或域名更換時,請使用301返回。
良好排序
涵蓋網頁上主要內容的title
網頁的title用于告訴用戶和搜索引擎這個網頁的主要內容是什么,搜索引擎在判斷一個網頁內容權重時,title是主要參考信息之一。網頁title是網頁上主要內容的概括,搜索引擎可以通過網頁標題迅速的判斷網頁的主題。每個網頁的內容都是不同的,每個網頁都應該有獨一無二的title。
我們建議網頁標題可以這樣描述:
? 首頁:網站名稱 或者 網站名稱_提供服務介紹or產品介紹
? 頻道頁:頻道名稱_網站名稱
? 文章頁:文章title_頻道名稱_網站名稱
title指html文檔中的
評論(0人參與,0條評論)
發布評論
最新評論