網址規范化(URL canonicalization)指的是搜索引擎挑選最合適的URL作為真正(規范化的)網址的過程。
如下面這幾個URL一般指的是同一個文件:
http://www.domain.com/index.html
但是從技術上來講,這幾個URL都是不同的網址,搜索引擎也確實把它們當做不同的網址。雖然在絕大多數情況下,這些網址所返回的是相同的文件,也就是網站首頁,但是從技術上說,主機完全可以對這幾個網址返回不同的內容。
除了上面因為帶與不帶www造成的,以及結尾是否帶index.html文件名造成的不規范網址,網址規范化問題還可能由于如下原因出現:
CMS系統原因,使用一篇文章 (也可以是產品,帖子等)可以通過幾種不同的URL訪問。
URL靜態化設置錯誤,同一篇文章中有多個靜態化URL。
URL靜態化后,靜態和動態URL同時存在,都有鏈接,也可同時訪問。
目錄后帶與不帶斜杠
網址不規范會有什么問題:
CMS系統在不同地方鏈接到不同的URL,分散了頁面權重,不利于排名。
外部鏈接也可能指向不同URL,分散權重。
搜索引擎判斷的規范化網址不是站長想要的那個網址。
如果網址規范化問題太嚴重,也可能影響收錄,一個權重不很高的域名,能收錄的總頁面數和蜘蛛總爬行時間是有限的,搜索引擎把資源花在收錄不規范的網址上,留下給獨特內容的資源就減少了,
復制內容過多,搜索引擎可能認為有作弊嫌疑。
解決URL規范化問題的方法:
確保使用的CMS系統只產生規范化網址,無論是否有靜態化。
所有內部鏈接保持統一,都指向規范化網址。以帶與不帶www為例,確定一個版本為規范化網址,網址內鏈接統一使用這個版本,這樣搜索引擎也就明白哪一個是站長希望的規范化網址,由于用戶習慣,通常選擇帶www的版本為規范化網址。
在Google管理員工具中設置首選域。
使用301轉向,把不規范化URL全部轉向到規范化URL。
提交給搜索引擎的XML網址地圖中全部使用規范化網址。
評論(0人參與,0條評論)
發布評論
最新評論