最近,搜索引擎戰略會議在寒冷的芝加哥舉行.許多谷歌參加者總是被問及關于重復內容的問題.對于這個話題,我們發現有許多破碎的并且有些混亂的理解.我們想在此予以澄清.
最近,搜索引擎戰略會議在寒冷的芝加哥舉行.許多谷歌參加者總是被問及關于重復內容的問題.對于這個話題,我們發現有許多破碎的并且有些混亂的理解.我們想在此予以澄清.
什么是內容重復?
重復的內容一般是指在不同域名間存在大量的相同或相似的內容.很多時候,它并非故意或至少本無惡意.譬如說,有些論壇會生成一些專為手機屏幕的頁面;商店物品被顯示在(有時甚至是鏈接到)多種不同的URL上,等等.但有些時候,一些網站為了操縱搜索引擎排名,獲得更多流行或長尾查詢的訪問量,大量地從其他網站復制內容.
什么不是重復內容?
雖然谷歌網站有方便易用的翻譯功能,我們的算法不會把有著相同內容的英文版和西班牙文版看作內容復制.同樣,你不用擔心我們把你文章中對其他文章小片段的引用認定為重復內容.
什么谷歌關心重復內容?
谷歌用戶使用Google時通常希望看到多樣化的原創內容.如果他們找到的都是內容相同的一堆搜索結果,可以想見那是多么煩人.另外,網站管理員不愿意看到Google給出象一樣復雜的URL.他們往往更喜歡類似的URL.
谷歌做了些什么?
Google在抓取網頁和獲得搜索結果時,總是力圖索引并顯示內容不同的頁面.這種過濾意味著,譬如說,如果你的網站有文章的正常版和打印版,并且你沒有在里設定noindex標記,谷歌就只會選擇一個版本顯示給谷歌用戶.對于企圖利用復制內容來操控排名,欺騙谷歌用戶的少數情況,我們會在對相關頁面的索引和排名作出適當調整.當然,我們更愿意把重點放在過濾而不是排名調整上… 因此,在絕大多數情況下,最壞的結果就是原創者看到了不愿看到的版本出現在我們的索引里.
網站管理員如何主動處理內容復制問題?
適當阻止搜索引擎訪問:與其讓我們的算法來確定一個文件的"最佳"版本,你也許希望指引谷歌選取你的首選版本.譬如說,如果你不想我們索引你網站文章的打印版,你可以在你的文件中寫上目錄名或正則表達式來禁止谷歌對那些打印版的抓取.
使用301重定向:如果你已經重構你的網站,請在你的原網站的.htaccess中使用301重定向(永久性重定向)來重定向你的用戶、Google爬蟲、以及其他搜索引擎蜘蛛等.
鏈接要一致:努力使你的內部鏈接保持一致; 不要既有/page/,又有/page和/page/ 的內部鏈接
使用頂級域名:為了讓我們總是使用最合適的文件版本, 請盡可能使用國家特定的頂級域名.與諸如或的URL相比,谷歌肯定更清楚地知道是以德文為核心的內容.
小心辛迪加式的聯合供文:如果你為其他網站上也提供你的內容,請在每一個其他網站的文章中包括連回原文章的鏈接.注意:即使是這樣,對一個查詢,谷歌總是顯示我們認為是最適合的(沒被網站禁止的)版本, 它可能是,也有可能不是你所想要的版本.
使用谷歌網站管理員工具的首選域功能: 如果其他網站鏈接你的URL時既使用www版本又使用無www的版本,你可以用谷歌網站管理員工具讓我們知道你想要哪種索引方式.
減少模板網頁上的重復內容:拿版權聲明來說,你有兩種選擇,一種是在你的每一個頁面底部都有一個冗長的版權聲明.另一種是設立一個專門的版權詳細聲明頁,然后在每頁底部寫一個非常簡短的總結,并鏈接到版權聲明頁.
避免發布無內容頁:用戶不喜歡看到無實際內容的頁面.要盡量避免空架頁.以房地產網頁為例,不要發布(或至少要阻止)沒有點評的點評網頁,或者沒有房地產列表的房地產羅列網站等.只有這樣,網站用戶(以及Google爬蟲)才不會看到無窮多的寫著"以下是在【某城市名】中不可錯失的待租房列表…"但其實根本沒有什么列表的網頁.
評論(0人參與,0條評論)
發布評論
最新評論