在實際中,常用關鍵字密度來衡量頁面中關鍵字的詞頻是否合理。關鍵字的密度主要由”關鍵字詞頻“及”網頁總詞匯量“兩個因素來決定,三者關系如下:
關鍵字密度=關鍵字詞頻/網頁總詞匯量
式中,總詞匯量是指網頁程序標簽(如HTML標簽及ASP、Jsp、PHP等)以外的所有詞匯的數量。
而以下對關鍵字密度的理解是不正確的:關鍵字密度=關鍵字總字節數/網頁總字節數。
要了解關鍵字密度,我們先認識搜索引擎對網頁的粉刺方法。
中文關鍵字密度
1、 中文分詞
在中文里,字或詞之間并不存在自然分隔符,而且中文里的詞語通常由兩個或兩個以上的中文字符組成。因此,搜索引擎不能借助分隔符對網頁正文內容進行分切,而是按照某種算法把網頁正文內容劃分為若干個中文詞匯。
2、中文關鍵字密度
為了讓大家更容易理解中文關鍵字密度,下面舉一個簡單的例子進行說明。
例如網頁內容為”我的筆記本“,搜索引擎將其分切為”我“、”的“、”筆記本“,則關鍵字”筆記本“在這個文檔中的密度就是”1/3“。
對于短語關鍵字,通常通過計算組成短語里的每個詞的密度去衡量該短語的密度。例如,”智能手機走進大眾市場“可以且分為”智能“、”手機“、”走進“、”大眾“、”市場“。其中的”智能“及”手機“各出現了一次,則它們的關鍵字密度都是"1/5"。
關鍵字密度范圍
通過以上內容,我們知道了搜索引擎對頁面的分詞方法,以及如何計算中文關鍵字密度。但是,頁面中關鍵字密度在什么范圍才算合理呢?這個在不同的搜索引擎中會有所差別。一般認為,關鍵字密度在6%~8%是比較合理的。
為什么關鍵字密度在6%~8%的范圍較為合理呢?搜索引擎會吧對傳統食物的分析、統計結果作為制定算法的一個參考指標。例如,對N個網頁進行分析、統計后確定這個范圍。加強對傳統事物的觀察,對開展搜索引擎優化也是有一定幫助的。
關鍵字密度與頁面相關性
關鍵字密度是衡量網頁相關性的重要指標之一。搜索引擎會根據頁面中的每個關鍵字密度對網頁的主題進行定位。也就是說,如果我們的網頁要出現在某個關鍵字K的搜索結果中,最基本的是網頁中K的關鍵字密度要在某個特定的范圍內(如6%~8%)。
例如,要想讓你的網站中的某個頁面出現在”手機“的搜索結果中,則首要的條件就是該頁面上”手機“這個詞的密度要在某一個特定的范圍內。否則,就會被排除在搜索結果外。
對于短語關鍵字,除了評估組成短語的每個次的密度是否合理外,還要對統計該短語出現的頻率。例如,要評估頁面與”搜索引擎優化“的相關性,搜索引擎首先會計算頁面中的”搜索引擎“和”優化"這兩個詞的密度,在統計該短語出現的頻率,最后用這兩個數據進行綜合衡量。
評論(0人參與,0條評論)
發布評論
最新評論