百度是如何把搜索結(jié)果序列展現(xiàn)給用戶的




要探討當(dāng)用戶使用百度搜索引擎查詢關(guān)鍵詞的時候,百度如何把結(jié)果序列展現(xiàn)給用戶。
一、特征詞庫的類別的建立與更新
眾所周知,百度有特征詞庫,通過特征詞庫,可以對用戶查詢序列,進(jìn)行判斷。例如:當(dāng)用戶搜索“天龍八部在線觀看” 、 “射雕英雄傳在線觀看” 、 “鹿鼎記在線觀看” 、 “電視劇在線觀看” 時, 由于這些待挖掘序列中的 “天龍八部” 、 “射雕英雄傳” 、 “鹿鼎記” 、 “電視劇” 在需求特征詞庫中屬于視頻類需求的特征詞, 并且 “在線觀看” 這一關(guān)鍵詞與上述視頻類需求的特征詞的共現(xiàn)頻次達(dá)到一定閾值(共現(xiàn)閾值)時,根據(jù)關(guān)鍵詞 “在線觀看” , 提取關(guān)鍵詞 “在線觀看” 與視頻需求類別的映射關(guān)系, 并根據(jù)映射關(guān)系來建立或更新需求特征詞庫。
二、對詞條的分類
首先對查詢序列進(jìn)行切詞處理獲得切分后的詞條, 再通過諸如對詞條進(jìn)行語義分析或根據(jù)詞條在需求特征詞庫中進(jìn)行匹配查詢等方式, 來獲得所述候選需求類別。例如:用戶的查詢序列為 “土豆上的熱門影視劇” 時, 通過對其進(jìn)行切詞處理, 得到 “土豆 /熱門 / 影視劇” , 由于影視劇一詞具有明顯的需求類別, 諸如視頻、 下載、 圖片、 演員介紹,再通過諸如對詞條進(jìn)行語義分析或根據(jù)所述詞條在需求特征詞庫中進(jìn)行匹配查詢等方式, 來獲得候選需求類別。
當(dāng)挖掘序列相對應(yīng)的分類結(jié)果的用戶累計點擊次數(shù)超過預(yù)設(shè)點擊閾值時, 基于所述分類結(jié)果所對應(yīng)的需求類別, 提取待挖掘序列與需求類別的映射關(guān)系, 并根據(jù)映射關(guān)系來建立或更新需求特征詞庫,例如, 當(dāng)待挖掘序列為“日本地震” 時, 根據(jù)該待挖掘序列對應(yīng)的分類結(jié)果, 如視頻類搜索結(jié)果、 新聞類搜索結(jié)果、圖片類搜索結(jié)果, 若視頻類搜索結(jié)果對應(yīng)的用戶累計點擊次數(shù)為 300, 新聞類搜索結(jié)果對應(yīng)的用戶累計點擊次數(shù)為 25000, 圖片類搜索結(jié)果對應(yīng)的用戶累計點擊次數(shù)為 700, 預(yù)設(shè)點擊閾值為 10000 時, 將待挖掘序列對應(yīng)的分類結(jié)果的用戶累計點擊次數(shù)與預(yù)設(shè)點擊閾值進(jìn)行比較, 并根據(jù)高于所述預(yù)設(shè)點擊閾值的分類結(jié)果所對應(yīng)的需求類別, 即新聞需求類別, 提取該待挖掘序列與新聞需求類別間的所述映射關(guān)系, 并根據(jù)映射關(guān)系來建立或更新需求特征詞庫。
三、獲取需求度
1、獲取與用戶的查詢序列相對應(yīng)的原始搜索結(jié)果
2、獲取與查詢序列相對應(yīng)的候選需求類別
對原始搜索結(jié)果進(jìn)行處理,根據(jù)查詢序列, 通過諸如對查詢序列進(jìn)行語義分析或根據(jù)查詢序列在需求特征詞庫中進(jìn)行匹配查詢等方式, 來獲得候選需求類別。例如, 當(dāng)用戶的查詢序列為 “土豆上的熱門影視劇” 時, 通過對其進(jìn)行切詞處理, 得到 “土豆 / 熱門 /影視劇” , 由于影視劇一詞具有明顯的需求類別, 諸如視頻、 下載、 圖片、 演員介紹, 對該查詢序列進(jìn)行語義分析或在需求特征詞庫中進(jìn)行匹配查詢, 來獲得候選需求類別, 例如根據(jù) “影視劇” 可知該查詢序列對應(yīng)的候選需求類別包括視頻、 下載、 圖片、 演員介紹。
3、根據(jù)查詢序列與候選需求類別,確定與查詢序列相對應(yīng)的類別需求度
根據(jù)查詢序列和候選需求類別, 通過諸如對該查詢序列所對應(yīng)的搜索結(jié)果按類別進(jìn)行統(tǒng)計分析或者對關(guān)于搜索結(jié)果的歷史點擊記錄按類別進(jìn)行統(tǒng)計分析, 確定所述查詢序列對于每一候選需求類別的類別需求度。例如:“×× 影視明星” 時, 根據(jù)查詢序列,得到候選需求類別包括視頻、 新聞、 背景介紹、 音樂、 圖片, 然后根據(jù)查詢序列和候選需求類別, 通過諸如對該查詢序列所對應(yīng)的搜索結(jié)果按類別進(jìn)行統(tǒng)計分析或者對關(guān)于搜索結(jié)果的歷史點擊記錄按類別進(jìn)行統(tǒng)計分析, 確定與所述查詢序列相對應(yīng)的類別需求度, 如, “×× 影視明星” 查詢序列在視頻類的類別需求度為 0.3 ; 查詢序列在新聞類的類別需求度為 0.3 ; 查詢序列在背景介紹類的類別需求度為 0.1 ; 查詢序列在音樂類的類別需求度為 0.2 ; 以及查詢序列在圖片類的類別需求度為 0.1。
需求度確定:
用戶的查詢序列為 “×× 影視明星” , 將查詢序列在需求特征詞庫中進(jìn)行匹配查詢,當(dāng)在需求特征詞庫中匹配查詢到 ×× 影視明星屬于明星列表并且該明星列表對應(yīng)的需求類別包括視頻、 新聞、 背景介紹、 音樂和圖片時,得到與查詢序列相對應(yīng)的候選需求類別包括視頻、 新聞、 背景介紹、 音樂和圖片。結(jié)合該查詢序列相應(yīng)的大量用戶的點擊統(tǒng)計分析, 如:統(tǒng)計分析結(jié)果中表明視頻類搜索結(jié)果、 新聞類搜索結(jié)果、 背景介紹類搜索結(jié)果、 音樂類搜索結(jié)果與圖片類搜索結(jié)果的用戶點擊頻次分別為 60000 次、 10000 次、 10000 次、 10000 次和10000 次, 則查詢序列對于視頻類搜索結(jié)果的類別需求度為 0.6, 而對于圖片類搜索結(jié)果的類別需求度為0.1。