2016 年以來,IT行業最大的技術突破應該是人工智能了,不僅在一年左右時間,在最后一個人類曾經自以為機器很難戰勝人類的游戲項目上完勝人類,前幾天更是出現了逆天的AlphaGo Zero,完全不用借鑒人類知識,自學 3 天就超越了人類。
人工智能領域最牛X的公司,國外是Google,國內是百度。都是搜索引擎。這恐怕也不是什么巧合,而是因為搜索引擎是最適合開發人工智能的公司,他們擁有最大量的數據,包括文字、圖片、視頻,還有地圖、路況、用戶使用數據等等。
搜索引擎公司的AI成果在多大程度上運用到了他們的核心業務-搜索中?他們都沒有明確地對外說明,從搜索工程師的零碎發言中猜測,至少目前還沒有大規模使用,并沒有改變搜索算法的基礎。畢竟人工智能雖然概念存在了幾十年,但效果突飛猛進只是近幾年的事,還沒有出現通用人工智能,在圍棋這種規則簡單明確的領域中牛X,遷移到規則模糊的系統中,比如搜索,還需要一些時間。
但我想,人工智能大規模應用于搜索算法是早晚的事。據說以前百度大搜索部門和人工智能/深度學習部門之間是有些矛盾的,現在吳恩達離開了百度,陸奇對百度又進行了很多人事調整,搜索部門對人工智能的排斥也許就大大降低了。
2015 年上線的Google RankBrain解決的也是對查詢詞的深入理解問題,尤其是比較長尾的詞,找到與用戶查詢詞不完全匹配、但其實很好回答了用戶查詢的那些頁面。和百度DNN是非常類似的。Google沒有具體說明RankBrain的訓練方法,估計和百度DNN也是類似的。
2015 年RankBrain上線時,15%的查詢詞經過RankBrain處理, 2016 年所有查詢詞都要結果RankBrain處理。
Google自己經常舉的RankBrain例子是這個查詢:
What’s the title of the consumer at the highest level of a food chain
這個查詢詞相當長尾,完全匹配的結果比較少,而且查詢中的幾個詞容易有歧義,比如consumer通常是消費者的意思,food chain也可以理解為餐飲連鎖,但這個完整的查詢和商場、消費者、飯館之類的意思沒有任何關系,RankBrain能理解其實用戶問的是食物鏈頂端的物種是什么名字。同樣,搜索結果不能按照傳統的關鍵詞匹配來處理。
這種長尾查詢數量很大,每天Google收到的查詢里有15%是以前都沒出現過的。這種查詢要靠關鍵詞匹配就比較難以找到高質量頁面,數量太少,甚至沒有,但理解了查詢的語義和意圖,就能找到滿足用戶需求的、關鍵詞并不完全匹配的頁面。
對SEO的影響以后再詳細寫,這里只是先簡單提示一下:頁面要包含關鍵詞,這在目前的關鍵詞優化過程中是必然的,現在搜索引擎能理解兩句不同的話意思是一樣的了,以后創作或編輯頁面內容時,是不是還一定要包含關鍵詞呢?
評論(0人參與,0條評論)
發布評論
最新評論