看看對模型推薦其重要作用的四類特征。
下面就來看與模型推薦相關聯的四種特征:
第一種特征就是熱度特征,其中就涵蓋了各個方面的熱度,例如網站主題的熱度,帖子內容分類的熱度,以及網站中關鍵詞的熱度。而那些內容的熱度信息在一些大型網站中會有一些意想不到的效用。
第二種特征就是相關性的特征,相關性就是要將文章的內容屬性要與用戶的需求相匹配。而這里的匹配分為顯性匹配和隱性匹配,像一些文章分類的匹配,網頁中關鍵詞的匹配,頁面主題的匹配等等這些都屬于顯性匹配。像一些FM模型中的匹配那就是隱性匹配。這些我們可以從內容與用戶的向量距離可以看出。
第三種特征就是我們常說的協同特征,這一特征在一定程度上解決了算法越走越艱難的問題。協同特征并不是看用戶所瀏覽的內容,而是通過對一個個用戶的分析來判斷不同用戶之間是否存在相似,比如興趣相似,主題相似,亦或者是點擊相似,從這幾個方面我們就可以擴展模型的搜索能力。
第四種特征就是環境特征,這一特征包括文章的發表時間,發表地點等等,這既是bias特征,也是匹配特征。
在模型的訓練上,絕大多數的網站都推薦自己旗下的產品能夠采用實時訓練。在這里的實時訓練不僅節省資源而且用戶對于產品的反饋也非常快。要知道在我們的網站中現如今的網站處理是要樣本數據的。這里面包括點擊率,展覽次數以及分享程度的動作類型等等。
評論(0人參與,0條評論)
發布評論
最新評論