歡迎光臨
每天分享高質量文章

【演演算法】基於內容的個性化推薦演演算法

小編邀請您,先思考:

1 如何做內容推薦?

2 如何給一個購物中心推薦品牌?

個性化推薦演演算法有許多類別,主要包括基於內容的推薦、協同過濾、SVD、基於知識的推薦以及混合推薦演演算法。

本文介紹基於內容的推薦演演算法(Content-based Recommendation)

基於內容的推薦演演算法(以下簡稱“內容推薦演演算法”)只有一個關鍵點——標簽(tag)。推薦演演算法將產品分解為一系列標簽,並根據使用者對產品的行為(例如,購買、瀏覽)將使用者也描述為一系列標簽。

內容推薦演演算法的原理

1. 將產品分解為一系列標簽。例如,一個手機產品的標簽可以包括品牌、價格、產地、顏色、款式等。如果是自營b2c電商,一般可以在產品入庫時手動打標簽。

2. 基於使用者行為(瀏覽、購買、收藏)計算每個使用者的產品興趣標簽。例如,使用者購買了一個產品,則將該產品的所有標簽賦值給該使用者,每個標簽打分為1;使用者瀏覽了一個產品,則將該產品的所有標簽賦值給該使用者,每個標簽打分為0.5。計算複雜度為:已有產品數量*使用者量。該過程為離線計算。

3. 針對所有新產品,分別計算每個使用者的產品標簽與每個新產品的相似度(基於cosine similarity)。計算複雜度為:新產品數量*使用者量。該過程為線上計算。



從可行性角度,一個應用場景是否適合用內容推薦演演算法取決於

1. 是否可以持續為產品打標簽。

2. 標簽是否可以改寫產品的核心屬性?例如,手機產品的標簽一般可以改寫消費者購物的核心決策因素,但是女裝一般比較難(視覺效果很難被打標)。

內容推薦演演算法的優勢

1. 推薦結果可理解:不僅每個使用者的核心興趣點可以被標簽化(便於理解每個使用者的興趣),並且可以在每一個推薦結果的展示中現實標簽,便於消費者理解推薦結果(如下圖紅框)。

2. 推薦結果穩定性強:對於使用者行為不豐富的產品型別(例如,金融產品),協同過濾很難找到同興趣使用者群或關聯產品,在相似度計算中稀疏度太高。然而,內容推薦主要使用標簽,標簽對使用者興趣捕捉穩定性要遠遠高於單個產品。

3. 便於人機協作:使用者可以勾選或者關註推薦標簽,從而透過自己的操作來發現自己的個性化需求。



內容推薦演演算法的劣勢

1. 不適合發現驚喜:如果一個產品不易於被標簽窮舉或描述產品的標簽還沒出現,則該產品很難被準確推薦。

2. 線上應用計算複雜度較高:需要基於每個使用者來計算相似產品。

連結:https://www.jianshu.com/p/4943455e59d7

親愛的讀者朋友們,您們有什麼想法,請點選【寫留言】按鈕,寫下您的留言。



資料人網(http://shujuren.org)誠邀各位資料人來平臺分享和傳播優質資料知識



公眾號推薦:

360區塊鏈,專註於360度分享區塊鏈內容

    腳印英語,專註於分享實用口語內容。



閱讀原文,更多精彩!

分享是收穫,傳播是價值!


贊(0)

分享創造快樂

© 2024 知識星球   網站地圖