歡迎光臨
每天分享高質量文章

【演演算法】邏輯回歸(Logistic Regression) 模型

小編邀請您,先思考:

1 邏輯回歸演演算法的原理是什麼?

2 邏輯回歸演演算法的有哪些應用?


邏輯回歸(Logistic Regression)是機器學習中的一種分類模型,由於演演算法的簡單和高效,在實際中應用非常廣泛。本文作為美團機器學習InAction系列中的一篇,主要關註邏輯回歸演演算法的數學模型和引數求解方法,最後也會簡單討論下邏輯回歸和貝葉斯分類的關係,以及在多分類問題上的推廣。

邏輯回歸

問題

實際工作中,我們可能會遇到如下問題:

  1. 預測一個使用者是否點選特定的商品

  2. 判斷使用者的性別

  3. 預測使用者是否會購買給定的品類

  4. 判斷一條評論是正面的還是負面的

這些都可以看做是分類問題,更準確地,都可以看做是二分類問題。同時,這些問題本身對美團也有很重要的價值,能夠幫助我們更好的瞭解我們的使用者,服務我們的使用者。要解決這些問題,通常會用到一些已有的分類演演算法,比如邏輯回歸,或者支援向量機。它們都屬於有監督的學習,因此在使用這些演演算法之前,必須要先收集一批標註好的資料作為訓練集。有些標註可以從log中拿到(使用者的點選,購買),有些可以從使用者填寫的資訊中獲得(性別),也有一些可能需要人工標註(評論情感極性)。另一方面,知道了一個使用者或者一條評論的標簽後,我們還需要知道用什麼樣的特徵去描述我們的資料,對使用者來說,可以從使用者的瀏覽記錄和購買記錄中獲取相應的統計特徵,而對於評論來說,最直接的則是文字特徵。這樣拿到資料的特徵和標簽後,就得到一組訓練資料:

其中