Richard S. Sutton是加拿大的一名電腦科學家,目前是阿爾伯塔大學電腦科學教授和iCORE主席。Sutton被認為是現代強化學習的奠基人之一,主要有以下幾個顯著的貢獻,包括時間差分學習、策略梯度法、在Dyna架構, 由其主筆撰寫的書:《Reinforcement Learning: An Introduction》,一直被視為強化學習領域的聖經。
該書自2014年以來一直在不停的修訂和完善,今年Sutton又分享了他最新版本的強化學習入門的最新版本,內容比去年的版本豐富了很多,頁數增加到548頁,非常值得閱讀學習。附全書下載連結:
連結: https://pan.baidu.com/s/10uPubO7Pw_IpVdcEpR97FA
密碼: 5wmt
附加福利
小編認識的一位快手的HR朋友正急招深度強化學習、機器學習相關的技術人員,感興趣的朋友可以與她聯絡,投遞簡歷。
附職位介紹及聯絡方式。
機器學習-深度強化學習工程師/研究員
基本項
1. 教育背景:本科/研究生 學校,專業相關
2. 研究背景
● 研究方向:機器學習、樣式識別、資料挖掘等
● 論文質量/數量,研究經歷
加分項 (有一項及以上較突出)
1. 開源專案(github),技術部落格
2. 競賽:ACM、Kaggle/KDD等
3. 相關技術方向經驗
● 強化學習,遊戲AI(完全資訊/非完全資訊博弈),推薦系統
職位描述:
工作職責:
1、深度學習、強化學習等前沿技術方向研究,探索個性化推薦/廣告、遊戲AI等不同領域應用
基本要求:
1、計算機/電子/數學等相關專業 碩士及以上學歷
2、機器學習/深度學習領域 2年以上 研究/應用 經驗
3、較強程式設計能力:Python/C/C++
4、熟悉常見深度學習框架:Tensorflow/PyTorch/Caffe2
聯絡方式:
郵箱:yumenglei@kuaishou.com