讀一切好書,就是和許多高尚的人談話。——笛卡兒
在這個資料世界裡,如何讀懂資料,用好資料,對於個人和公司,都顯得非常重要了。因此,以資料為物件,學習相關的系統的知識,並且積極的實踐,以努力成為一名資料人才。
閱讀一些好書,是一種有效的學習方法。本文翻譯文章《Another 10 Free Must-Read Books for Machine Learning and Data Science》。它介紹十本優秀的免費的機器學習和資料科學相關的書籍,並且對每本書籍做了簡要的介紹和提供了閱讀的連結。
作者: Matthew Mayo
原文連結:
https://www.kdnuggets.com/2018/05/10-more-free-must-read-books-for-machine-learning-and-data-science.html
《Python Data Science Handbook》
作者:Jake VanderPlas
本書介紹了在Python中處理資料所必需的核心庫:特別是IPython,NumPy,Pandas,Matplotlib,Scikit-Learn和相關軟體包,本書假設您熟悉Python這門語言。若是您需要快速瞭解語言本身,請閱讀《A Whirlwind Tour of Python》,它是針對研究人員和科學家以快節奏方式介紹Python語言。
2 《Neural Networks and Deep Learning》
作者:Michael Nielsen
神經網路和深度學習是一本免費的線上書籍。 這本書將教你:
神經網路,一種美麗的生物學程式設計範例,使計算機能夠從觀察資料中學習
深度學習,一套強大的神經網路學習技術
神經網路和深度學習目前為影象識別,語音識別和自然語言處理中的許多問題提供了最佳解決方案。 本書將教您神經網路和深度學習背後的許多核心概念。
3 《Think Bayes》
作者:Allen B. Downey
Think Bayes是使用計算方法對貝葉斯統計資料的介紹。
本書以及Think X系列中的其他書籍的前提是,如果您知道如何程式設計,您可以使用該技能來學習其他主題。
大多數關於貝葉斯統計的書籍都使用數學符號,並根據微積分等數學概念提出想法。 本書使用Python程式碼而不是數學,而使用離散近似而不是連續數學。 因此,數學書中的積分將成為求和,並且大多數關於機率分佈的操作都是簡單的迴圈。
4 《Machine Learning & Big Data》
作者:Kareem Alkaseer
這是一項正在進行的工作,我在時間允許的情況下添加了這項工作。 其背後的目的是在理論和實踐之間取得平衡,以便軟體工程師能夠輕鬆地實現機器學習模型,而不必過多依賴庫。大多數情況下,模型或技術背後的概念是簡單或直觀的,但它會在細節或術語中迷失。 此外,大多數時候現有的庫可以解決手頭的問題,但是它們被視為黑盒子,而且往往它們有自己的抽象和體系結構隱藏了內在的概念。 本書的目的是使基本概念清晰明瞭。
5 《Statistical Learning with Sparsity: The Lasso and Generalizations》
作者:Trevor Hastie, Robert Tibshirani, Martin Wainwright
在過去十年中,計算和資訊科技出現了爆炸式增長。 隨之而來的是醫學,生物學,金融和市場營銷等各個領域的大量資料。 本書在一個共同的概念框架中闡述了這些領域的重要思想。
6 《Statistical inference for data science》
作者:Brian Caffo
本書是作為資料科學專項的一部分編寫的統計推理課程的配套書。 但是,如果你不上課,這本書大多是獨立的。 本書的一個有用組成部分是一系列包含Coursera課程的YouTube影片。
本書旨在以低成本的方式介紹統計推斷這一重要領域。標的受眾是具有數學和計算知識的學生,他們希望將這些技能用於資料科學或統計學。這本書是免費提供的github上的一系列Markdown檔案,以及在LeanPub和零售店的更方便的形式(epub,mobi)。
7 《Convex Optimization》
作者:Stephen Boyd and Lieven Vandenberghe
本書是關於凸最佳化的,這是一類特殊的數學最佳化問題,包括最小二乘和線性規劃問題。 眾所周知,最小二乘和線性規劃問題具有相當完整的理論,在各種應用中出現,並且可以非常有效地在數值上求解。 本書的基本觀點是也適用更大類的凸最佳化問題。
8 《Natural Language Processing with Python 》
作者:Steven Bird, Ewan Klein, and Edward Loper
這是一本關於自然語言處理的書。 “自然語言”是指用於人類日常交流的語言; 英語,印地語或葡萄牙語等語言。 與人工語言(如程式語言和數學符號)相比,自然語言在代代相傳的過程中不斷發展,並且很難用明確的規則來確定。 我們將廣義地採用自然語言處理(簡稱NLP)來涵蓋任何型別的自然語言計算機操作。
…
本書基於Python程式語言和一個名為Natural Language Toolkit(NLTK)的開源庫。
9 《Automate the Boring Stuff with Python》
作者:Al Sweigart
如果您曾經花費數小時重新命名檔案或更新數百個電子錶格單元格,那麼您就知道這些繁瑣的任務是多麼繁瑣。 但是,如果你可以讓你的電腦為你做這些,你會怎麼辦?
在使用《Automate the Boring Stuff with Python》時,您將學習如何使用Python編寫程式,這些程式可以在幾分鐘內完成手動操作所需的時間 – 無需先前的程式設計經驗。 一旦掌握了程式設計的基礎知識,您就可以建立Python程式,輕鬆地執行有用且令人印象深刻的自動化功能。
10 《Social Media Mining: An Introduction》
作者:Reza Zafarani, Mohammad Ali Abbasi and Huan Liu
過去十年社交媒體的發展徹底改變了個人互動和行業開展業務的方式。 個人透過社交媒體互動,分享和消費內容,以前所未有的速度生成資料。 理解和處理這種新型資料以得到可操作的樣式,為跨學科研究,新演演算法和工具開發提供了挑戰和機遇。 社交媒體挖掘集成了社交媒體,社交網路分析和資料挖掘,為學生,從業者,研究人員和專案經理提供了一個方便,連貫的平臺,以瞭解社交媒體挖掘的基礎和潛力。
您在閱讀的過程中,有什麼想法或者見解,請留言。
生活的全部意義在於無窮地探索尚未知道的東西,在於不斷地增加更多的知識。——左拉