資料人才公眾號釋出的一系列工作機會,發現編寫Python程式碼和使用Python解決資料科學問題,已是一項重要的技能。
資料挖掘工程師職位
風險策略分析師職位
高階資料挖掘工程師職位
本文給大家推薦3本利用Python解決資料科學問題的書籍。
1 Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython
這本書是由Pandas庫的作者 Wes McKinney所寫。利用Python做資料分析,pandas庫我們必須要學,並且要熟練和靈活使用。你若是剛使用Python的資料分析師,或者你是想瞭解和學習資料分析或者資料科學的Python程式員,強烈推薦你認真地閱讀這本書,並且結合書本的配套原始碼做編碼練習和實際應用。你可以使用pandas庫有效地完成資料的載入,清洗,轉換,合併和重塑等任務。
原始碼的github連結:https://github.com/wesm/pydata-book
原始碼下載
1git clone https://github.com/wesm/pydata-book.git
2 Python Data Science Handbook: Essential Tools for Working with Data
熟悉Python程式碼編寫的資料工作人員會發現,這本書非常適合日常處理實際問題:操作、轉換和清洗資料,視覺化不同型別的資料,並利用資料構建統計或者機器學習模型。透過本書,你可以學習到這些內容。
IPython and Jupyter:一個為資料工作者使用Python提供的計算科學環境
Numpy:一個用於Python高效儲存和操作密集資料的n維陣列
Pandas:一個Python做資料分析的庫,可以結合第一本書的內容更深入地學習和更靈活地應用。
Matplotlib:一個強大的資料視覺化庫。
Scikit-Learn:一個Python做機器學習的庫,可以完成機器學習裡面許多工,例如:特徵工程,分類,回歸,聚類,降維等。
原始碼的github連結:https://github.com/jakevdp/PythonDataScienceHandbook
原始碼下載
1git clone https://github.com/jakevdp/PythonDataScienceHandbook.git
3 Python machine learning
這本書詳細而系統地介紹了Python,Scikit-learn和tensorflow做機器學習和深度學習的事情,裡面涉及一系列機器學習演演算法,比方說:傳統機器學習演演算法,深度學習演演算法,整合演演算法等。
原始碼的github連結:
https://github.com/rasbt/python-machine-learning-book-2nd-edition
原始碼下載
1git clone https://github.com/rasbt/python-machine-learning-book-2nd-edition.git