為什麼學習Python做資料科學?
在我們探索學習Python做資料科學之前,我們應該簡要地回答一下為什麼首先應該學習Python。
簡而言之,掌握Python是資料科學職業所需要的寶貴技能之一。
雖然Python並不總是這樣,但它是資料科學的首選程式語言。以下是一段簡短的歷史:
-
2016年,它在資料科學競賽的首要平臺Kaggle上超越了R。
-
2017年,在KDNuggets對資料科學家最常用工具的年度調查中,它超越了R。
-
2018年,66%的資料科學家表示每天都在使用Python,這使得Python成為分析專業人士的首選工具。
資料科學專家預計這種趨勢將隨著Python生態系統的不斷發展而繼續下去。雖然您學習Python程式設計的旅程可能剛剛開始,但很高興知道就業機會也很豐富(而且還在增加)。
事實上,資料科學家的平均工資是127,918美元。
好訊息嗎?預計這個數字只會增加。IBM的專家預測,到2020年,對資料科學家的需求將增加28%。
因此,資料科學的未來是光明的,而Python只是眾所周知的餡餅中的一塊。幸運的是,學習Python與其它程式設計一樣容易。我們將透過五個簡單的步驟向您展示。
但是請記住——僅僅因為步驟簡單並不意味著你不需要投入工作。如果你全身心地投入到學習Python中,並投入有意義的時間,你不僅有可能掌握一項新技能,而且有可能將你的職業生涯提升到一個新的水平。
如何學習Python做資料科學
(點選圖片放大檢視,需要加入資料人圈子,請加微信:luqin360)
第一步:學習Python基礎
每個人都從某處開始。第一步是學習Python程式設計基礎。您還需要資料科學的介紹。
您應該在旅程的早期開始使用的重要工具之一是Jupyter Notebook,它預裝了Python庫,可以幫助您快速高效地學習。
開始你的學習:加入一個社群
透過加入一個社群,你可以結交志同道合的人,增加你的就業機會。根據美國人力資源管理協會(Society for Human Resource Management)的資料,員工推薦佔所有員工的30%。
建立一個Kaggle帳戶,加入一個本地的Meetup小組,並參與Dataquest與當前學生和校友的成員間的輕鬆討論。
相關技能:嘗試命令列介面
命令列介面(CLI)使您可以更快地執行指令碼,允許您更快地測試程式並處理更多的資料。
第二步:練習迷你的Python專案
我們真的相信實踐學習。您可能會驚訝地發現,很快就可以構建小型Python專案了。
試著編寫一些程式,比如線上遊戲的計算器,或者從谷歌上獲取你所在城市的天氣資訊程式。構建這樣的小型專案將幫助您學習Python。像這樣的程式設計專案是所有語言的標準,也是鞏固您對基礎知識理解的好方法。
您應該開始構建您的api經驗,並開始web抓取。除了幫助您學習Python程式設計,web抓取還將對您以後收集資料非常有用。
開始你的學習:閱讀
加強你的課程學習,找到你遇到的Python程式設計挑戰的答案。閱讀指南、部落格文章,甚至其他人的開放原始碼,學習Python和資料科學的最佳實踐,並獲得新的想法。
由Al Sweigart編寫的用Python自動處理無聊的東西是一種優秀的娛樂資源。
相關技能:使用SQL處理資料庫
SQL用於與資料庫通訊,以更改、編輯和重組資訊。SQL是資料科學社群的主要工具,一份報告顯示40%的資料科學家在使用它。
第三步:學習Python資料科學庫
與其他一些程式語言不同,在Python中,通常有一種最好的方法。用於資料科學的三個最佳和最重要的Python庫是NumPy,Pandas和Matplotlib。
NumPy和Pandas非常適合探索和玩資料。Matplotlib是一個資料視覺化庫,可以生成您在Excel或Google表格中找到的圖表。
開始您的學習:提出問題
你不知道你不知道的是什麼!
Python擁有豐富的專家社群,他們渴望幫助您學習Python。像Quora,Stack Overflow和Dataquest的Slack這樣的資源讓很多人興奮地分享他們的知識並幫助你學習Python程式設計。我們還為每個任務提供常見問題解答,以幫助您在使用Dataquest程式設計課程中遇到的問題。
相關技能:使用Git進行版本控制
Git是一種流行的工具,可以幫助您跟蹤對程式碼所做的更改,從而更容易糾正錯誤,實驗和與他人協作。
第四步:構建您的資料科學專案
對於有抱負的資料科學家來說,資料科學專案是必須的。
這些專案應該包括幾個不同的資料集,並且應該給讀者留下您已經收集到的有趣見解。您的資料科學專案不需要特定的主題;找到您感興趣的資料集,然後想出一種將它們組合在一起的方法。
顯示這些專案可以讓同行資料科學家們進行合作,並向未來的僱主展示您真正花時間學習Python和其他重要的程式設計技能。
資料科學的一個好處是,您的資料科學專案可以兼作簡歷,同時突出您學到的技能,如Python程式設計。
開始您的學習:溝通,協作並專註於技術能力
在此期間,您需要確保培養與他人合作所需的軟技能,確保您真正瞭解您正在使用的工具的內部工作原理。
相關技能:學習初級和中級統計
在學習Python用於資料科學的同時,您還希望獲得統計學方面的扎實背景。瞭解統計資料將為您提供專註於正確事物所需的思維樣式,因此您將找到有價值的見解(和真正的解決方案),而不僅僅是執行程式碼。
第五步:應用高階資料科學技術
最後,旨在提高你的技能。您的資料科學之旅將充滿不斷的學習,但您可以完成高階課程,以確保您已涵蓋所有基礎。
您希望對回歸,分類和k-means聚類模型感到滿意。您還可以進入機器學習 – Bootstrapping 模型和使用scikit-learn建立神經網路。
此時,程式設計專案可以包括使用實時資料源建立模型。這種機器學習模型隨著時間的推移調整其預測。
記住:繼續學習!
資料科學是一個跨越眾多行業的不斷發展的領域。
按需求增長的速度,有指數級的學習機會。繼續閱讀,協作和與他人交談,隨著時間的推移,您一定會保持興趣和競爭優勢。
學習Python需要多長時間?
閱讀完這些步驟後,我們讓人們問到的最常見的問題是:“這需要多長時間?”
學習Python需要花費大量時間。具體而言,對於資料科學,估計從一個實踐的3個月到一年的範圍。
我們看到人們以閃電般的速度穿過我們的課程,而其他人則更慢。
實際上,這一切都取決於您所希望的時間表,您可以專註於學習Python程式設計的空閑時間以及您學習的速度。
Dataquest的課程是為您自己建立的。每條路徑都充滿了任務,實踐學習和提問的機會,這樣您就可以深入掌握資料科學的基礎知識。
免費入門。透過我們的學習Python做資料科學路徑,並立即開始掌握一項新技能。
原文連結:
https://www.dataquest.io/blog/how-to-learn-python-for-data-science-in-5-steps/
朋友會在“發現-看一看”看到你“在看”的內容