本文轉自:資料派;翻譯:楊雪滌 ;校對:馮羽
本文為你分享分析領域的入門經驗,並推薦相關免費課程和書籍。
怎麼從程式設計零基礎到可以在科技和分析領域工作?
如果你對學習這些技能感興趣,不管是為了開心還是職業轉換,哪條路是最好的呢?
市面上有無數個網課清單,但你要怎樣分辨出最適合你的那一條路?
我自己從沒想過我會學習任何這方面的實操技能,像程式設計、資料分析、或相關科技。鑒於我是金融專業的,我總是設想我會成為一名“商務人士”。但不知怎麼的,我自學了Python和SQL,而且還在“Jet.com”找到了分析領域的工作,每天都會用到這些語言中的一種。
你可能會問,為什麼要學習Python和SQL?
Python是目前發展最迅速的程式語言( fastest growing programming)它擁有大量工具庫,可以用來編寫機器學習應用程式、資料分析、視覺化、網頁應用程式、API整合等。而且,它是最容易上手和掌握的語言之一。對於SQL,各種資料庫強化了技術公司的能力,SQL能讓你更好地理解、探索和利用收集到的資料。
下麵,我將講述一下我是怎樣從學習這些語言到入門資料分析的學習之路。講真,這條路很具有挑戰性。我曾有無數個夜晚感到心力交瘁。有很多個晚上我只想拱手認輸,安於當一名商務人士。
但是你內心的動力依然是在不可避免的各種阻力中推動你前進的關鍵。
不管你是想進軍資料分析、資料科學這類的領域,還是隻是覺得學一些程式設計和科技好玩兒(實際上它確實很好玩兒);如果你是真的想好好學的話,你要讓自己保持自律和動力滿滿。
對於我來說,每天回家後立即安排一定的時間(大約90分鐘到2小時)學習和練習,讓我形成了堅持的習慣並且徹底理解了那些我曾覺得迷惑的概念。
下麵是我的學習之路,希望能給大家一些啟發。
關鍵的基礎
1. 學習“Python the Hard Way”
這是我那個時期上過最好的課程之一。它是自主的、有挑戰性的,但Zed給了你 你學習在Python上程式設計足夠的細節和指導。他讓程式設計變得好理解,而且每週發放的學習材料真的會給你能學好Python的信心。
2. 樣式分析:Pandas
樣式分析給了Python一個完美的介紹,包括基於它最強的一個的資料結構的各種例子:pandas資料框( the Pandas DataFrame)。一旦你掌握了python的這些知識,學習資料分析就比較容易上手了。
3. 樣式分析:SQLMode Analytics: SQL
另一個關於SQL的學習教程也很棒。你可以學習到很多關鍵概念,打好SQL堅實的基礎。他們甚至有他們自己的SQL編輯器和你可以用來“玩耍”的資料。
連同樣式分析, W3 Schools可以解答任何你在學習過程中遇到的關於SQL的問題。
正確的地進入機器學習
在我完全掌握Python之前,我嘗試申請了優達學城的自駕車微學位。我知道這完全是我無法承擔的,但我想,為什麼不試試呢?
當被實際的應用程式而迷住時,你更容易激勵自己學習Python和機器學習。
在課程開始前我還有一個月的時間,所以我上了盡可能多的關於資料科學和機器學習的課。
這是我認為最好的、極有幫助的免費介紹類課程:
-
Udacity Machine Learning Intro(優達學城機器學習介紹)
-
Udacity Intro to Statistics(優達學城統計學介紹)
-
Udacity Intro to Data Science(優達學城資料科學介紹)
TensorFlow,由谷歌公司開發,是一個可以在Python上操作的開源機器學習工具包。它很強大,當然也值得被熟悉。
“MNIST exercise”是TensorFlow框架下一個極好的入門檢驗練習。
我發現 “Stanford CS231″這個課程也很有用。它包括了摺積神經網路(用在圖片或面部識別軟體裡),這對獲得自駕車微學位是極其有幫助的。如果你只是對圖片或影片形式的機器學習感興趣的話,你不會找到比這個課程更好的了。
最後,用這些資源搭建好堅實的基礎後,我開始了”Udacity Self Driving Car Nanodegree”.(優達學城自駕車微學位)的學習。
我不打算過多談論它因為已經有很多關於這門課的文章。我想說的是,儘管是我所經歷過的最具挑戰性的課程,但我還是能夠理解大部分的內容。有了正確的基礎知識,你會驚訝於你對複雜主題的理解有多深。
持續的分析和資料科學的學習
在深入學習了幾個月的機器學習之後,對我幫助很大的是後退一步,加強我對實用分析和資料科學原理的理解。
我開始學習如何用python學習資料科學,深度學習,和機器學習( Data Science, Deep Learning, & Machine Learning with Python),這是優達學城一門很棒的課程。在接觸機器學習時,它完全涵蓋了分析、資料科學和統計的原則,特別是圍繞不同的資料挖掘技術和部署它們的實際場景。
《 Data Science For Business 》一書中,也很好地解釋了某些模型在解決特定環境中的問題時是如何工作的以及為什麼會起作用;它會強化你的分析框架和思維樣式,以適應圍繞資料問題出現的任何情況。這是我發現的最好的資源,它將不同的分析方法與特定的業務情況和問題聯絡起來。
當然,如果你對從事分析或資料科學的職業感興趣,你應該經常鍛煉你曾經擁有的技能,然後繼續增加新的技能。FreeCodeCamp和 Hackernoon釋出了關於所有資料科學和軟體工程的資訊文章和教程。最近我最喜歡的文章是一篇關於寫自己的區塊鏈(blockchain)的教程。
你想知道繼續學習的最好方法嗎?
構建一些東西。任何東西。探索資料集。找出一個你或你的公司面臨的實際問題,並試著去解決它。
即使你無法訪問公司的高質量資料,也有大量的開源資料集可供你使用和練習。我敢打賭,你會學到和學習任何課程或閱讀任何書一樣多的東西,甚至更多。
最後,與擁有你想要獲得的技能的人見面和學習是非常有益的。我強烈建議您使用 Meetup 來在您的地區尋找分析或軟體專業人員。許多這樣的團體都有免費的教程或學習課程,你會遇到很多超級聰明的人,他們可以提供一些技巧和技巧來加速你的學習。
在紐約市,一些幫助過我的團體是:
-
Machine Learning Society
-
Google Developer Group
-
NYAI
-
New York Data Science
祝你學習愉快!
原文標題:
Teach Yourself Data Science: the learning path I used to get an analytics job at Jet.com
連結:
https://medium.freecodecamp.org/a-path-for-you-to-learn-analytics-and-data-skills-bd48ccde7325
譯者:楊雪滌,目前就讀於北京科技大學。對國際交流、英語學習和大資料很感興趣,善於將大資料靈活地運用到生活中。曾作為捷克斯洛伐克代表參加2017年哈佛大學模擬聯合國,並利用寒假赴巴釐島支教一週。
本文轉自:資料派THU 公眾號;
END
關聯閱讀:
原創系列文章:
資料運營 關聯文章閱讀:
資料分析、資料產品 關聯文章閱讀: