資料科學學習浪潮已起
前幾天小阿哥接到了一個在美國留學的生物醫學博士發自“靈魂”的提問:一直研究生物醫學至博士,明年博士畢業,但是想轉行做Data研究,求推薦單位~
小阿哥接觸到的很多留學生學習資料科學的意願都非常強烈。不論是金融專業還是商業分析,再或者電腦科學科班出身,還是生物醫學等專業的學生都對資料科學情有獨鐘,他們都一致認為資料科學是學歷之外,最能提升個人核心競爭力的技能。
說到原因,不論是北美的留學生還是澳洲的留學生,大家普遍反應是兩點原因:
1. 想進頂尖企業,只有不斷提升自己的競爭力,尤其要進矽谷的網際網路企業,“資料科學”幾乎成為標配;
2. “技多不壓身”的普遍共識:資料科學會成為未來20年的一個職場硬技能,掌握這個技能如手中捧著一個“金飯碗”。
競爭不可怕,沒有在競爭中生存的本領才可怕。
國內某知名大廠的技術總監,做技術研發已經10年,從日夜敲程式碼的程式員做起,一直做到了事業部的技術總監,竟然也在認認真真學習資料科學。
聽到他的出身背景時,我目瞪口獃:因為憑他的 title, 完全可以招一個的資料科學家,而他要從頭學起!問及原因,他說:
1. 要使自己保持學習新鮮事物的狀態,我很看好資料科學在未來的發展,我不一定自己親自做資料分析、出商業報告,但是對於這個新鮮事物不去瞭解一二,有點說不過去;而且(資料科學)還能幫我從更深的層面去瞭解行業的現在及未來;
2. 公司搭建資料團隊不是招幾個資料科學家就能搞定的。而是要把資料化思維貫穿在產品設計研發運營的各個環節上,從基本的統計、分析入手,逐步形成全公司全員性的資料化思維,第一步就是從我開始,團隊從上而下開始學習資料科學。”
最可怕的人,莫過於那些起點已經很高,可又很努力、很拼命得要跟時代同頻前進的人。
都是哪些人在學資料科學?
我們特意調查了500位正在系統學習資料科學的同學,發現56.8%表示資料科學是很重要的技能,對未來工作的幫助會很大。
這500名同學中只有36%從事技術研發類工作,其他同學都遍佈在各行各業的不同崗位。可見資料科學魅力之大。
總結他們的共有特徵:起點高、在某一行業/學科有扎實的背景,每次變革基本都走在時代前沿,是普通人眼裡的“精英”。
也許你會說:既然學資料科學的都是一些精英人群,是不是代表資料科學只適合這些人學習,我在公司只是一顆極小極小的螺絲釘,沒必要學吧,學了可能也用不上。
當然不是這樣!
資料科學只適合有長遠眼光和強大內驅力的人群學習,而不是適用於按照行業、學科、學歷等標簽劃分出來的某類人群。
如果你職位不高或者學歷不高或者行業背景不牛或者對未來感到迷茫,更需要學習資料科學,要向比你優秀的那批人學習。因為他們學習關註的事物是未來的潮流,當你暫時無法擺脫視野和格侷限制時,只能向比你優秀的人學習。
如今的資料科學尤如同二十年前的網際網路。二十年前,或許你還沒上小學,或許你剛剛步入社會,巧妙錯過了誕生瞭如馬雲、馬化騰、李彥宏、丁磊、雷軍、周鴻禕等網際網路領軍人物的時代。這一次千萬不要錯過資料科學。上一次的錯過可以“怪時代”,這一次錯過了只能怪自己!
為什麼資料科學會吸引這麼多“精英”?
1. 資料科學行業前景廣闊,職業生涯更長
2014年開始,金融、物聯網、智慧汽車、遊戲、醫療、VR等行業產生大量資料,每年產生的資料以40倍的速度增長,資料變得無處不在。對資料進行加工和分析已經成為一項核心的技能。
Hal Varian, Google 的首席經濟學家也曾說過:
如果你想找一個被急需的職業,需要為一些越來越常見的東西,提供稀缺且附帶額外價值的服務。
什麼東西正變得越來越常見?——資料;
什麼可以為資料提供稀缺且有額外價值的服務?——資料分析
如果你喜歡資訊科技,又不想做青春易逝的碼農,那就當一名能夠預測變化、洞察秋毫的資料分析工程師和未來的Chief Data Officer!如果你選擇在其它專業領域發展,資料分析也會成為你事業的助推器和催化劑,至少幫助你更加理性地看待世間萬物。
資料科學是可以嫁接很多行業,而且不像普通的程式員,不用怕被年輕人淘汰。對於做資料分析的人而言,經驗很重要,是典型的越老越值錢的職業。
2. 資料科學行業的薪資誘人
在美國,資料科學家平均年薪為11.9萬美元,而程式員平均年薪為6.5萬美元,其差距可見一斑;縱觀國內的招聘市場,資料科學從業者的收入雖與美國尚有差距,但其月薪普遍高於其他技術類崗位30%-50%。
再分析了全球45個國家的近千份調查報告後,O’Reilly釋出了資料科學從業者薪酬報告,從中可以看出資料科學從業者的薪酬水平:
由上圖可見,60%資料科學從業者年薪都等於或高於8萬美元(中國資料科學家的薪資還是拖了後腿),如此誘人的年薪自然會吸引最優秀的人才。
3. 行業拓展性極強
未來想在一個行業深耕,沒有資料科學的支撐怕是很難。而且有了資料科學的基礎,可以拓寬你的職業發展空間,給你增加很多選擇,例如你可以去金融領域發展,也可以涉足健康、教育等很多行業。
正是因為資料科學“前景好、錢多、不同行業能通吃”的特點,才吸引了這麼多精英紛紛學習。
普通人學習資料科學的門檻高不高?
如果你問:“學資料科學有沒有門檻?”
答案是肯定的:有!
再問:“那資料科學難不難學呢?”
我的回答是:有難度,因為需要投入時間和精力。但是不代表普通人就不能學。
只要構建了系統的知識體系,培養符合資料科學領域需要的能力,普通人還是可以透過學習資料科學,實現升職加薪或者轉行資料領域的。
學習資料科學需要的知識背景是有一定的數學基礎、會一門程式語言。
1. 數學基礎:主要是機率論、統計學、線性代數、微積分部分的內容。
中國學生的數學基礎是全球最好的,任何一個順利完成高中教育的人都能進行數學的自學,更別說正在讀大學或者已經本科畢業的同學。可以說,中國人在資料科學的浪潮中簡直有天然的優勢。找到合適教材,系統性學習數學完全是可以的。
2. 掌握一種程式語言
程式設計的重要性不言而喻,未來可能會進入基礎教育,像語、數、外一樣成為義務教育的基礎學科。
對於技術人員,程式語言就是小 case,不再多言。
沒有程式設計基礎的同學,可以選擇Python或者R作為程式設計的入門語言進行學習,這兩個語言上手極快,選一門免費的Python課程,從頭跟到尾,基本可以入門,一般系統性學習1月左右搞定。
怎樣才能學好資料科學?
資料科學如此火爆,大家學習的熱情又很高漲,那有沒有體系化的資料科學課程,方便更多資料科學愛好者學習呢?
今年6月底清華大學深圳研究生院推出了資料科學認證專案, 給對資料科學感興趣的的學習者帶來了福音。
資料科學認證專案是國內首批線上認證專案兩個中的一個,由國內資料科學領域頂尖的教學團隊設計課程並教學。
作為一個文科專業的學生,有幸成為專案首批體驗者,學完以後有4個感受:
1. 課程設計生動有趣,內容深入淺出,顛覆了我印象中枯燥無味的工科課程學習體驗。
這套課程的主要設計者袁博老師講課幽默風趣,把枯萎的演演算法講得鮮活、有生命力,袁老師以形象生動的方式展示強大的資料分析技術,舉重若輕、收放自如。這是我聽過的生動有趣的資訊科技類課程。
2. 課程適用於不同專業、不同背景的學習者。
在體驗了多家的資料科學的課程,我的一個明顯的感受就是:不是計算機科班出身、高數考不到150就沒資格學習資料科學,對於我這種“雙無“人士(無數學基礎、無程式設計基礎)的簡直是莫大”羞辱“。
對比下來,清華大學的資料科學認證專案的課程明顯“友好”很多,只要具備一定的基礎學習起來基本沒不可逾越的難度。
3. 課程與國際接軌,採用英文講義,中文講解的方式授課。
學技術學演演算法的同時,還能學了英語,最重要的是方便以後深入學習,因為資料學習的很多進階教材與資料都是英文的。
4. 最後,也是最重要的一點,學完可以獲得清華大學深圳研究生院頒發的證書,這大概是我此生離清華最近的一次了
但是我不是沖證書來的是假的,我是來學知識的,學好了資料科學,手持金飯碗走向人生巔峰。
清華大學資料科學認證專案
下麵我們來捋捋清楚清華大學資料科學認證專案。
01 科學的課程體系 培養全能資料科學人才
上圖為資料科學必備的8項技能,進一步概括則是:商業洞見、統計機率知識、電腦科學和軟體程式設計技能、文字和視覺溝通能力等四大方面,一個優秀的資料科學家要在以上4方面均有出色的表現。而清華大學資料科學認證專案的課程設定,與資料科學必備技能基本吻合。
清華大學推出的資料科學認證專案共需學習 6門課程和參加一個實踐課題。
-
《資料科學導論》是資料科學的先導課和認知類課程。用形象生動的教學樣式為學生普及資料挖掘、大資料相關的基礎知識、核心概念和思維樣式,從工程技術、法律規範、應用實踐等不同角度描繪資料科學的美好藍圖。
-
《資料挖掘:理論與演演算法》完整改寫資料挖掘領域的各項核心技術,包括資料預處理、分類、聚類、回歸、關聯、推薦、整合學習、進化計算等。
-
《高階大資料系統》主要講解高階大資料系統的實現、最佳化和應用,包括分散式檔案系統、MapReduce/Spark、Storm/Spark streaming、Mahout等系統的原理、實現、策略最佳化。
-
《大資料機器學習》主要包括統計學習基本理論,機器學習基本方法,深度學習理論和方法。牢固掌握大資料機器學習方法,並能夠解決實際問題等綜合能力。
-
《資料視覺化》主要包括視覺化的基本概念、歷史沿革、視覺認知理論、各類視覺化技術(軟體工具及程式開發)等。
-
《智慧財產權法律及實務》重點講解專利法、商標法,兼顧著作權法,以中國智慧財產權法律實踐為主,兼顧主要國際公約和國外司法實踐。
1個實踐課題是學習者修完上述6門必修課程後,參加由指導教師認可的專業實踐課並完成報告撰寫及透過審核。學習者也可選擇由本證書專案的業界合作方提供的各類實踐課題。
六門課程的建議學習順序
02 授課團隊
本專案中所有課程的授課教師均為清華大學深圳研究生院資料科學領域的資深一線教師,多數具備海外學習背景。同時本專案將為學員配備經驗豐富助教團隊,提供高水平輔導。
1 袁博老師
清華大學深圳研究生院副研究員;澳大利亞昆士蘭大學電腦科學博士;
教授課程:《資料科學導論》、《資料挖掘:理論與演演算法》 《資料視覺化》。
2 何雋老師
清華大學深圳研究生院副教授;北京大學法學博士,芬蘭圖爾庫大學博士後
教授課程:《資料科學導論》、《智慧財產權法律及實務》。
3 袁春老師
清華大學博士生導師,副研究員,清華大學 – 香港中文大學媒體科學、技術與系統聯合研究中心常委副主任,清華大學深圳研究生院計算機應用技術實驗室主任;
教授課程:《大資料機器學習》。
4 王智老師
清華大學深圳研究生院講師;
教授課程:《高階大資料系統》與《資料視覺化》。
為了讓不同專業背景、學科背景、工作背景的同學輕鬆學習認證專案中的各門課程,配備了清華大學資料科學方向博士和碩士研究生組成的優秀助教團隊,為同學們提供全方位的輔導和支援。
03 課程學習方式
資料科學認證證書專案中的課程均以線上錄播課形式進行,輔以討論區答疑+直播課答疑,配合專門的習題及測試內容,有效保證學習效果。
6門課程全部支援PC端(訪問:www.xuetangx.com)和手機端(下載學堂線上APP)學習;其中學堂線上APP支援課程快取,可以離線學習。
04 證書認證方式
第一步: 學生按照課程內容完成每門課程,並透過習題和線上考試完成6門必修課;
第二步:完成6門必須課後,需參加由指導老師認可的專業實踐課並完成報告及透過審核;學生也可以選擇由本證書專案的業界合作方提供的各類實踐課;
第三步:實踐考核透過後,可以申請獲得清華大學深圳研究生院和線上教育辦公室共同頒發的認證證書。
清華大學深研院的資料科學認證證書先睹為快
(證書示例)
(證書封皮示例)
05 認證專案的收穫
1. 在申請清華大學深圳研究生院相關專業研究生招生過程中給予考慮,專案學習情況作為研究生選拔的輔助資訊;
2. 根據深研院的相關要求,獲得資料科學認證證書的學習者,在研究生培養環節中經過一定程式可能獲得減免學時或學分認定等許可;
3. 獲得資料科學認證證書的學習者,在申請商湯科技、美團等合作企業的實習及就業崗位時有優先面試的機會;
4. 對於職場人士來說,參加認證證書專案的學習,幫助不同專業、學科及工作背景的同學快速跨行到資料科學領域。
06 建議具備的學習基礎
1. 本證書專案需要學習者具備基本的程式設計知識(掌握一門常用語言,包含但不限於Python、Java等);
2. 掌握一定的數學基礎,如機率統計、線性代數等。
下麵是清華大學深研院老師給大家書目,結合課程學習,效果更好。
1. 《機器學習》(俗稱西瓜書) 周志華著,清華大學出版社;
2. 《分散式系統:概念與設計(原書第五版)》,機械工業出版社;
3. 《Spark大資料處理:技術、應用》,機械工業出版社。
07 常見問題
1. 如何報名“清華大學資料科學認證專案”?
掃描下方二維碼付費報名即可。
2. 報名後在哪裡聽課?
報名成功後,PC端訪問學堂線上官網 ,手機端下載 “學堂線上APP”,使用報名賬號登入即可聽課;若微信報名課程,登入時直接務必選擇微信登入學堂線上。
3. 課程是直播還是錄播?
資料科學認證專案中的課程均為錄播課,有效期內(報名後一年內有效)可反覆觀看;學堂線上APP支援課程快取。
4. 對於清華大學“資料科學”有疑問,如何諮詢?
微訊號:a-yongqi (學堂線上小阿哥);
郵 箱:zhaoyanpin@xuetangx.com
如有疑問,請透過以上方式聯絡學堂線上工作人員。
☟ 掃描下方二維碼,馬上報名資料科學證書專案
報名清華大學的資料科學認證專案,戳閱讀原文