歡迎光臨
每天分享高質量文章

500多頁的機器學習入門筆記,下載超5萬次,都講了些什麼?

導讀:今年 4 月,梁勁在百度雲盤上傳了一份自己整理的學習筆記——《機器學習——從入門到放棄》。這份學習筆記 540 多頁,圖文並茂,而且全部用英文撰寫,如今這份檔案的下載量已超過 50000 次。由於在海外的 AI 社群反響強烈,梁勁隨後又將這份檔案上傳到了 DropBox。

關於梁勁,關於《機器學習——從入門到放棄》的誕生始末,希望下麵的對話能給你一點啟示。


在大資料(ID:hzdashuju)公眾號後臺回覆入門筆記,獲取下載連結。


作者:阿司匹林

來源:AI科技大本營(ID:rgznai100)


Youth is not a time of life, it is a state of mind. —— 塞繆爾·厄爾曼

雖然年紀大了,體力精力都下降了,但我不覺得自己很老,尚有一顆拼搏的心。——梁勁

1991 年,剛剛走出大學校門的梁勁被分配到政府部門當公務員。工作包分配,而且還是公務員,在很多人看來,這應該是一份非常令人艷羨的工作。但是對梁勁而言,這卻是他人生中最黑暗的時期。

那段時間每天上班就是喝茶、看報、聊天,下班後就是玩遊戲,但這不是我想要的生活,人生毫無希望的感覺,我想擺脫這種生活樣式,但又覺得無能為力,我不知道如果不做公務員,我還能做什麼,我什麼也不會啊,我這 10 年最寶貴的青春就這麼稀里糊塗荒廢了。

三十而立,但是不破不立。

2001 年,梁勁在親朋好友的反對聲中毅然選擇離開體制,併在因緣巧合之下,加入了一家 IT 創業公司,擔任產品設計經理,負責產品的構思,以及具體的使用者介面設計。從政府公務員到創業公司,一切都得從頭學起。

2005 年,梁勁離開待了 4 年的創業公司,進入 SAP 做設計師, 從事使用者體驗方面的工作,直到如今。

時間來到 2018 年,身為設計師的梁勁卻在 AI 社群一夜之間小有名氣。

今年 4 月,梁勁在百度雲盤上傳了一份自己整理的學習筆記——《機器學習——從入門到放棄》。這份學習筆記 540 多頁,圖文並茂,而且全部用英文撰寫,如今這份檔案的下載量已超過 50000 次。由於在海外的 AI 社群反響強烈,梁勁隨後又將這份檔案上傳到了 DropBox。



從動筆到完成,梁勁差不多花了一年左右的時間,作為人工智慧的門外漢,其中艱辛,可想而知。

關於梁勁,關於《機器學習——從入門到放棄》的誕生始末,希望下麵的對話能給你一點啟示。

Q(AI科技大本營,下同):能簡單自我介紹下嗎?

梁勁:我是一名設計師,目前在 SAP 從事使用者體驗方面的工作,自 10 多年前加入這家公司以來,一直在做 business applications。

SAP 作為全球最大的企業級軟體系統供應商,在全球範圍內很多超大公司都在用 SAP 的軟體解決方案,包括微軟、蘋果、Intel、波音、3M 等 ,SAP 在企業管理系統方面積澱深厚,在這 10 年裡,我參與多款產品的研發工作,其中包括和數千名同事一起研發一款耗資數十億美金的大型產品,獲得了很多經驗、知識、教訓。

目前我參與的產品,是一款讓普通使用者自助式分析和展現資料的 Cloud Analytics 產品。

在加入 SAP 之前,我在一家初創公司擔任產品設計經理。這家 startup 是由 Intel 亞太區一個 VP 創立的,創立之時,正值網際網路泡沫破滅的時候,我們一群年輕人滿腔熱情地加入了這家公司。在奮鬥了 4 年之後,我選擇了離開,很不幸的是這家公司後來很快倒閉了。

作為早期員工,我經歷了產品從誕生到死亡的全過程,很多感慨,即便離開這家公司很多年了,回想起來也依然有點感傷,就像是看著一個小寶貝誕生後不幸夭折的感覺。雖然公司的產品失敗了,但這段經歷是我職業生涯成長最快,收穫也最大的一段時間。

Q:您大學畢業之後都從事了哪些工作?

梁勁:我的專業是化學相關,大學畢業後,被分配到政府部門做公務員。這是我人生當中最黑暗的 10 年,那段時間每天上班就是喝茶、看報、聊天,下班後就是玩遊戲,但這不是我想要的生活,人生毫無希望的感覺,我想擺脫這種生活樣式,但又覺得無能為力,我不知道如果不做公務員,我還能做什麼,我什麼也不會啊,我這 10 年最寶貴的青春就這麼稀里糊塗荒廢了。掙紮了很久,我最後決定破釜沉舟,下定決心把自己的飯碗砸掉了。

這些年很多人為了考公務員,擠破了頭,是不少人熱衷的工作,即便在當時,公務員也是熱門工作。當時我辭職的時候,周圍的朋友一片反對之聲,有一個認識的領導,對我說:“你是不是腦子出問題了?多少人鑽頭覓縫想當公務,你卻要自己砸掉鐵飯碗!”回想起來,這一生做出了很多愚蠢的決定,但離開政府部門是我這一生最正確的抉擇。

離開政府後,因為機緣巧合,我加入了剛才提到的那家創業公司。其實一開始是非常艱難的,從政府部門跳到渾身不搭界的 IT 創業公司,技能上是有所欠缺的,我所有的相關技能都是基於興趣愛好自學的,從專業程度上來說,我完全就是新人。

我在那家公司,負責產品的構思,以及具體的使用者介面設計。因為是初創小公司,所以職責比較綜合,我在這家公司邊做邊學,逐漸在綜合能力上得到了很大的提高。

現在遍地都是 startup,其實當年國內的創業公司非常非常少,我們做的產品,最早是對標 Groove(後被微軟收購),後來產品方向變了,嘗試過不同的方向,但最終還是失敗了。

在初創公司工作,有朝不保夕的感覺,但做事也有它的好處,與 9 萬人的大公司相比,在小公司個人其實有更強的 ownership,對產品有更大的影響力,可以及時驗證 idea 最後的成效,雖然公司產品最終失敗了,但這個過程個人收穫不少。

在創業公司打拼了幾年之後,迫於生計,我最後選擇了進入外企,開啟了另外一段職業生涯。

Q:從什麼時候開始關註人工智慧?因為什麼原因而關註?

梁勁:最早關註人工智慧,大概是在 2016 年,也就是在 AlphaGo 一鳴驚人之後,當時感覺很震撼。然後開始斷斷續續看關於人工智慧相關的文章和影片,但是還是停留在最基本的概念階段。後來在網易公開課上,試圖看吳恩達在斯坦福的機器學習教程(不是 Cousera 的那個版本),看了一陣就放棄了,因為看不懂 。

其實我不是程式員,本身沒有很強的動機去深入學習 AI,我當時做的產品本身也不涉及 AI。只是我做資料視覺化產品,已經好些年了。看到人工智慧的火爆,我在思考是否有機會用 AI 重塑傳統的Business Intelligence/Analytics(商業智慧/商業分析)?

長期以來,傳統的 Business Intelligence/Analytics 都是基於歷史資料,關註的是 “what happed? why did it happen?” ,它關註的是過去,但高階或者新一代的BI/Analytics 是predictive solution,更關註的是未來。“What will happen?” 甚至是“What is the best that could happen ?” 

傳統的BI (business intelligence)雖然號稱商業智慧,但其實沒有真正的智慧。用 AI 去革新 BI/Analytics,才有機會提供真正的“智慧”,然而這不可避免會涉及到 AI/Machine Learning,如果我自己完全不懂,我又如何能去設計突破性的 Analytics 產品呢?

所以,我就有了學習“機器學習”的動機,我並非想成為這方面的專家,而是希望透過學習“機器學習”,瞭解它的原理,想把它和傳統的 Analytics 結合,看看有沒有機會做出有突破性的創新產品。

Q:什麼時候產生自己動手寫一本機器學習教程的想法的?為什麼?

梁勁:學習“機器學習”完全是自我驅動的,並非是工作上的硬性要求,而且我這是跨界學習,作為非程式員,要去學“機器學習”,本身挑戰不小。但凡自學新的 topic,特別是對上有老、下有小的職場人士,要長期堅持下去其實是不容易的事情。

如果這個 topic 還很難,如果沒有強烈的動機,不少人學著學著就很容易放棄了,這是人性使然。

我在學習初期,也遇到巨大的困難,根本學不下去。後來自己想方設法在網上找各種英文教程硬著頭皮看,勉強看懂一些,到後面才越來越順了。在看的過程中也做了一些筆記,到後來內容也積累得越來越多。

Learning by doing 和 Learning by teaching 都是高效的學習方法,所以,我就想透過 Learning by teaching 的方式去學習,於是產生了把筆記整理成教程的想法。透過整理筆記,重新組織,也是一個整理思路,加深理解的過程。

在接觸機器學習時,有兩篇文章讓我印象深刻。一篇是 Machine Learning is Fun!(https://medium.com/@ageitgey/machine-learning-is-fun-80ea3ec3c471),還有一篇是 ”圖解機器學習(http://www.r2d3.us/visual-intro-to-machine-learning-part-1 )”。

我意識到很難的 topic 其實可以用直觀、有趣的方式去呈現。市面上機器學習的教程可謂多不勝數,但寫的直白簡單的卻鳳毛麟角。人都喜歡看圖的,討厭看大段大段枯燥乏味的文字,因此,我萌發了用圖形化的方式去寫一份教程的想法。

Q:在開始動筆之前做了哪些準備?

梁勁:寫這個教程,其實是邊學邊寫。針對每個演演算法,查書籍,在 YouTube上看影片、在 Google 上搜索介紹演演算法的文章,特別是斯坦福、卡內基梅隆大學的課件,如果只是簡單的黏貼和複製,那是網路搬運工,沒有太大價值。我在一開始就定位於做一份高質量的精品筆記,所以在消化它們的基礎上,吸取精華,並重新組合,儘量以圖形化的方式來展現。

雖然這份筆記的內容大部分都來自別人,但解構並重組,也算是一個再創造的過程,這個過程特別耗時。打個比方,搞懂一個演演算法,花了一個星期,再把它用新的方式表述,花了 2-3 個星期。我不是 AI 專家,這份筆記跟市面上的教程,從深度或廣度都沒法比,但我自信它對於初學者的友好性,可能不亞於絕大部分教程。

Q:您是怎樣學習機器學習的數學知識的?

梁勁:吳恩達有幾個影片,介紹機器學習裡用到的常用數學知識,可能只需要 2-3 個小時學習就能瞭解了。

Q:您是如何安排寫作時間的?

梁勁:為了寫這個教程,佔用了大量私人時間,經常做到深夜,週末泡在星巴克寫,過年的時候都每天寫,這是一個艱難的過程。

Q:在寫這本教程的過程中都碰到了哪些困難?

梁勁:遇到最大的困難,還是數學,這恐怕也是多數人學機器學習遇到的最大障礙。我大學畢業多年了,對於數學早已忘得一干二凈,每次看到演演算法部分,看到數學就崩潰,看不懂啊,那些符號是啥意思都不知道,彷彿天書一般。

後來看了 Andrew Ng(吳恩達)的 Coursera 上的教程,然後逐漸就能看懂那些公式了,看懂那些數學符號了。要精通 Machine Learning 肯定需要很懂數學,但如果只是入門和應用,需要懂的數學並非想象的那麼難。我在做這份筆記時,考慮到了初學者忘記了數學這種情況,儘量圖解註釋了相關公式。

Q:從動筆到完成大概花了多長時間?是什麼讓您支撐下去的?

梁勁:前前後後,大概花了一年左右時間。回頭一看,我都不知道自己是怎麼堅持下來的。整個過程挺艱難的,有時看不懂演演算法的時候,心裡那個著急啊,數學忘光了,學起來非常吃力,有時也難免有想放棄的想法。只是又覺得筆記做得這麼多了,貌似做的還不錯,放棄也有點可惜,於是又硬著頭皮做下去,那些困難後來基本也剋服了。

Q:在這個過程中您最大的收穫是什麼?

梁勁:整個過程,我特別想驗證的一點,就是是否可能把特別複雜的東西,用淺顯易懂的方式把它講述清楚?目前來看這個標的初步達到,從讀者的反饋來說,他們對筆記的評價非常 positive。如果有資源和團隊,我很自信還能以更好的方式去呈現概念,做出一份非常好的優質教程。只是限於成本和時間,我一個人目前沒有不太可能做到這點。

太多的技術書籍和檔案都寫得晦澀難懂,為什麼不能寫得淺顯易懂呢?可是要把複雜的東西講得深入淺出,讓別人讀起來順暢,讀起來舒服,這本身就是一個巨大的挑戰。

我們的教育體系,沒有怎麼教過學生如何去以友好的方式、以結構化的方式去陳述和表達概念,甚至非常多的老師也不知道怎麼很好地教授複雜的概念,照本宣科。無數學生深受其害,不是學生笨,而是老師不會教。很多一流的專家,長於技術,長於研究,但不善於清晰易懂地表達,他們更不知道以何種方式向初學者去表達。

曾經看過網上有人說,“不要使用同濟版《高等數學》教材…美國的教材寫的真不錯,通俗易懂;麻省理工的老師教的真是好,深入淺出。國內的教材怎麼就這麼難懂!但是同樣是高數,為什麼學起來感受會差別這麼大呢?”

我沒有學過同濟版的高數,但我有類似的感覺,國內的教材,各種技術書籍,普遍寫的很爛。不是 topic 太難,而是它沒有被以合適的方式去表述!

我在想一個問題,國內的中學、大學教材,是否有必要來一次改寫大翻新?大學裡是否有必要把“視覺傳達設計/communication design”作為一門必修基礎課?

這是一個終生學習的時代,如何讓學習變得更輕鬆,更高效,更有趣,這裡面有很多方法和技巧,值得有志人士去研究,我也倡議一下,希望設計師、Technical Writer、產品專家、技術專家、心理學家、教育學家,共同努力研究這方面的實踐方法,總結提煉Best Practice。

比如吳恩達的《機器學習影片教程》,算是機器學習領域屈指可數的優秀教程了,裡面有很多值得學習的教學技巧,以後有時間,可以寫篇文章分析總結好的展現技巧。

Q:筆記傳到網上之後,有人給您提意見嗎?

梁勁:有的,不斷有讀者發郵件或微信後臺留言點贊,表示感謝。普遍的評價是教程做的精美,覺得教程寫的很清晰、淺顯易懂。當然也有讀者幫助指出了教程中的差錯,提出建議,並期望提供更多演演算法的介紹。

Q:未來會關註哪些 AI 領域?打算寫另外一本教程嗎?

梁勁:未來可能會關註一下強化學習。暫時沒有寫另外一本教程的打算。我這個英文版筆記是無償分享,不斷有讀者問是否有中文版,很抱歉暫時沒有這個計劃,做這個太耗費精力,以後看情況再說吧。

Q:對想轉型 AI 的職場人士有什麼建議?

梁勁:我也不是 AI 專家,提建議不敢當。我只是想說,無論公司,還是個人,需要不斷進化,以適應環境和趨勢的變化。長期侷限在某個領域和環境裡,即便成為專家。

如果不積極擁抱新事物、新知識,有 overfitting (過擬合)的巨大風險,一旦局勢發生巨大變化,原先的知識、技能、優勢都會化為大幅貶值,甚至化為烏有,被時代所拋棄。保持積極的學習心態,是避免自己走向保守封閉,跟上歷史行程的有效手段之一。

在大資料(ID:hzdashuju)公眾號後臺回覆入門筆記,獲取下載連結。

更多精彩


在公眾號後臺對話方塊輸入以下關鍵詞

檢視更多優質內容!


PPT | 報告 | 讀書 | 書單 | 乾貨

Python | 機器學習 | 深度學習 | 神經網路

區塊鏈 | 揭秘 | 高考 | 福利

推薦閱讀

Q: 你入門了嗎?放棄了嗎

歡迎留言與大家分享

覺得不錯,請把這篇文章分享給你的朋友

轉載 / 投稿請聯絡:baiyu@hzbook.com

更多精彩,請在後臺點選“歷史文章”檢視

贊(0)

分享創造快樂