或許每個經歷過大學生涯的人都會有這樣的感受:曾經努力收集各種課程資料,但在修完一門課程之後卻會發現遺漏了很多重點內容。每一代前輩總結出的經驗也常常因為無處傳承而逐漸遺漏消失。
為了減少重覆勞動,讓我們不再孤軍奮戰,來自浙江大學、北京大學等國內高校的貢獻者們發起了課程資料民間整理專案。目前各家大學的課程資料整理已搭建了自己的網站,在 GitHub 上積累了大量 Star。
這些內容不僅是教材的電子版,也有歷年試卷、複習資料、習題答案甚至選課攻略。作者表示,希望能夠將這些隱晦的、不確定的、口口相傳的資料和經驗,變為公開的、易於獲取的和大家能夠共同完善、積累的共享資料。
目前這些專案已經包含了大多數電腦科學方面的課程。
其實說到課程攻略共享計劃,大家可能都會想到浙大開源的專案,它從數學、物理、計算機、化學和其他通識課出發介紹大量課程攻略與資料。浙大的共享專案目前包括 50+的主題,如下展示了其中一些:
浙大共享專案地址:https://github.com/QSCTech/zju-icicles
機器學習資料哪家強
作為最早搭建起來的課程攻略共享計劃之一,浙大的開源專案主要是「全」。但是對於機器學習學習者而言,這些資料很少深入到 ML 核心課程,它們還是比較廣泛的計算機學科資料。因此,我們這裡主要介紹上海交通大學的課程攻略,它包含 ML 領域的大量主題。
上海交大的資源非常適合瞭解機器學習相關的學習內容與主題,每一個課程檔案下都有 PPT、參考課本、作業和筆記等。
專案地址:https://github.com/CoolPhilChen/SJTU-Courses
-
計算機
-
CS125 程式設計
-
CS221 資料結構
-
CS222 演演算法分析與設計
-
CS258 資訊理論
-
CS385 機器學習
-
EI331 訊號與系統
-
EI332 計算機組成
-
EI338 計算機系統工程
-
EI339 人工智慧
-
SE305 資料庫技術
-
高階演演算法
-
數學
-
MA357 數理統計
-
X071571 最最佳化方法
-
MA26035 測度與機率論
如上很多主題都是學機器學習該瞭解的,不論是程式設計打造程式設計功底、最最佳化方法打造機器「學習過程」,還是人工智慧或機器學習等直接相關的主題,我們都應該有所瞭解。
例如在 CS385 機器學習中,作者介紹了講師和課程主頁等標配內容,同時也提供了課本、PPT 和作業下載。課本也就是大名鼎鼎的《樣式識別與機器學習》(Bishop, PRML)和《機器學習》(周志華),課程 PPT 則從最簡單的線性模型到 EM 演演算法涉及主要的 9 個主題。
CS385 還提供了 5 次家庭作業,每一次家庭作業都包含多個問題,不過我們暫時沒發現有解題方案。上海交大家庭作業的風格如下:
對了,機器學習這門課是大三下學習期開的,感興趣的讀者可詳細看看這些資料。
當然,這個專案其它主題也非常詳細,例如最最佳化方法,除了前面提到的幾種資源,它還額外提供了課堂手寫筆記。如下展示了最最佳化方法中的手寫「課堂筆記」,梯度下降的收斂性分析。
此外,整個專案對在校生有更大的幫助,透過前面那些資源可以瞭解課程大致內容與方向,複習的時候也有更多的資料。例如在資訊理論這個主題中,該專案還提供了期中考試的複習材料,這些材料總結了資訊理論的核心概念。如下是一些資訊熵的概念,機器學習中也經常用得上:
其他國內課程
除了前面介紹的課程資源,小編還發現了其他幾所高校的課程資源,如北大、中科大和清華。
北大課程資源收錄了專業課、公選課、英語課等多類不同課程。以專業課為例,作者進行了詳細的分類,如人工智慧、人工智慧概論、抽象代數和機率論等。部分內容最近一次更新是兩天前。
北大課程資源部分截圖
北大課程資源專案地址:https://github.com/lib-pku/libpku
目前,該 Github 專案已經有 1.2 萬左右的星標,3800 左右的 Fork。
該資源中收錄了很多北京大學的期中、期末考卷。這張 17-18 年資訊科學技術學院的高數 b 期末考題你可以做出幾道?
中科大的這一課程資源專案收錄了中國科學技術大學眾多課程資源的筆記,總結,經驗等學生自己原創的內容。
中科大專案地址:https://github.com/USTC-Resource/USTC-Course
此外,從大一上到大四上,清華大學計算機系課程攻略專案按照學期整理了該校計算機系的課程資源。中山大學同樣整理了期末考試的往年試卷、複習資料等輔助內容。課程資源再多,學到才是自己的,建議讀者們根據自己的需求有針對的進行學習。
最後,知識的傳承是一個長期任務,歡迎大家繼續作出貢獻!
轉自:機器之心 公眾號,本文由機器之心 編輯整理
朋友會在“發現-看一看”看到你“在看”的內容