資料類演演算法競賽作為資料科學和機器學習社群中的重要一環,在學術界/工業界都扮演著重要的角色。資料競賽一方面是學術界演演算法的練兵場,一方面也是企業出題尋求解答的開放式考場,不少論文的 idea、演演算法的 trick 都是在資料競賽中提出的。頂尖賽事如 KDD Cup 等,其冠亞季軍的含金量也被廣泛認可。
國內各個競賽平臺也在逐步發展,很多國內競賽的獲獎團隊會熱心地公開自己的演演算法甚至是原始碼。Github 上有一個 repo 專註於蒐集整理國內演演算法競賽的各個優勝解決方案,目前為止已經收集了國內幾家較大的資料競賽平臺的 42 場比賽的 104 個解決方案,其中 72 個方案附有開原始碼。
當面臨一個新的演演算法問題,不妨光顧一下這個 repo,也許這些已有的解決方案能夠提供許多參考和啟發。
專案簡介
CDCS 中國資料競賽優勝解集錦
做這個蒐集主要只因為自己之前在做比賽時受到 Kaggle Past Solution 的很多幫助,同時發現雖然很多國內競賽的獲獎團隊會熱心地公開自己的演演算法甚至是原始碼,但是往往較為分散,因此萌生了蒐集國內資料競賽優勝團隊解法的念頭。 希望能對需要的同學有所幫助,同時,如果有發現沒有被收錄進去的解決方案,歡迎發起 pull request。