歡迎光臨
每天分享高質量文章

大資料

站在風口上的大資料,究竟被什麼拖了後腿?-知識星球

站在風口上的大資料,究竟被什麼拖了後腿?

cycadmin閱讀(593)贊(0)

導讀:當大資料帶給世界更多位元,這些實時產生的海量資料成為了一座開採難度巨大的礦山。大家都知道透過這些碎片化的資料能夠挖掘出更多價值,但是就目前的整體發展來看,大資料的應用遠沒有達到預期的效果,其原因有如下幾個。    ...

什麼是正態分佈?為何如此重要?終於有人講明白了-知識星球

什麼是正態分佈?為何如此重要?終於有人講明白了

cycadmin閱讀(804)贊(0)

導讀:為什麼正態分佈如此特殊?為什麼大量資料科學和機器學習的文章都圍繞正態分佈進行討論?我決定寫一篇文章,用一種簡單易懂的方式來介紹正態分佈。 在機器學習的世界中,以機率分佈為核心的研究大都聚焦於正態分佈。本文將闡述正態分佈的機率,並解釋它...

​一文看懂資料清洗:缺失值、異常值和重覆值的處理-知識星球

​一文看懂資料清洗:缺失值、異常值和重覆值的處理

cycadmin閱讀(4935)贊(0)

  導讀:在資料清洗過程中,主要處理的是缺失值、異常值和重覆值。所謂清洗,是對資料集透過丟棄、填充、替換、去重等操作,達到去除異常、糾正錯誤、補足缺失的目的。     作者:宋天龍 如需轉載請聯絡大資料(ID:...

推薦 :菜鳥級機器學習入門(附程式碼實體)-知識星球

推薦 :菜鳥級機器學習入門(附程式碼實體)

cycadmin閱讀(568)贊(0)

作者:Ben Sanders;翻譯:吳慧聰;校對:鄭滋 本文約2400字,建議閱讀10分鐘。 本文將簡要介紹什麼是機器學習,其運作原理,以及兩個主要的機器學習的演演算法。 簡介 本文中,資料科學創業公司Yhat的前聯合創始人,現任Waldo的...

推薦 :如何改善你的訓練資料集?(附案例)-知識星球

推薦 :如何改善你的訓練資料集?(附案例)

cycadmin閱讀(1298)贊(0)

作者:Pete Warden;翻譯:申利彬; 本文約6800字,建議閱讀10分鐘。 本文作者基於自身專案經驗闡述訓練資料的重要性並分享了一些改進的實用技巧。 Lisha Li 攝   這張幻燈片是Andrej Karpathy 在Train...

手把手教你學Python:一文看懂字串基本操作-知識星球

手把手教你學Python:一文看懂字串基本操作

cycadmin閱讀(658)贊(0)

導讀:很多程式員處理文字而不是數字。文字包含字元:字母、數字、標點符號、空格等。字串是一系列字元。例如,字串”Hello”是一個包含5個字元的序列。     作者:凱·霍斯特曼(Cay Horst...

谷歌釋出NLP最先進預訓練模型:開源BERT-知識星球

谷歌釋出NLP最先進預訓練模型:開源BERT

cycadmin閱讀(629)贊(0)

作者:Jacob Devlin and Ming-Wei Chang, Research Scientists, Google AI Language;翻譯:佟海寧;校對:吳金笛 本文約2000字,建議閱讀9分鐘。 本文為你介紹谷歌最新釋出...

分享創造快樂