Spark入門必讀:核心概念介紹及常用RDD操作
導讀:Spark是由加州大學伯克利分校AMP實驗室開源的分散式大規模資料處理通用引擎,具有高吞吐、低延時、通用易擴充套件、高容錯等特點。Spark內部提供了豐富的開發庫,集成了資料分析引擎Spark SQL、圖計算框架GraphX、機器學習庫M...
導讀:Spark是由加州大學伯克利分校AMP實驗室開源的分散式大規模資料處理通用引擎,具有高吞吐、低延時、通用易擴充套件、高容錯等特點。Spark內部提供了豐富的開發庫,集成了資料分析引擎Spark SQL、圖計算框架GraphX、機器學習庫M...
邊緣計算環境帶來的安全風險迫使公司必須特別關註它的安全措施。 — Anne Taylor 說資料安全是高管們和董事會最關註的問題已經是陳詞濫調了。但問題是:資料安全問題不會自己消失。 駭客和攻擊者一直在尋找利用缺陷...
你可能從小就會背誦“一寸光陰一寸金,寸金難買寸光陰”,但仔細想想,你真的明白時間的重要性麼?你真的有好好珍惜每一秒,用好每一分麼? 今天跟大家分享Youtube上知名勵志演說家Jay Shetty一段關於時間的演...
導讀:中國在人工智慧各個領域都有了一批代表性的企業。近日,《網際網路週刊》釋出“2019中國人工智慧分類榜”,榜單中包括各領域企業的排名情況,也包括各高校人工智慧學院、研究院、實驗室的排名情況。 作者:軒中 來源:網際網路週刊(I...
隨著資料的爆炸式增長,各個領域對計算機硬體的處理能力有了更高的要求。相比於CPU和GPU等計算裝置的快速發展,傳統的乙太網領域發展明顯滯後並逐漸成為效能瓶頸。大量產品線都希望改善網路效能,透過使用更高頻寬,更低延遲的網路來提升業務能力。...
作者:Pulkit Sharma 翻譯:陳之炎 校對:丁楠雅 本文約3900字,建議閱讀10+分鐘。 本文為大家分析並比較五種非常有用的深度學習框架的優點及應用。 概述 從出道起,我就一直是一名程式員。我喜歡從頭開始編寫程式碼,這有助於我清楚...
導讀:最近看了新週刊的一篇推送《我們分析了3447個地鐵站,發現了中國城市地名的秘密》,有關地鐵名字的分析。 於是乎也想著自己去獲取資料,然後進行分析一番。 分析水平或許不能和他們的相比,但能提高資料的準確性。那篇文章中所用到的地鐵站資料並...
導讀:本文盤點了資料科學和機器學習面試中的常見問題的答案。 作者:Kartik Singh 翻譯:王雨桐 來源:資料派THU(ID:DatapiTHU) 技術的不斷進步使得資料和資訊的產生速度今非昔比,並且呈現出...
雲端計算從 AWS 初創時的牛刀小試到如今巨大的行業和生態,從新鮮詞彙變為流行語,它的十年發展經歷了哪些階段?每個階段分別創造和發展了什麼?未來雲端計算又將朝著哪些方向繼續前行?此文系 QCon 十週年特別策劃《技術十年》系列文章,旨在透過回顧...
導讀:本文主要分為兩個部分:一部分是網路爬蟲的概述,幫助大家詳細瞭解網路爬蟲;另一部分是HTTP請求的Python實現,幫助大家瞭解Python中實現HTTP請求的各種方式,以便具備編寫HTTP網路程式的能力。 ...