歡迎光臨
每天分享高質量文章

從0開始學大資料

自2013年起,無論是 BAT 還是傳統的商業公司,都陸續在自己的軟體系統中大規模使用大資料技術。不僅如此,越來越多的軟體工程師開始轉型成為大資料工程師,從事大資料開發與應用的工作。市場對於大資料的人才需求與日俱增,大資料方向儼然成為了業內炙手可熱的職位。

但是,不論是大資料的技術還是應用,都始終處於動態變化的過程中。這對很多剛開始接觸大資料、考慮使用大資料的人來說,無疑帶來了很多困惑。

  • 天天聽別人講大資料,自己也看了不少資料,卻不得要領,看不到完整的知識輪廓。

  • 即使工作和大資料相關,但仍不清楚大資料平臺究竟是如何運作的,該怎麼突破。

  • 從事大資料工作但不懂其原理,給大資料部門提個需求,一句“不好做”就被擋回來,發展有瓶頸。

如果你也有這樣的困惑,不要著急。由於大資料的知識體系過於繁雜,沒有專家的明晰指導,很多人都難以真正入門,更不用說透過構建知識體系達到融會貫通了。

下麵推薦一個李智慧在極客時間的技術專欄,或許對你有用

作者李智慧,同程藝龍交通首席架構師、Apache Spark原始碼貢獻者,長期從事大資料、大型網站架構的研發工作,曾擔任阿裡巴巴技術專家、Intel亞太研發中心架構師、宅米和WiFi萬能鑰匙CTO,有超過6年的線下諮詢、培訓經驗,著有暢銷書《大型網站技術架構:核心原理與案例分析》。

《大型網站技術架構:核心原理與案例分析》這本書也是我比較喜歡的一本書,用通俗易懂的語言介紹了大型網站技術的發展歷程,並透過典型案例解剖了大型網站技術架構樣式。

在這個專欄裡,李智慧將結合自己多年大資料開發、應用的經驗,幫助你構建一套立體化的知識體系,並從不同視角、不同領域帶你找到你在大資料領域的突破口,真正從普通開發者晉升為擁有大資料思維並能解決複雜問題的技術專家。

這個專欄共包含6個模組,將介紹一套完整的大資料知識體系。


模組1:Hadoop大資料原理與架構

為什麼講大資料都要從Hadoop開始?大資料的問題和挑戰不同以往,它的處理方法與技巧也頗有不同。理解大資料面對的問題以及處理技巧,是構建大資料知識體系的源頭。理解大資料,從理解Hadoop開始。

模組2:大資料生態體系主要產品原理與架構

大資料領域不只有Hadoop,還有資料倉庫Hive、NoSQL系統HBase、計算引擎Spark、流計算引擎Storm、Flink,以及分散式一致性解決方案ZooKeeper等,它們構成了一個完整的大資料生態體系,解決各種場景下的不同問題。

模組3:大資料開發實踐

本模組以大資料開發者的視角重新審視大資料的各個方面,結合作者在阿裡巴巴、Intel從事大資料開發的實踐經歷,從“局內人”的視角為你揭秘大資料開發的內裡乾坤。

模組4:大資料平臺與系統整合

大資料從哪裡來?算出來的結果又到哪裡去?如何將大資料技術整合到當前系統中去?需不需要自己開發?有沒有商業的解決方案?這可能是使用大資料時最迫切需要解決的問題。

模組5:大資料分析與運營

資料分析是大資料應用的一個重要場景,網際網路企業運營常用的資料分析指標有哪些?如何呈現?資料分析結果異常了,企業關鍵績效指標下滑了,該如何去追蹤定位其原因?這些應用場景和問題答案都可以在本模組中找到。

模組6:大資料演演算法

大資料最激動人心的應用還是大資料機器學習,但大資料機器學習演演算法是不是真的有那麼難?數學不好還能不能學好、用好大資料演演算法呢?這個模組告訴你,其實大資料演演算法並不難,原理一樣很簡單。


>>>如何購買

掃描下圖的二維碼,即可購買

贊(0)

分享創造快樂