閱讀文字大概需要 2.3 分鐘。
最近有讀者問我這麼一個問題:
張哥,老是聽說大資料,到底什麼才是大資料?大資料能用來做什麼?我是非 IT 行業人士,但是看你的文章比較接地氣,並且通俗易懂,所以這次想請您幫忙普及下。
這位讀者雖然沒說,但是我猜測也是想轉行 IT 行業,然後看中了大資料方向,估計這樣的人不少,那麼今天姑且幫大家普及下大資料方面的知識。
所謂大資料,其實主要包括資料分析、資料挖掘、資料開發。
資料分析與挖掘有點類似,簡單來說,就是從大量資料中提取、分析或挖掘有價值的資訊或知識。
解釋有點抽象,舉個例子,你們大概就明白了。
就拿公眾號舉例吧,公眾號後臺自帶各種完備的資料,包括閱讀量、轉發量、新關註使用者人數、取關人數以及各種使用者屬性資料,包括性別、省份、城市、終端機型等等資料。運營公眾號,其實內容是最基本的,但是要想做的好,內容背後你要做各種資料分析工作,比如你公眾號幾點釋出效果最好?你要早中晚都實驗下,然後對比閱讀量。你的讀者主要人群是什麼?他們分佈在什麼地方?他們更關註什麼樣的內容?你的內容好不好?等等等,這些透過對後臺資料做分析都會給你很大的參考,幫助你更好的運營與決策。而這些我在我運營公眾號的時候背後都做了大量的資料分析工作。
當然,這些都是最基礎的資料分析工作,資料分析與挖掘其實最重要的就是要具備「資料思維」,一切基於資料做判斷,用資料去幫助你做決策。我以前說過,做產品,其實最難的不是創意,而是決策,但是如果你具備資料思維,可以幫你做很多省事的決策。
舉個例子,做產品的經常要開發功能,而且迭代週期很快,基本兩三週就釋出一個版本,但是版本釋出之後,功能到底好不好是需要跟蹤的,而不是做完就不管了,而跟蹤就是要觀察資料,新版本釋出之後,你的產品的留存、日活、日均使用時長、銷售等等這些資料有沒有改善,如果說再深入點,做功能之前,其實產品經理要對一個功能做提前的假設,比如我改進了一個引導機制,減少了新使用者的使用門檻,你判斷這個功能上線之後會對新使用者的次日留存有很大改善,那麼上線之後就要時刻關註這個資料的變化,看下有沒有跟預期表現一致,這是做產品的一個常用思維,產品人也一定要具備資料思維。
當然,以上還是比較簡單的資料應用,再舉一個更深入的例子。
我們知道,做資料分析之前,一定要先有資料,也就是首先要做資料收集的工作,假設我們要瞭解我們的使用者詳細的情況,你需要得到一些有效的資料,進而做使用者建模,給你的使用者做畫像,你怎麼做呢?
這裡給大家透漏一個業內人士才知道的一個亂象,在 Android 系統有個 api 可以獲取使用者手機安裝的 App 串列,有不少公司就未經使用者同意,直接獲取使用者手機內安裝的所有應用串列,有人問了,要這個 App 串列有什麼用呢?
這個用處可就大了,比如你手機裡如果安裝了類似「平安好車主」這類 App,那麼代表你是有車一族,起碼經濟能力還可以。
如果安裝了「房貸計算器」或者類似的應用,那麼判斷,這個使用者有買房需求的,經濟能力更是不錯。
如果你安裝了母嬰類 App,那麼認為你是有小孩的。
如果你安裝了很多類似淘寶的電商 App,那麼認為你是一個喜歡購物的女性。
……
等等等,我可以得到各種使用者更詳細的資訊,如果獲取了你的地理位置,透過觀察你每天的兩點一線位置,甚至可以知道你工作的地方以及所在的小區。
當然要這麼詳細的訊息,是為了精準的定位你這個使用者,給你做畫像,比如你居住的小區是高檔還是低檔,你工作的地方是陸家嘴金融狗還是張江程式猿,也基本對你的職業有個大概的瞭解。這裡需要說明的是,使用者畫像跟你實際也許不符,比如,你手機安裝了一大堆電商 App,也許是個男的,你只是喜歡給你的女朋友買東西而已,但是沒關係,從資料分析和使用者建模上,也認為你是一個愛購物的女性。
有了這些資料分析之後可以幹嘛呢?那可做的就很多了,我對你打上一些標簽,然後可以精準給你推廣告,你是對車感興趣還是對鍵盤感興趣,根據資料對你的描述來精準推薦,轉化率會更高,然後也可以給你推各種各樣的產品和服務,等等。
這隻是資料應用的一些場景,資料的應用遠不止於此,這就是為什麼大資料比較火的原因,因為它可做的事太多了,但是重要的是,你一定要具備資料思維,資料思維可以應用在生活的方方面面,資料是理性的,是講邏輯的,但是憑感覺做事不靠譜因素就比較大了。
如果說,資料分析挖掘是相對技術門檻相對較低的方向,那麼大資料還有另外一個方向「資料開發」,資料開發主要是負責大規模資料的處理和應用,可以算是一個純技術崗了,要求更高,技術含量也更高。需要你懂建模、懂程式設計、懂演演算法,同時還要學習 Hadoop、Storm、Spark 等資料處理平臺,門檻更高,當然了,具備這些技能,前景和錢景一樣很高。
以上,簡單的給大家普及了下大資料的概念以及應用,大資料目前的人才缺口也是蠻大的,各行各業可以說都需要大資料人才,我能給大家普及的就到這裡,畢竟我也不是專業做大資料的,而且單純靠一篇文章無法面面俱到,如果你對大資料感興趣,想學習瞭解相關的知識與技能,這裡給大家推薦一個大資料相關的免費直播。
此次講座特別聯合阿裡雲合作伙伴,11 年大資料專案開發經驗、500 強企業資深大資料架構師 Arry 老師,並且講座分兩個批次,針對不同階段的人群:
零基礎到初級大資料工程師;
適合人群:小白新手、初級 Java 工程師、初級 Python 工程師
中高階大資料工程師批次;
適合人群:1-2 年開發人員
有對大資料方向的任何疑問都可以掃碼加 Arry 老師的個人微信進行諮詢。
微信 id:arrybj