歡迎光臨
每天分享高質量文章

人人都在談的 “資料驅動” 到底是什麼?你確認自己做的是資料驅動嗎?

導讀:移動網際網路技術的快速發展,移動終端的廣泛普及,催生了大資料技術。今天,無論是個人的日常生活,還是企業的業務發展,都和資料密切相關,大資料技術正成為新發明、新產品和新服務的創新源泉。

近幾年,各種驅動在天上飄,有產品驅動、技術驅動、政策驅動還有老闆驅動,大資料也不甘寂寞,於是乎“資料驅動”一詞漸漸熱了起來。很多企業都說自己在搞資料驅動,也有不少從事資料技術的公司在對外提供資料驅動的技術諮詢和實施服務。各個行業都在激動地討論著“資料驅動”,有些公司甚至宣稱已經實現了“資料驅動”。

像大資料和區塊鏈一樣,很多人似是而非地討論著資料驅動,而且資料驅動逐漸也有很大希望繼在大資料、區塊鏈之後成為另外一個忽悠人民恐嚇百姓的民俗化名詞。那麼到底什麼是資料驅動呢?你真的在做資料驅動嗎?

01 何為“資料驅動”

在討論資料驅動前,首先讓我們看一個例子,開啟手機移動應用Uber,APP頁面會有優惠碼提示:轉發優惠碼,如有下線使用該優惠碼,你將獲得優惠;在用車時,APP會根據坐車時間段和車輛緊張程度,提醒溢價的倍數,你如果不接受,則訂單取消;打車結束後,APP自動選擇優惠券進行結算,無需手動選擇;最後你的郵箱將收到此次打車的中英文版本的郵件。整個過程全部由系統自動完成,無需人工決策。包括轉發優惠碼的部分,也是由系統自動提醒,刺激使用者點選完成的。

由此可見,資料驅動是透過移動網際網路或者其他的相關軟體為手段採集海量的資料,將資料進行組織形成資訊,之後對相關的資訊進行整合和提煉,在資料的基礎上經過訓練和擬合形成自動化的決策模型。當新的情況發生,新資料輸入的時候,系統可以用前面建立的模型以人工智慧的方式直接進行決策。如下圖所示,訊號、資料、資訊、情報、知識、智慧,一環扣一環,不斷地上升迭代,完成一個又一個決策。 

訊號是機器可讀的模擬或者數字脈衝,資料是人類可讀的訊號,資訊是經過索引後可以查詢的組織化的資料,而情報是對特定人在特定場景下有針對性的資訊,知識是大量情報積累後可以改變人的知識結構的部分,智慧是基於知識和經驗可用於決策的部分。這個決策在人工智慧時代就是基於資料和演演算法,特別是機器學習建立模型和使用模型的決策。因為在移動網際網路時代,業務需要海量毫秒級的瞬間決策,這是人類決策無法完成的。另外,人是感情動物,所有的決策會夾雜著情緒、親情、關係等社會關係,所做的決策未必是完全客觀的,很有可能添加了主觀因素。基於資料和模型的資料驅動決策是更加靠譜的方式。

但是這個過程需要資料的不斷輸入,需要模型根據比對決策結果和現實資料把偏差資訊反饋給機器學習,在其後不斷的機器學習迭代過程中自我完善。從這個過程的描述中我們可以看到,資料驅動對企業的要求非常高,要有流式的資料不斷地註入,要有以機器學習為基礎的決策模型,要有能依賴模型輸出結果可以推動的業務系統,要有可以反饋預測偏差的反饋機制。

現在大家常聽到“資料驅動”,也有很多公司對外宣稱其實現了“資料驅動”,諸如“這是一家資料驅動公司”等話語比比皆是。但它果真是一家“資料驅動”公司麼?

02 “資料驅動”的特徵

在一個真正的資料驅動的企業,資料是提供報告、深度模擬預測的來源,企業決策者應該將資料分析納入公司決策流程,並對公司的決策提供價值和影響。資料驅動企業最大的特點是擁有一套完整的資料價值體系。資料價值體係指的是一套完整的從資料收集、整理、報告到轉化成行業洞見和決策建議的流程。而落實到操作層面則是透過對資料的收集、整理、提煉,總結出規律形成一套智慧模型,之後透過人工智慧的方式作出最終的決策。因此,真正的資料驅動公司應該具備以下特徵:

1、海量的資料;

2、自動化的業務;

3、強大的模型支援自動化決策。

這三個條件缺一不可,並形成一個迴圈,不斷地進行資料收集,完成建模,自動決策。

03 何為“以資料為中心”

到目前為止,好多宣稱自己是“資料驅動”業務的公司,其實並沒有真正的做到“資料驅動”,也許他只是一個“以資料為中心”進行決策的公司,只是在利用資料,並沒有真正實現資料的價值。

“以資料為中心進行決策”的方式與“資料驅動”相比,他沒有“資料驅動”那樣的智慧,也沒有“資料驅動”那樣的高效。“以資料為中心進行決策”顧名思義就是用資料來支援決策,這些資料包括歷史記錄中的和現在產生的。透過對資料的整理、抽取,將資料轉化為可讀的知識,形成分析結果,決策者根據分析報告的結果考慮並決定決策結果,最終決策由人為參與。

舉一個簡單的例子,假設有A 和 B兩家訂票網站,A 公司將從網站收集到的資料進行分析,透過資料分析結果認為五一是出行高峰,於是決定抬高價格,並手動從後臺調整了五一前後的機票價格和酒店價格。

B 公司則透過自動化手段實時收集、分析相關資訊,總結規律,形成智慧模型,當使用者進行搜尋時,後臺自動根據模型規則,對價格進行調整。

這2個公司,哪家是資料驅動型的公司呢?

顯而易見,公司 B 是資料驅動型的公司,而公司 A 則是一家“以資料為中心進行決策”的公司。

“以資料為中心進行決策”的公司,錶面上公司所有人員,如產品、運營、技術、銷售都可以貢獻資料,也可以從資料裡得出東西,但中間做決策的是人。如 A 公司,最終由人來決定機票是否提價。

04 資料即未來

那麼該如何真正的打造一個“資料驅動”的專案或公司呢?現在市面上關於大資料的書籍汗牛充棟,扔出去一塊磚也可以砸到N個大資料專家。但是資料科學作為一門嚴肅的新學科方興未艾,真正關於利用資料科學的方法論解決實際工作中的資料科學問題的實踐書籍少之又少。Brian Godsy(布瑞恩·戈德西)在他的《資料即未來》一書詳細介紹了資料科學專案的三個階段:

1、準備階段進行資訊收集;

2、構建階段將計劃付諸行動,利用準備階段獲得的資訊以及相關統計和軟體提供的可用工具來構建產品;

3、交付階段進行產品的交付、反饋及修改等。

書中還會教你如何預見問題以及如何處理不確定性,一步步引導你完成軟體和科學思維的最佳實踐,堪稱“資料驅動”方面的扛鼎之作。

作者 / 來源:泡麵辦公室


延伸閱讀《資料即未來》

點選小程式瞭解及購買本書

點選文末右下角“寫留言”發表你的觀點

推薦閱讀

日本老爺爺堅持17年用Excel作畫,我可能用了假的Excel···

180頁PPT,講解人工智慧技術與產業發展

終於有人把雲端計算、大資料和人工智慧講明白了!

資料告訴你:跟缺“芯”相比,中國當前的這個問題更致命!

Q: 關於資料驅動,你現在瞭解了多少?

歡迎留言與大家分享

覺得不錯,請把這篇文章分享給你的朋友

轉載 / 投稿請聯絡:baiyu@hzbook.com

更多精彩文章,請在公眾號後臺點選“歷史文章”檢視

贊(0)

分享創造快樂