導讀:幾乎每個企業都期望建立自己的完善的合體的資料體系,但成功的例子並不多。本文希望用一些實踐闡述以下幾個觀點:
– 資料產品應該樸實無華
– 浮躁的認知會有大麻煩
– 如何正確認識自己,如何敏捷
作者:楊雷
來源:AI前線(ID:ai-front)
有位做供應鏈資料分析的朋友很開心的說正在創業中,打算在供應鏈金融方面有一番作為,用神經網路的方法做使用者畫像,然後進行市場精準營銷。作者工科數學博士一枚,每每看到有人探討這麼實際應用的東西,都覺得汗顏(自己不懂)與欣慰(越來越多人參與)並存,以至於給我已經是博導的師姐說,“好好鼓勵你的弟子,數學系的春天來了!”
但是,要潑一下冷水,想必每個投身於大資料、人工智慧的人士都碰到過某個瓶頸階段,就是想要更深入瞭解原理的時候,那些公式演演算法實在是看不懂啊。每次我只能勸慰說,就當那是個黑盒,你只要知道輸入輸出,就能得到想要的結果。難道我要告訴實情其實是,最快你得花費半年到一年時間惡補數學知識,才能知道什麼時候用樣式識別,什麼時候用小波分形,什麼時候那個東西是動態規劃······
這篇文章,繼續潑冷水,“如果所有人都去做人工智慧了,落地的事情誰來做?”,好比燒飯師傅都去研究自動炒菜機,在“懶人創造新的世界”之前,世界上的人都已經餓死了。認清自己手頭要做的事情,比展望未來更關鍵,至少你能先存活下來。
01 為什麼要做資料產品
不論是初創、上升期、轉型還是平臺期的企業,回答好自己是誰,為誰服務,服務得如何,怎樣更好的獲利這幾個問題,離不開資料。
從產品的角度看資料產品:
-
Why?很明顯,企業需要看資料,使用者需要看資料。不管你是做戰略計劃、公司願景、企業架構、運維治理、擴張市場、客戶流失、標的營銷,甚至做 OKR、KSF、KPI、威士忌分析,或者告訴你的老闆或下屬做得有多成功或,,,多失敗,你需要資料,這是你的價值。
-
What?When?Who?這是你的內容(範圍和服務),你的視野(過程和效率),你的上帝(細分)。
到底怎樣做?一個笨手笨腳的人(Klutz)都告訴你可以這樣做:
-
KNOW 找準自己的定位,企業使用者尚在起步階段,是沒有能力去索取更多的資料的。此外,還需要精通業務流程,資料流離不開業務流,不論你是 To B 還是 To C,把握好使用者痛點和需求,是首要的。
-
LIGHT 不用再介紹一次 KISS 原則了吧。保持輕裝上陣吧,那樣就算死,也死得輕鬆。
-
USE 動手吧,”想總是問題,做才是答案”。試錯是如此的關鍵,一個企業是否有這個價值觀,甚至影響了是否最終的成敗。後面會提到完美主義者,是如何總是在關鍵時候觸礁的。
-
TELL 告訴你的使用者或老闆,這個產品現在該有多糟糕,雖然你和它已經竭盡全力在工作。奇跡是,他們總會站在你這邊。
-
ZANY 莎士比亞造了這個詞“滑稽”,是讓我們輕鬆點,資料人已經很累了。“資料科學家”,這個稱號顯然已經違背了這個原則,背負了太多。我更傾向於資料分析師,人人皆可當之。
02 資料產品的各種”圈錢”樣式
讓我們先來看看領英 2017 的一個崗位增長報告,誰說大資料已死的?
曾幾何時,作為資料庫管理員或者 java 工程師的你也動心想深入瞭解下何為資料科學,何為機器學習,何為大資料?別猶豫,其他人早就開始了(來自領英 2018 的行業報告):
1. 動輒“大”
一個很有趣的討論,來自我和一位 BAT 資料分析師:
-
“大”代表,首先,很 fashion 了。
-
“大”代表平臺很大,資料很多。
-
“大”代表業務應用很廣,至少傳統方式做不了了。
-
“大”代表 0 到 1 已經平安度過,深挖廣種是時候了。
-
“大”代表,有很多錢做事,需要你也很“貴”才行。
自然,我們在每一個評價後面,跟了一個“?”。但不管,就像專案競標最好有個博士牽頭一樣,“大”代表著,新來的老闆很喜歡。
2. 動輒“智慧”
同樣,新來的老闆更喜歡另外一個詞“智慧”,毋庸置疑的 Top One。作為數學專業出身的我,從來沒想到過會有那麼多人來問“神經網路”的演演算法怎樣才能實現。他們都,瘋了麼?還是世上本無路,走的人多了,就有路了。每次我都用這個來安慰自己,這是一條光明之路,需要越來越多的人前僕後繼,不管你扛著的是步槍還是大炮。
-
影象處理,落地了。
-
語音處理,落地了。
-
還有?
03 我們是如何失敗的
失敗案例一:零售行業中的零庫存
在本世紀初期,新零售流行“一單到底”和“零庫存”這兩個東西,願望是美好的。我“不幸”也參與了其中對庫存最佳化的計劃中,那是一個零售業的 IT 供應商,為打造這個美好的願景老闆給了我一個艱巨的任務,3 個月拿出一個演演算法實現先進的補貨策略。
於是,加班加點,帶著一群人搜尋學習了各種演演算法對進貨渠道、缺貨週期、日銷售情況進行了分析,最終開發出一個幾千行程式碼幾十個輸入變數的程式,準備上馬。
這時,老闆問了一句,“這演演算法準麼? 某便利店商品 A 今天銷售 20 件,庫存只有 5 件,你算出來要補進 30 件,我排不過來貨運啊?而且這兩天賣得好是因為天熱,過幾天下雨咋辦?”
最後,老闆決定,還是按照老辦法,盤點時由店長決定,快斷貨的時候補一週的貨,靈活處理。
失敗案例二:倉儲行業中的自動化監控
2005 年,作為方案架構師,“有幸”參與了某大型跨國物流集團倉儲中心產能監控系統設計。系統要求很簡單,監控每個節點的容量、吞吐、以及排隊情況,提供最佳化方案改善效率。
不知道誰頭腦一熱,前期要做一個非常漂亮的 3D 效果的模擬系統,還能顯示每個熱點併進行預警。於是乎,一個加大伯克利的博士(現不知所蹤),一個清華的博士(現某外資銀行做演演算法),一個人大的碩士(現某金融系統分析員),一個交大博士(現某行業產品經理),開始學習 Photoshop 和 AutoCAD。悲慘的一幕隨著資料從客戶傳來而開始,2000 多個執行緒併發跑,還是 B/S 的 3D 效果,效能可想而知。
被客戶拿掉後,大家回顧說,還不如老老實實用 Excel 做幾個表格和圖形,能反映效能狀態,傳送問題原因,再研究下最佳化演演算法其實並不難。
失敗案例三:教育行業中進度控制
這是一個 CRM 體系再造專案,用 Salesforce 替換原有老系統,作者參與的是其中 Business Intelligence 系統的再造,也就是俗稱的企業報表系統。背景如下:
-
老闆是完美主義者,需要漂亮的結果向投資人證明自己的成功。
-
使用者對新產品信心不足,抗拒心很強,並不太配合前期需求調研和後期產品驗收。
-
產品經理以及技術經理都是新人,並且有遠大的做好事情的抱負。
-
開發人員 80% 都是新人,技術力量參差不齊;老員工屬於內向型。
其實,它最終沒有失敗,只是所有人都累垮了:
-
Salesforce 平臺作為資料源,初期系統尚在開發中,技術經理考慮不想將來重覆工作(rework),決定暫緩啟動開發計劃。這個決定直接導致中期專案進度確認時一無所有,於是被老闆和專案高層標識為危險而責難,而後期使用者伸手要資料時,各種沒有準備也導致整個專案被推遲上線。
分析:敏捷之一大忌就是怕重覆工作,那是設計分析能力問題,不是延遲工作的藉口,誰說資料產品就不能敏捷?
-
到底是完全複製原來的系統 KPI,還是重新定義,以及是否要設計全新的前端展示?這個問題從一開始到結束,困擾了整個團隊的每個人。老闆嚴要求 + 產品新人 + 業務不配合 + 老員工的惰性,導致舉步維艱。最後,一套七零八落的半成品系統展示在使用者面前,正確率和使用率很低。
分析:從上往下剝離,老闆要求的不一定就是對的(這往往無解),產品和業務必須在標的和方向上達成一致,以及技術決定生產力,這幾點缺一不可,要突破卻難上加難。
-
需求要考量教育平臺學生成績,一個學生某次考試會有各種技能的不同分數。問題來了,是需要資料準備到最細粒度,還是彙總聚合?愛好完美和細節的技術經理又出現了,一定要到最低粒度。不幸的是,由於專案進度緊迫,出現了各種設計和需求脫節以及資料不一致問題出現,各種會議討論甚至互相指責隨之而來。
分析:還是敏捷問題,資料倉庫權威 Ralph Kimabll 是一個典型的細節專家,他所追求的細節是資料架構設計以及企業資料平臺建設的願景。但是,這個專案是一個典型的 CRM 系統切換,業務再造是基本標的,這時追求極致的細節變成了不切實際的要求,帶來的後果就是本末倒置,所有人疲於其實不那麼重要的問題上。
04 遠離斜視
有位獵頭顧問對我說,目前大資料分析師的崗位不多,我近乎驚訝的回答到,”怎麼會,這個時代,你招人不說和大資料相關,都會覺得不夠檔次啊’。事實總是證明我們是錯的,拿開障目的那片葉子,正視真實需求,是多麼難能可貴的企業家精神。
科學家是嚴謹的代名詞,而大資料不需要嚴謹。是這樣麼?責任不同,視角也應該不同:
-
老闆,720 度看資料,3-5 年規劃中打算帶著企業到什麼樣的資料成熟度 — 這個成熟度一定和企業規模,組織管理,業務流程的成熟度成正比。使用者,360 度看資料,這裡把使用者擺到很高的視角,因為他們不是傻子,是最知道怎麼看和用資料的人。
-
產品經理,30-180 度看資料,首要近視看眼前問題,不然會被使用者罵死。也要遠視看路線圖,不然會被老闆下崗。
-
技術經理,60-120 度看資料,短期 + 長期規劃,切忌操之過急,切忌漫無目的。
-
前後端程式員,90 度看資料,那是你的兩大支柱之一(演演算法 + 資料),多快好省是你的職責。
-
資料分析師,??度看資料,你在哪兒,你去哪兒,你是誰,誰是你?想清楚。
▲不同視角看 Score Card
05 落地是如此的簡單 — 80/20 原則
傳統與自動化的糾纏,從古至今一直存在。如果傳統方式能達到 95% 的精確度,夠了麼?
當我們在所有的演演算法中,對於圓周率的使用僅僅是 3.14 就已經足矣,又有多少人知道併在乎 3.1415926 後面的一位是 5 呢?
最後那 5% 的精準度,是紅海最後的利潤。這是收到最多的一個反駁的論點。但是當我們的企業,有超過 80% 的使用者對資料的認知,還停留在填鴨階段;當我們的運維還相當大程度依賴於半自動化,是不是該多花點心思寫個 SQL 之類的。搭建資料產品的過程和企業以及使用者的認知息息相關:
-
積累業務資料,重點在採集。Excel,SQL 夠了。
-
推送資訊到使用者,重點在快速提供。Excel,SQL 夠了。
-
自助式體驗,重點在提升。Excel,SQL 夠麼?
-
平臺,重點在互動。Excel,SQL 不夠了。
認知的過程是相當漫長的,每一步都要踏踏實實落地,跑之前要學會走。
06 結束語
有客戶問我何為敏捷?我的答覆如下,不僅僅只針對資料產品:
-
我竭力面對任何一個需求,可能優先順序上會有區別,可能個人能力上會理所不能及,或者讓自己無法權衡處理好每一個事情。但我仍然願意告訴每一個希望我幫助的人,我會竭力幫助他, 哪怕其實我答應的實情超出了我的能力。
-
敏捷,本質就是靠近使用者,有效溝通,快速迭代產品,不追求完美,要求腳踏實地。做產品就是要滿足領導要求,要滿足使用者需求,而這兩者常常會有衝突,就會很心累,這點在很多公司特別突出。這種情況,任何一個有豐富經驗的專案管理者或者產品經理,都不能很好的協調。所以,搭建好領導,產品,使用者幾方之間的相互理解的橋梁,用使用者導向的工作方式,儘量讓你的方案能落地,儘量讓標的達成一致而不是衝突,是每個做資料產品的人士應該牢記的工作原則。
送你一個彩蛋
彩蛋的正體是
第25屆北京國際圖書博覽會 (BIBF)
免費門票
數量有限,先到先得
▲ 識別上面的二維碼,就能領取哦
那麼……
BIBF 是個啥?
BIBF 即 北京國際圖書博覽會
創辦於1986年
是亞洲範圍內規模最大的國際書展
2018年8月22日-26日
第25屆北京國際圖書博覽會
將於在北京(順義)舉辦
展廳是不是很高大上?▲
共2500多家出版企業參展
展覽面積達到97700平方米
2017BIBF名家雲集
諾貝爾文學獎獲得者莫言盛大亮相
大資料合作伙伴
機械工業出版社
作為BIBF的參展單位
籌備了精彩活動
邀請諸多重磅作者和大咖譯者前來
與你面對面交流
他們是!
8月22號 下午場
13:00~14:40 廖恆《爆紅》
14:40~15:20 郭超敏《低慾望社會》
15:20~16:00 楊曉莉 《認識經濟》
8月23號
上午場:企業管理與運營專場
10:00~10:40 路江湧《共演戰略》
10:40~11:20 邱昭良《如何系統思考》
11:20~12:00 向東平《經營者養成筆記》
8月23號
下午場:市場營銷專場
14:00~15:00 唐文、葉壯、鄧斌《秒懂力》
15:00~16:00 李明軒《運營有道》
16:00~17:00 方軍《付費》
8月24號
上午場:區塊鏈專場
10:00~10:40 杜均《區塊鏈+》
10:40~11:20 何祝君《深度探索區塊鏈:Hyperledger技術與應用》
11:20~12:00 馮少華《阿米巴經營實操手冊》
8月24號
下午場:企業管理與運營專場
14:00~15:00 《高績效教練》PCI
15:00~16:00 張雲《品類戰略》長城WEY品牌定位之道(裡斯中國)
16:00~17:00 藺雷《內創業革命》
8月25號 上午場
10:00~10:40 朱恆源《戰略節奏》企業的戰略節奏
11:20~12:00 柴佔祥《自動駕駛改變未來》
8月22日-26日BIBF北京國際書展
乾貨滿滿 不容錯過
記住這個地址!▼
北京新國展 W2館—F06展臺
機械工業出版社
說不定還能與資料叔
來個驚!悚!的邂逅~
長按識別二維碼免費報名
【報名必讀】
應BIBF主辦方要求
本次活動全部憑紙質入場券參加,每券一人
為方便您及時領取,不錯過感興趣的沙龍
報名後,請入群瞭解詳細資訊,領取入場券
最後!我們的展區是這樣滴!▲
我們的展區是這樣滴!!
我們的展區是這樣滴!!!
重要的事情說三遍!!!
點選閱讀原文,免費領票!