歡迎光臨
每天分享高質量文章

資料科學家:為什麼我要離職……

導讀:根據英國《金融時報》的報道,資料科學家通常“每週會花1到2個小時尋找新工作”。此外,文章還指出:“在聲稱尋找新工作的開發者中,機器學習專家位居第一佔比達到14.3%。資料科學家緊隨其後,為13.2%。”這些資料來自由Stack Overflow對6萬4千名開發者的調研。

我是一名資料科學家。

很多人都認為資料科學家是21世紀最性感的工作,作為資料科學家有豐厚的薪資,這無疑是一份理想工作。該領域聚集了大量高精尖人才,他們熱衷於解決複雜的問題,而且熱愛他們的工作。

然而事實上根據英國《金融時報》的報道,資料科學家通常“每週會花1到2個小時尋找新工作”。此外,文章還指出:“在聲稱尋找新工作的開發者中,機器學習專家位居第一佔比達到14.3%資料科學家緊隨其後,為13.2%。“這些資料來自由Stack Overflow對6萬4千名開發者的調研。

對此我深有體會,最近我剛換了新的資料科學工作。

為什麼有那麼多的資料科學家在找新工作呢?

在回答這個問題之前,我想宣告的是我仍然是一名資料科學家。我熱愛這份工作,我也不想阻止那些想成為資料科學家的人,因為這份工作有趣,刺激而有價值。本文的目的是向你們介紹這份工作背後不那麼光鮮的一面。

從我看來,資料科學家主要出於四個原因對他們的工作感到不滿。

01 期望與現實不符

我認識的許多初級資料科學家(包括我自己)入行都是由於,在我們看來資料科學家使用新型的機器學習演演算法去解決複雜問題,從而對業務產生巨大影響。我們會覺得這份工作比之前做的任何工作都重要。但是,情況往往不是如此。

在我看來,期望與現實不符是許多資料科學家離職的終極原因。當中具體有很多原因,在此我不能一一列舉,這裡只舉出我所遇到的情況。

每家公司情況不同,不能一概而言。但是據我所知,許多公司在聘請資料科學家時,並沒有配備適當的基礎設施,讓其能夠從AI中得出有價值的結論。再加上這些公司在招聘初級資料從業人員之前,並沒有聘請經驗豐富的資深資料專家,這樣就會導致雙方關係不融洽,無法達到互相期望值。

資料科學家希望在工作中,透過編寫智慧機器學習演演算法得出分析見解。但他們很難做到這點,因為他們的首要工作是整理資料基礎架構,得出分析報告。相比之下,公司只希望他們能夠每天在董事會中提交相應的圖表。之後公司因為沒有及時得到資料的價值而感到失望,所有這些又會導致資料科學家對工作的不滿。

Robert Chang在他的文章中對初級資料科學家提供了很寶貴的建議:

“評估自身的期望與所處環境的關鍵路徑是否一致非常重要。因此需要找到關鍵路徑與你相符的專案、團隊和公司。”

這突顯了僱主和資料科學家之間的雙向關係。如果公司的決策發展與資料科學家的標的不一致,那麼資料科學家離職只是時間問題。

資料科學家感到失望的另一個原因與我對學術界失望的原因類似。我認為我能對全球各地的人們產生巨大的影響,而不僅僅是在公司內部。事實上,如果公司的核心業務不是機器學習(我的上家公司是媒體出版公司),那麼你所進行的資料科學工作可能只會帶來少量的價值。也許這些工作能累積帶來很有價值的內容,或者你幸運地發現一個大專案,但這不並太常見。

02 決策至上原則

我曾經早上6點起來研究支援向量機。當時我想:“這真的很難,但至少會給我未來的僱主帶來價值。“ 但如果我有時光機的話,我會回到過去打消這個念頭。

如果你認為掌握大量機器學習演演算法能讓你成為最有價值的資料科學家,那麼回到我說的第一點:期望與現實不符

事實是,公司中的領導階層需要對你有好印象。這意味著你必須不斷做領導層安排的工作,比如從資料庫中獲取數字,在適當的時間交給相關人員,做簡單的專案,以便得到上級的好評。在我的上一份工作中,我做了大量這類工作。儘管這會讓人沮喪,但卻是工作的必要組成部分。

03 資料方面的全能專家

公司中的領導層往往不太明白“資料科學家”的含義。這意味著在大家眼中,除了分析專家、報告專家,你還是資料庫專家。

不僅僅是非技術的同事這麼認為。技術方面的其他同事會認為你掌握任何與資料相關的知識。你掌握Spark、Hadoop、Hive、Pig、SQL、Neo4J、MySQL、Python、R、Scala、Tensorflow、A / B測試、NLP、以及任何機器學習和資料相關的知識。

如果在職位描述中你看到了這些具體的內容,請保持謹慎態度。這反映了該公司的工作規範,他們不清楚自身的資料策略,因為他們認為僱用的資料從業人員能夠解決所有的資料問題。

但是試圖告訴他人你真正掌握的技能是很難的。不是因為其他人會輕視你,而是因為作為缺少經驗的初級資料科學家,你擔心他人會輕視你。這是一個很棘手的情況。

04 在孤立的團隊中工作

當我們看到成功的資料產品時,我們經常會看到具有智慧功能的使用者介面設計。重要的是當中有輸出,能夠被使用者感知並解決相關問題。

資料科學家花時間學習編寫和執行機器學習演演算法,然而他們只構成團隊中的一小部分。這意味著獨立工作的資料科學團隊將難以提供價值!

儘管如此,許多公司由資料科學團隊提出自己的專案,並透過程式設計來嘗試解決問題。在某些情況下,這能夠滿足要求。例如,如果需要的只是每季度生成靜態電子錶格。

另一方面,如果標的是在定製的網站開發產品中最佳化提供智慧建議,那麼當中將涉及許多不同的技能,絕大多數是資料科學家所不具備的。因此,如果專案是由孤立的資料科學團隊承擔,那麼很可能會失敗(或者需要很長時間,因為組織孤立的團隊進行大型企業的協作專案並不容易)。

結語

因此,要在行業中成為合格的資料科學家,僅僅在參加Kaggle比賽並學習線上課程是遠遠不夠的。

在找資料科學工作時,找到與自身的關鍵路徑保持一致的公司是很重要的。但是,你也需要調整自身對資料科學家職位的期望。

希望我沒有打擊你成為資料科學家的信心。

作者:Jonny Brooks-Bartlett

編譯:Mika

來源:CDA資料分析師(ID:cdacdacda)

原文:https://towardsdatascience.com/why-so-many-data-scientists-are-leaving-their-jobs-a1f0329d7ea4

推薦閱讀


全球100款大資料工具彙總(前50款)

大資料時代的10個重大變革

日本老爺爺堅持17年用Excel作畫,我可能用了假的Excel···

為什麼要學數學?因為這是一場戰略性的投資

Q: 你對現在的工作還滿意嗎?

歡迎留言與大家分享

覺得不錯,請把這篇文章分享給你的朋友

轉載 / 投稿請聯絡:baiyu@hzbook.com

更多精彩文章,請在公眾號後臺點選“歷史文章”檢視

贊(0)

分享創造快樂