歡迎光臨
每天分享高質量文章

曾經我是一個只會excel的資料分析師,直到我遇到了……

我是一個資料分析師。


準確來說我是一個當年只會excel資料透視表,就天不怕地不怕地來當資料分析師的人。當年的某一天,我的老闆Q我:

 

小劉啊,我小姨子給了我一個全國市委書記的名單,你幫我看看,有什麼規律啊?

 

我接過老闆的任務,心想:老闆的小姨子在政府裡混的不錯啊,標的居然是市委書記。難怪老闆平時這麼多政府專案,我得看看什麼她什麼目的。

 

我迅速開啟了表格。發現表格裡把往期和現任的每一位市委書記資訊都調查得很清楚。



既然是小姨子的要求,我先來看看市委書記裡有多少女性好了:


首先我點開資料透視表,調整引數,然後進行運算得到女性市委書記的數量,寫上函式,求出了女性市委書記的比例,最後我製作圖表對圖示引數進行調整,得出了我的第一個結論:女性市委書記的比例是:2.77%。恩,似乎比較低,小姨子要加油啊。



正當我想把這個結論先截個圖給老闆看看,順便掙個表現時,老闆先給我發資訊了:

 

小劉啊,剛交給你的任務暫時不做了,昨天剛來公司上班的王大鵬剛看到我在看這個表,已經幫我做了一版結論了,圖看著還挺專業。


突然之間沒了掙表現的機會,我很鬱悶。王大鵬是誰?多年來的職業敏感性告訴我,這個新來的,我得去會會!於是我拿著零食來到王大鵬的工位。半小時後,新人大鵬就已經被我掌握:

 

“你想知道我怎麼這麼快做分析?簡單!”大鵬很熱情的說。


“我就使用了幾行python程式碼,你看。”



我:“Python?那是啥?”


大鵬:“Python本來是一門計算機程式語言,非常簡單好學。目前也是做資料分析的主流語言之一,擁有非常豐富的工具包。比如我這裡用到的pandas。”



“有了這些工具包,我就可以使用裡面的讀取(read_csv)功能,把資料載入進來.或者說叫做“提取資料欄位”,比如我給你演示下把名字、省份和出生年份給提取出來。”



“然後就是嘗試者先做做簡單的分析了。可以呼叫Matplotlib和Seaborn兩個工具包,前者是做圖表的,後者是做圖表視覺化的,用熟後比excel簡單多了。選擇好你的資料,再呼叫工具包裡的圖表,圖表就有啦,其實和excel處理好資料再選擇圖表的邏輯是類似的。 ”  



“我一般都是先對比兩個維度,比如我嘗試著分析市委書記們的出生年月和任期的關係,直接把計算的結果整理好,呼叫表格模板,就可以出這樣的圖啦。




你註意看,其實中國大部分的官員都是任期1-4年的,但是1950年-1960年出生,現在大概60歲上下的人,任期普遍要比其他年齡段的人要長幾年,這裡面水比較深吶: ” 



“不明覺厲!可是這張圖表達得會不會太晦澀了?”我問道。

 

“沒錯,劉哥,看來你很有經驗。我也覺得想直方圖還是不清楚,但是熱力圖就好很多了,還能看看不同歲數不同任期的人都有多少,所以我就改了種表達。劉哥你看,看是不是好多了?”



我突然有點慶幸我沒把我簡陋的圖發給老闆,同時也不禁有一絲緊迫感。雖然說這些分析,我用excel慢慢做也能搗鼓出來,但我點來點去,每換一個資料維度就要重新做一次透視表,還要調整樣式,肯定不如人家寫程式快。而且大鵬用的python程式碼明顯有更強的靈活性,如果將來老闆讓我做一些更難的資料分析,大鵬不就很快能取代我了?

 

不行,為了保住飯碗,我得需要迭代一下自己的技術啊!於是我繼續像大鵬打探:

 

我:“那Python難學麼?學到你這樣要多久呢?

 

大鵬露出了有點天真的笑容:要系統的學當然沒幾個月是不行的,不過也有些套路,比如劉哥你本來就會excel,瞭解資料,再多試試用python程式碼完成像剛才老闆給的這樣的簡單的統計分析,可能1周就能上手啦。

 

我:哦?這麼快,那給我推薦點教程啊書什麼的。

 

大鵬神秘一笑,轉身就甩了我一門《Python資料分析師》訓練營,限時免費。如果你想學Python資料程式設計,我強烈建議你從一次“要動手、有標的、有答疑”的7天《Python資料分析師訓練營》開始學習。


喏,就是下麵這個~


想要免費加入《Python資料分析師》訓練營的小夥伴,請掃描下方二維碼,進入網易雲課堂微專業服務號後,根據系統提示,就可以加入資料分析師學習QQ群啦!

除了免費參與訓練營外,進入資料分析師學習QQ群後還可領取一份資料分析資料包(包含房價、城市設施、人口等城市資料;知乎、淘寶等網頁資料及精選電子書等)。
贊(0)

分享創造快樂