導讀:隨著時代的發展,越來越多的資料量堆積,然而這些密密麻麻的資料的可讀性較差並且毫無重點,而資料視覺化更加直觀有意義,更能幫助資料更易被人們理解和接受。
因此運用恰當的圖表實現資料視覺化非常重要,本文歸結圖表的特點,彙總出一張思維導圖,幫助大家更快地選擇展現資料特點的圖表型別。
▲圖表型別-思維指南(點選可放大)
作者:安琪Angela
來源:
https://www.jianshu.com/p/28c4b43c396d
經作者授權轉載
接下來我將依次介紹常用圖表型別,分析其適用場景和侷限,從而幫助大家透過圖表更加直觀的傳遞所表達的資訊。
1. 柱狀圖
▲柱狀圖
展示多個分類的資料變化和同類別各變數之間的比較情況。
-
適用:對比分類資料。
-
侷限:分類過多則無法展示資料特點。
相似圖表:
-
堆積柱狀圖。比較同類別各變數和不同類別變數總和差異。
-
百分比堆積柱狀圖。適合展示同類別的每個變數的比例。
2. 條形圖
▲條形圖
類似柱狀圖,只不過兩根軸對調了一下。
-
適用:類別名稱過長,將有大量空白位置標示每個類別的名稱。
-
侷限:分類過多則無法展示資料特點 。
相似圖表:
-
堆積條形圖。比較同類別各變數和不同類別變數總和差異。
-
百分比堆積條形圖。適合展示同類別的每個變數的比例。
-
雙向柱狀圖。比較同類別的正反向數值差異。
3. 折線圖
▲折線圖
展示資料隨時間或有序類別的波動情況的趨勢變化。
-
適用:有序的類別,比如時間。
-
侷限:無序的類別無法展示資料特點。
相似圖表:
-
面積圖。用面積展示數值大小。展示數量隨時間變化的趨勢。
-
堆積面積圖。同類別各變數和不同類別變數總和差異。
-
百分比堆積面積圖。比較同類別的各個變數的比例差異。
4. 柱線圖
▲柱線圖[1]
結合柱狀圖和折線圖在同一個圖表展現資料。
-
適用:要同時展現兩個專案資料的特點。
-
侷限:有柱狀圖和折線圖兩者的缺陷。
5. 散點圖
▲散點圖
用於發現各變數之間的關係。
-
適用:存在大量資料點,結果更精準,比如回歸分析。
-
侷限:資料量小的時候會比較混亂。
相似圖表:
-
氣泡圖。用氣泡代替散點圖的數值點,面積大小代表數值大小。
6. 餅圖
▲餅圖
用來展示各類別佔比,比如男女比例。
-
適用:瞭解資料的分佈情況。
-
缺陷:分類過多,則扇形越小,無法展現圖表。
相似圖表:
-
環形圖。挖空的餅圖,中間區域可以展現資料或者文字資訊。
-
玫瑰餅圖。對比不同類別的數值大小。
-
旭日圖。展示父子層級的不同類別資料的佔比。
7. 地圖
▲地圖
用顏色的深淺來展示區域範圍的數值大小。
-
適合:展現呈面狀但屬分散分佈的資料,比如人口密度等。
-
侷限:資料分佈和地理區域大小的不對稱。通常大量資料會集中在地理區域範圍小的人口密集區,容易造成使用者對資料的誤解。
相似圖表:
-
氣泡地圖。用氣泡大小展現資料量大小。
-
點狀地圖。用描點展現資料在區域的分佈情況。
-
軌跡地圖。展現運動軌跡。
8. 熱力圖
▲熱力圖[2]
以特殊高亮的形式顯示訪客熱衷的頁面區域和訪客所在的地理區域的圖示。
-
適合:可以直觀清楚地看到頁面上每一個區域的訪客興趣焦點。
-
侷限:不適用於數值欄位是彙總值,需要連續數值資料分佈。
9. 矩形樹圖
▲矩形樹圖[3]
展現同一層級的不同分類的佔比情況,還可以同一個分類下子級的佔比情況,比如商品品類等。
-
適用:展示父子層級佔比的樹形資料。
-
缺陷:不適合展現不同層級的資料,比如組織架構圖,每個分類不適合放在一起看佔比情況。
10. 指標卡
▲指標卡[4]
突出顯示一兩個關鍵的資料結果,比如同比環比。
-
適合:展示最終結果和關鍵資料。
-
缺陷:沒有分類對比,只展示單一資料。
11. 詞雲
▲詞雲[5]
展現文字資訊,對出現頻率較高的“關鍵詞”予以視覺上的突出,比如使用者畫像的標簽。
-
適合:在大量文字中提取關鍵詞。
-
侷限:不適用於資料太少或資料區分度不大的文字。
12. 儀錶盤
▲儀錶盤
展現某個指標的完成情況。
-
適合:展示專案進度。
-
侷限:只適合展現資料的累計情況,不適用於資料的分佈特徵等。
13. 雷達圖
▲雷達圖[6]
將多個分類的資料量對映到坐標軸上,對比某專案不同屬性的特點。
-
適用:瞭解同類別的不同屬性的綜合情況,以及比較不同類別的相同屬性差異。
-
侷限:分類過多或變數過多,會比較混亂。
14. 漏斗圖
▲漏斗圖[7]
用梯形面積表示某個環節業務量與上一個環節之間的差異。
-
適用:有固定流程並且環節較多的分析,可以直觀地顯示轉化率和流失率。
-
侷限:無序的類別或者沒有流程關係的變數。
15. 瀑布圖
▲瀑布圖
採用絕對值與相對值結合的方式,展示各成分分佈構成情況,比如各項生活開支的佔比情況。
-
適合:展示資料的累計變化過程。
-
侷限:各類別資料差別太大則難以比較。
16. 桑葚圖
▲桑葚圖
一種特定型別的流程圖,圖中延伸的分支的寬度對應資料流量的大小,起始流量總和始終與結束流量總和保持平衡。比如能量流動等。
-
適合:用來表示資料的流向。
-
侷限:不適用於邊的起始流量和結束流量不同的場景。比如使用手機的品牌變化。
相似圖表:
-
和絃圖。展現矩陣中資料間相互關係和流量變化。資料節點如果過多則不適用。
17. 箱線圖
▲箱線圖
是利用資料中的五個統計量:最小值、第一四分位數、中位數、第三四分位數與最大值來描述資料的一種方法。
-
適用:用來展示一組資料分散情況,特別用於對幾個樣本的比較。
-
侷限:對於大資料量,反應的形狀資訊更加模糊。
本文部分圖表案例來源:
[1] Python爬取數萬條北京租房資料,從6個維度告訴你房租瘋漲的秘密!
[2] 凌晨4點的中國人都在乾什麼?這份資料視覺化地圖給你答案
[5] 我們爬了10萬個產品經理的資訊,原來他們都是性感的背鍋俠!
[6] 資料揭秘真實的網際網路公司:BAT前景最好,這幾家面試難度最低
[7] 用《復聯3》的豆瓣評分教會你正確使用條形圖、餅圖、漏斗模型
據統計,99%的大咖都完成了這個神操作
▼
更多精彩
在公眾號後臺對話方塊輸入以下關鍵詞
檢視更多優質內容!
PPT | 報告 | 讀書 | 書單
Python | 機器學習 | 深度學習 | 神經網路
區塊鏈 | 揭秘 | 乾貨 | 數學
猜你想看
-
最全機器學習種類講解:監督、無監督、線上和批次學習都講明白了
Q: 你都常用哪些型別的圖表?
歡迎留言與大家分享
覺得不錯,請把這篇文章分享給你的朋友
轉載 / 投稿請聯絡:baiyu@hzbook.com
更多精彩,請在後臺點選“歷史文章”檢視