(給資料分析與開發加星標,提升資料技能)
英文:Kristi Anderson,翻譯:CSDN/ScottJiang
如果你準備從商業資料庫過渡到開源資料庫,並想知道哪些資料庫在2019年最受歡迎?想知道內部部署VS公共雲VS混合雲基礎架構究竟哪種最符合你的資料庫戰略?或者,你正在考慮在你的應用程式中新增新資料庫,並希望檢視哪些組合最受歡迎?……我們在上個月的Percona Live活動中找到了你需要的所有答案,並將這些見解分解為以下的趨勢報告:
-
熱門資料庫的使用情況:開源資料庫VS商業資料庫;
-
雲基礎架構分析:公共雲VS內部部署VS混合雲;
-
混合永續性(Polyglot Persistence)趨勢:使用的資料庫種類數量VS最熱門組合。
2019年熱門資料庫使用情況
那麼,哪些資料庫在2019年最受歡迎?我們透過開源資料庫與商業資料庫來細分資料:
開源資料庫
開源資料庫是免費的社群資料庫,其原始碼可供公眾使用,並且可以在其原始設計中進行修改或使用。開源資料庫的流行示例包括MySQL,PostgreSQL和MongoDB。
商業資料庫
商業資料庫由商業企業開發和維護,可透過支付許可費來使用,並且不得修改。商業資料庫的常見示例包括Oracle,SQL Server和DB2。
熱門開源資料庫
MySQL仍然是排名第一的免費開源資料庫,佔開源資料庫使用量的30%以上。這並不奇怪,因為根據DB-Engines統計情況如下圖所示,MySQL已經持續多年保持這一地位。
PostgreSQL是排名第二的開源資料庫其使用者佔比達到13.4%。其次是MongoDB,排名第三,佔12.2%。基於DB-Engines流行趨勢排名,我們可以再次預測這一點,但就在三個月前,我們在2019年的資料庫趨勢(SQL VS NoSQL、熱門資料庫、單資料庫使用VS多資料庫使用)報告中,MongoDB排名上升到第二名,佔比為24.6%。
雖然開源資料庫使用前三名的資料庫使用者佔有量超過50%,但我們也看到了4 Redis,5 MariaDB,6 Elasticsearch,7 Cassandra和8 SQLite的良好表現。最後大約有2%使用者佔有量的資料庫包括Clickhouse、Galera、Memcached和Hbase等。
熱門商業資料庫
在下一個圖中,我們將會看到一個獨特的報告,它代表了多語言永續性和遷移趨勢,那就是熱門的商業資料庫與開源資料庫一起使用。
我們已經觀察出來一種明顯的趨勢,就是利用多種資料庫種類來滿足你的應用程式需求,並希望比較組織使用者如何在單個應用程式中使用商業和開源資料庫。此報告還表示正在遷移到開源資料庫的商業資料庫使用者情況。例如,PostgreSQL是連續兩年受歡迎的、增長最快的資料庫,其目前正在遷移到PostgreSQL的使用者群有11.5%是組織使用者。
所以,既然我們已經解釋了這份報告所代表的內容,那麼讓我們來看看與開源一起使用熱門商業資料庫。
Oracle是世界上排名第一的資料庫,上圖反映了Oracle佔有超過2/3的和開源資料庫組合商業資料庫的份額。
令人震驚的是,這份報告中Oracle和排在第二名的微軟SQL Server之間存在巨大差距,因為根據DB-Engines,它的差距要小得多。IBM Db2排名第三,佔與開源相結合的商業資料庫使用量的11.1%。
按資料庫劃分的雲基礎架構
現在,我們來看看資料庫管理系統對雲基礎架構設定的劃分情況。
公共雲VS內部部署VS混合雲
我們向開源資料庫使用者詢問了他們如何託管他們的資料庫部署,以確定內部部署VS公共雲VS混合雲部署之間的當前趨勢。
令人驚訝,排在第一位的是49.5%的開源資料庫部署是在本地執行的。雖然我們預測到了這一結果,但我們對內部部署所佔百分比仍然感到驚訝。在我們最近的“2019年PostgreSQL趨勢報告”( 2019 PostgreSQL Trends Report)中反映的情況,內部或私有雲部署佔59.6%,比本報告高出10%以上。
公共雲部署排名第二,佔36.7%開源資料庫部署在公共雲,與PostgreSQL報告中公共雲部署佔34.8%情況基本一致。然而,混合雲從這份報告顯示情況來看相比於PostgreSQL混合雲部署的5.6%情況相比大幅增長,開源資料庫的混合雲部署達到13.8%。
那麼,哪種雲基礎架構更適合你?以下是關於公共雲VS私有VS混合雲情況的快速介紹:
公共雲
公共雲是一種雲端計算模型,其中IT服務透過網際網路提供。通常透過訂閱使用樣式購買,公共雲很容易設定,沒有很大的前期投資要求,並且可以隨著應用程式需求的變化而快速擴充套件。
內部部署
內部部署或私有雲部署是專用於在其自己的資料中心(或與第三方供應商的非公共網路情況下)執行的單個組織的雲解決方案。透過內部部署設定可以更多地定製你所需的基礎架構,但需要對硬體和軟體計算資源進行大量的前期投資,以及持續的維護責任。這些部署型別最適合具有高階安全需求、受監管行業或大型組織的組織使用者。
混合雲
混合雲是公共雲和私有雲解決方案的混合體,整合到單一基礎架構環境中。這允許組織在公共雲和私有雲之間共享資源,以提高其效率、安全性和效能。這些最適合需要內部部署基礎架構的高階安全性以及公共雲的靈活性的部署情況。
現在,讓我們來看看每種開源資料庫種類最受歡迎的雲基礎架構。
開源資料庫部署:內部部署
在下圖結果中,以及下麵的公共雲和混合雲圖表中,我們按照利用該類雲基礎架構的情況細分每個開源資料庫部署百分比。
那麼,哪些開源資料庫最常部署在本地? PostgreSQL排名第一,其55.8%的使用者選擇內部部署,緊隨其後的是MongoDB,佔52.2%,Cassandra佔51.9%,MySQL有50%的使用者選擇內部部署架構。
報告中內部部署不到一半的開源資料庫包括MariaDB佔47.2%,SQLite佔43.8%,Redis佔42.9%。內部部署最少的資料庫是Elasticsearch,僅為34.5%。
開源資料庫部署:公共雲部署
現在,我們來看看公共雲部署中開源資料庫的細分情況。
SQLite是公共雲基礎架構中最常部署的開源資料庫,佔其部署的43.8%,緊隨其後的是Redis,佔42.9%。 MariaDB公共雲部署率為38.9%,MySQL為36.7%,Elasticsearch為34.5%。
三個資料庫的公共雲部署情況不到其總體部署情況的1/3,其中MongoDB佔30.4%,PostgreSQL佔27.9%,Cassandra佔公共雲部署最少,僅佔25.9%。
開源資料庫部署:混合雲部署
現在我們已經瞭解了開源資料庫如何在內部部署與公共雲部署的細分情況,讓我們來看看利用混合這兩種計算環境的部署情況。
利用混合雲部署的排名第一的開源資料庫是Elasticsearch,佔31%。與其結果最接近的混合雲資料庫是Cassandra,但是混合雲部署僅佔22.2%。
MongoDB在混合雲中的部署百分比為17.4%,PostgreSQL為16.3%,Redis為14.3%,MariaDB為13.9%,MySQL為13.3%,最後SQLite其混合雲部署僅為的12.5%。
開源資料庫部署:多雲部署
平均而言,20%的公共雲和混合雲部署正在利用多雲戰略。多雲是使用兩種或更多種雲端計算服務的方式。我們還查看了所使用的雲的數量,發現一些資料部署在單個組織中利用了多達5個不同的雲提供商:
最受歡迎的用於開源資料庫託管的雲提供商
在我們針對雲基礎架構細分的最新分析中,我們分析了哪些雲提供商最受開源資料庫託管的歡迎:
AWS是開源資料庫託管的首選雲提供商,佔該調查中所有雲部署的56.9%。谷歌雲平臺(GCP)排名第二,佔比為26.2%,領先於微軟的Azure,為10.8%。然後Rackspace緊隨其後,佔比3.1%的部署,而DigitalOcean和Softlayer緊隨其後,代表了雲中剩餘3%的開源資料庫部署情況。
混合永續性(Polyglot Persistence)趨勢
混合永續性(Polyglot Persistence)是使用不同資料庫來處理不同需求的概念,也就是在單個應用程式軟體中為實現最終標的使用不同的最適合資料庫。這是一個很好的解決方案,可以確保你的應用程式正確處理你的資料,而不是嘗試使用單一資料庫種類滿足你的所有需求。一個明顯的例子是SQL,它擅長處理結構化資料,而NoSQL最適合用於非結構化資料。
我們來看看幾個多語言永續性分析:
使用的平均資料庫種類數
我們發現公司在單個組織中為其應用程式平均利用3.1資料庫種類。超過1/4的組織使用單一資料庫種類,有些報告最多使用9種不同的資料庫種類:
基礎結構使用的平均資料庫種類數
那麼,這個數字是如何在基礎結構型別中分解的呢?我們發現混合雲部署最有可能利用多種資料庫種類,一次平均使用4.33種資料庫種類。
內部部署通常利用3.26種不同的資料庫種類,而公共雲的平均利用資料庫種類數最低,為3.05種資料庫種類。
最常用的資料庫種類
現在讓我們仔細看看在單個應用程式中最常使用的資料庫種類。
在下麵的圖表中,左列中的資料庫表示該資料庫型別的樣本大小,頂部列出的資料庫表示與該資料庫型別組合的百分比。藍色突出顯示的單元格表示100%的部署組合,而黃色表示0%的組合。
因此,正如我們在資料庫組合熱圖中中看到的,MySQL是我們與其他資料庫種類最頻繁組合的資料庫。但是,儘管其他資料庫種類經常與MySQL結合使用,但這並不意味著MySQL部署總是與其他資料庫型別一同使用。這可以在MySQL的第一行中看到,因為與MySQL的第一列相比,這些是較淺的藍色到黃色,第一列顯示了與藍色(代表100%組合)更高的匹配顏色。
用黑色邊框突出顯示的單元格表示僅利用一種資料庫種類的部署,從黑色邊框突出顯示的單元格的情況來僅使用MySQL的情況佔MySQL部署情況的23%。
我們也可以看到與Db2類似的趨勢,其中Db2的底行顯示它與MySQL、PostgreSQL、Cassandra、Oracle和SQL Server高度合作化,但其他資料庫部署利用Db2的百分比非常低,而SQL Server在50%的部署中使用DB2。
SQL與NoSQL開源資料庫的流行情況
最後不得不提的是,我們比較了SQL和NoSQL的開源資料庫報告。其中SQL表示了超過3/5的開源資料庫,其使用率為60.6%,而NoSQL為39.4%。
我們希望這些資料庫趨勢具有洞察力,並引發一些新想法或能驗證你當前的資料庫策略。
朋友會在“發現-看一看”看到你“在看”的內容