歡迎光臨
每天分享高質量文章

MySQL 資料庫最佳化,看這篇就夠了

(給資料分析與開發加星標,提升資料技能

來源:趙栩彬

segmentfault.com/a/1190000018631870

前言

 

資料庫最佳化一方面是找出系統的瓶頸,提高MySQL資料庫的整體效能,而另一方面需要合理的結構設計和引數調整,以提高使用者的相應速度,同時還要盡可能的節約系統資源,以便讓系統提供更大的負荷.

 

1、最佳化一覽圖

 

 

2、最佳化

 

筆者將最佳化分為了兩大類,軟最佳化和硬最佳化,軟最佳化一般是運算元據庫即可,而硬最佳化則是操作伺服器硬體及引數設定.

 

2.1 軟最佳化

 

2.1.1 查詢陳述句最佳化

 

1、首先我們可以用EXPLAIN或DESCRIBE(簡寫:DESC)命令分析一條查詢陳述句的執行資訊.

 

2.例:

 

DESC SELECT * FROM `user`

 

顯示:

 

 

其中會顯示索引和查詢資料讀取資料條數等資訊.

 

2.1.2 最佳化子查詢

 

在MySQL中,儘量使用JOIN來代替子查詢.因為子查詢需要巢狀查詢,巢狀查詢時會建立一張臨時表,臨時表的建立和刪除都會有較大的系統開銷,而連線查詢不會建立臨時表,因此效率比巢狀子查詢高.

 

2.1.3 使用索引

 

索引是提高資料庫查詢速度最重要的方法之一,關於索引可以參高筆者一文,介紹比較詳細,此處記錄使用索引的三大註意事項:

 

1、LIKE關鍵字匹配’%’開頭的字串,不會使用索引.

 

2、OR關鍵字的兩個欄位必須都是用了索引,該查詢才會使用索引.

 

3、使用多列索引必須滿足最左匹配.

 

2.1.4 分解表

 

對於欄位較多的表,如果某些欄位使用頻率較低,此時應當,將其分離出來從而形成新的表,

 

2.1.5 中間表

 

對於將大量連線查詢的表可以建立中間表,從而減少在查詢時造成的連線耗時.

 

2.1.6 增加冗餘欄位

 

類似於建立中間表,增加冗餘也是為了減少連線查詢.

 

2.1.7 分析表,檢查表,最佳化表

 

分析表主要是分析表中關鍵字的分佈,檢查表主要是檢查表中是否存在錯誤,最佳化表主要是消除刪除或更新造成的表空間浪費.

 

1、分析表: 使用 ANALYZE 關鍵字,如ANALYZE TABLE user;

 

  1. Op:表示執行的操作.
  2. Msg_type:資訊型別,有status,info,note,warning,error.
  3. Msg_text:顯示資訊.
 
2、檢查表: 使用 CHECK關鍵字,如CHECK TABLE user [option]

 

option 只對MyISAM有效,共五個引數值:

 

  1. QUICK:不掃描行,不檢查錯誤的連線.
  2. FAST:只檢查沒有正確關閉的表.
  3. CHANGED:只檢查上次檢查後被更改的表和沒被正確關閉的表.
  4. MEDIUM:掃描行,以驗證被刪除的連線是有效的,也可以計算各行關鍵字校驗和.
  5. EXTENDED:最全面的的檢查,對每行關鍵字全面查詢.
 
3、最佳化表:使用OPTIMIZE關鍵字,如OPTIMIZE [LOCAL|NO_WRITE_TO_BINLOG] TABLE user;

 

LOCAL|NO_WRITE_TO_BINLOG都是表示不寫入日誌.,最佳化表只對VARCHAR,BLOB和TEXT有效,透過OPTIMIZE TABLE陳述句可以消除檔案碎片,在執行過程中會加上只讀鎖.

 

2.2 硬最佳化

 

2.2.1 硬體三件套

 

1、配置多核心和頻率高的cpu,多核心可以執行多個執行緒.


2、配置大記憶體,提高記憶體,即可提高快取區容量,因此能減少磁碟I/O時間,從而提高響應速度.


3、配置高速磁碟或合理分佈磁碟:高速磁碟提高I/O,分佈磁碟能提高並行操作的能力.

 

2.2.2 最佳化資料庫引數

 

最佳化資料庫引數可以提高資源利用率,從而提高MySQL伺服器效能.MySQL服務的配置引數都在my.cnf或my.ini,下麵列出效能影響較大的幾個引數.

 

  • key_buffer_size:索引緩衝區大小
  • table_cache:能同時開啟表的個數
  • query_cache_size和query_cache_type:前者是查詢緩衝區大小,後者是前面引數的開關,0表示不使用緩衝區,1表示使用緩衝區,但可以在查詢中使用SQL_NO_CACHE表示不要使用緩衝區,2表示在查詢中明確指出使用緩衝區才用緩衝區,即SQL_CACHE.
  • sort_buffer_size:排序緩衝區

 

傳送門:更多引數

https://www.mysql.com/cn/why-mysql/performance/index.html

 

2.2.3 分庫分表

 

因為資料庫壓力過大,首先一個問題就是高峰期系統效能可能會降低,因為資料庫負載過高對效能會有影響。另外一個,壓力過大把你的資料庫給搞掛了怎麼辦?所以此時你必須得對系統做分庫分表 + 讀寫分離,也就是把一個庫拆分為多個庫,部署在多個資料庫服務上,這時作為主庫承載寫入請求。然後每個主庫都掛載至少一個從庫,由從庫來承載讀請求。

 

 

2.2.4 快取叢集

 

如果使用者量越來越大,此時你可以不停的加機器,比如說系統層面不停加機器,就可以承載更高的併發請求。然後資料庫層面如果寫入併發越來越高,就擴容加資料庫伺服器,透過分庫分表是可以支援擴容機器的,如果資料庫層面的讀併發越來越高,就擴容加更多的從庫。但是這裡有一個很大的問題:資料庫其實本身不是用來承載高併發請求的,所以通常來說,資料庫單機每秒承載的併發就在幾千的數量級,而且資料庫使用的機器都是比較高配置,比較昂貴的機器,成本很高。如果你就是簡單的不停的加機器,其實是不對的。所以在高併發架構裡通常都有快取這個環節,快取系統的設計就是為了承載高併發而生。所以單機承載的併發量都在每秒幾萬,甚至每秒數十萬,對高併發的承載能力比資料庫系統要高出一到兩個數量級。所以你完全可以根據系統的業務特性,對那種寫少讀多的請求,引入快取叢集。具體來說,就是在寫資料庫的時候同時寫一份資料到快取集群裡,然後用快取叢集來承載大部分的讀請求。這樣的話,透過快取叢集,就可以用更少的機器資源承載更高的併發。

 

 

結語

 

一個完整而複雜的高併發系統架構中,一定會包含:各種複雜的自研基礎架構系統。各種精妙的架構設計.因此一篇小文頂多具有拋磚引玉的效果,但是資料庫最佳化的思想差不多就這些了.

贊(0)

分享創造快樂