MySQL 一千個不用 Null 的理由-知識星球

來源：xrzs 的部落格

my.oschina.net/leejun2005/blog/1342985

港真，Null 貌似在哪裡都是個頭疼的問題，比如 Java 裡讓人頭疼的 NullPointerException，為了避免猝不及防的空指標異常，千百年來程式猿們不得不在程式碼裡小心翼翼的各種 if 判斷，麻煩而又臃腫，為此 java8 引入了 Optional 來避免這一問題。

下麵咱們要聊的是 MySQL 裡的 null，在大量的 MySQL 最佳化文章和書籍裡都提到了欄位盡可能用NOT NULL，而不是NULL，除非特殊情況。但卻都只給結論不說明原因，猶如雞湯不給勺子一樣，讓不少初學者對這個結論半信半疑或者雲裡霧裡。本文今天就詳細的剖析下使用 Null 的原因，並給出一些不用 Null 的理由。

1、NULL 為什麼這麼多人用？

NULL是建立資料表時預設的，初級或不知情的或怕麻煩的程式員不會註意這點。
很多人員都以為not null 需要更多空間，其實這不是重點。
重點是很多程式員覺得NULL在開發中不用去判斷插入資料，寫sql陳述句的時候更方便快捷。

2、是不是以訛傳訛？

MySQL 官網檔案：

NULL columns require additional space in the rowto record whether their values are NULL. For MyISAM tables, each NULL columntakes one bit extra, rounded up to the nearest byte.

Mysql難以最佳化取用可空列查詢，它會使索引、索引統計和值更加複雜。可空列需要更多的儲存空間，還需要mysql內部進行特殊處理。可空列被索引後，每條記錄都需要一個額外的位元組，還能導致MYisam 中固定大小的索引變成可變大小的索引。

—— 出自《高效能mysql第二版》

照此分析，還真不是以訛傳訛，這是有理論依據和出處的。

3、給我一個不用 Null 的理由？

（1）所有使用NULL值的情況，都可以透過一個有意義的值的表示，這樣有利於程式碼的可讀性和可維護性，並能從約束上增強業務資料的規範性。

（2）NULL值到非NULL的更新無法做到原地更新，更容易發生索引分裂，從而影響效能。

註意：但把NULL列改為NOT NULL帶來的效能提示很小，除非確定它帶來了問題，否則不要把它當成優先的最佳化措施，最重要的是使用的列的型別的適當性。

（3）NULL值在timestamp型別下容易出問題，特別是沒有啟用引數explicit_defaults_for_timestamp

（4）NOT IN、!= 等負向條件查詢在有 NULL 值的情況下傳回永遠為空結果，查詢容易出錯

create table table_2 (

`id` INT (11) NOT NULL,

user_name varchar(20) NOT NULL

)

create table table_3 (

`id` INT (11) NOT NULL,

user_name varchar(20)

)

insert into table_2 values (4,”zhaoliu_2_1″),(2,”lisi_2_1″),(3,”wangmazi_2_1″),(1,”zhangsan_2″),(2,”lisi_2_2″),(4,”zhaoliu_2_2″),(3,”wangmazi_2_2″)

insert into table_3 values (1,”zhaoliu_2_1″),(2, null)

— 1、NOT IN子查詢在有NULL值的情況下傳回永遠為空結果，查詢容易出錯

select user_name from table_2 where user_name not in (select user_name from table_3 where id!=1)

mysql root@10.48.186.32:t_test_zz5431> select user_name from table_2 where user_name not

-> in (select user_name from table_3 where id!=1);

+————-+

| user_name |

|————-|

+————-+

0 rows in set

Time: 0.008s

mysql root@10.48.186.32:t_test_zz5431>

— 2、單列索引不存null值，複合索引不存全為null的值，如果列允許為null，可能會得到“不符合預期”的結果集

— 如果name允許為null，索引不儲存null值，結果集中不會包含這些記錄。所以，請使用not null約束以及預設值。

select * from table_3 where name != ‘zhaoliu_2_1’

— 3、如果在兩個欄位進行拼接：比如題號+分數，首先要各欄位進行非null判斷，否則只要任意一個欄位為空都會造成拼接的結果為null。

select CONCAT(“1”,null) from dual; — 執行結果為null。

— 4、如果有 Null column 存在的情況下，count(Null column)需要格外註意，null 值不會參與統計。

mysql root@10.48.186.32:t_test_zz5431> select * from table_3;

+——+————-+

| id | user_name |

|——+————-|

| 1 | zhaoliu_2_1 |

| 2 | |

| 21 | zhaoliu_2_1 |

| 22 | |

+——+————-+

4 rows in set

Time: 0.007s

mysql root@10.48.186.32:t_test_zz5431> select count(user_name) from table_3;

+——————–+

| count(user_name) |

|——————–|

| 2 |

+——————–+

1 row in set

Time: 0.007s

— 5、註意 Null 欄位的判斷方式， = null 將會得到錯誤的結果。

mysql root@localhost:cygwin> create index IDX_test on table_3 (user_name);

Query OK, 0 rows affected

Time: 0.040s

mysql root@localhost:cygwin> select * from table_3 where user_name is nullG

***************************[ 1. row ]***************************

id | 2

user_name | None

1 row in set

Time: 0.002s

mysql root@localhost:cygwin> select * from table_3 where user_name = nullG

0 rows in set

Time: 0.002s

mysql root@localhost:cygwin> desc select * from table_3 where user_name = ‘zhaoliu_2_1’G

***************************[ 1. row ]***************************

id | 1

select_type | SIMPLE

table | table_3

type | ref

possible_keys | IDX_test

key | IDX_test

key_len | 23

ref | const

rows | 1

Extra | Using where

1 row in set

Time: 0.006s

mysql root@localhost:cygwin> desc select * from table_3 where user_name = nullG

***************************[ 1. row ]***************************

id | 1

select_type | SIMPLE

table | None

type | None

possible_keys | None

key | None

key_len | None

ref | None

rows | None

Extra | Impossible WHERE noticed after reading const tables

1 row in set

Time: 0.002s

mysql root@localhost:cygwin> desc select * from table_3 where user_name is nullG

***************************[ 1. row ]***************************

id | 1

select_type | SIMPLE

table | table_3

type | ref

possible_keys | IDX_test

key | IDX_test

key_len | 23

ref | const

rows | 1

Extra | Using where

1 row in set

Time: 0.002s

mysql root@localhost:cygwin>

（5）Null 列需要更多的儲存空間：需要一個額外位元組作為判斷是否為 NULL 的標誌位

alter table table_3 add index idx_user_name (user_name);

alter table table_2 add index idx_user_name (user_name);

explain select * from table_2 where user_name=’zhaoliu_2_1′;

explain select * from table_3 where user_name=’zhaoliu_2_1′;

180039_y6ZM_568818

可以看到同樣的 varchar(20) 長度，table_2 要比 table_3 索引長度大，這是因為：

兩張表的字符集不一樣，且欄位一個為 NULL 一個非 NULL。

180509_Siab_568818

key_len 的計算規則和三個因素有關：資料型別、字元編碼、是否為 NULL

key_len 62 == 20*3（utf8 3位元組） + 2 （儲存 varchar 變長字元長度 2位元組，定長欄位無需額外的位元組）

key_len 83 == 20*4（utf8mb4 4位元組） + 1 (是否為 Null 的標識) + 2 （儲存 varchar 變長字元長度 2位元組，定長欄位無需額外的位元組）

所以說索引欄位最好不要為NULL，因為NULL會使索引、索引統計和值更加複雜，並且需要額外一個位元組的儲存空間。基於以上這些理由和原因，我想咱們不用 Null 的理由應該是夠了。

Refer：

[1] 為什麼每個開發哥哥都喜歡用NULL值？

http://bit.ly/2u3GKZI

[2] 最佳化 SQL 查詢：如何寫出高效能SQL陳述句

[3] 或許你不知道的10條SQL技巧

https://mp.weixin.qq.com/s/dGcgts4NNTmVQNRT-j2MZw

●本文編號113，以後想閱讀這篇文章直接輸入113即可

●輸入m獲取到文章目錄

推薦↓↓↓

資料庫開發

更多推薦《18個技術類公眾微信》

涵蓋：程式人生、演演算法與資料結構、駭客技術與網路安全、大資料技術、前端開發、Java、Python、Web開發、安卓開發、iOS開發、C/C++、.NET、Linux、資料庫、運維等。

贊賞

長按二維碼向我轉賬

受蘋果公司新規定影響，微信 iOS 版的贊賞功能被關閉，可透過二維碼轉賬支援公眾號。

閱讀原文

即將開啟”“小程式

取消
 開啟

MySQL 一千個不用 Null 的理由

相關推薦

熱門標籤

熱門文章

分享創造快樂