MySQL 數(shù)據(jù)表優(yōu)化設(shè)計（六）：常見的數(shù)據(jù)表設(shè)計誤區(qū)整理

雖然會有一些常規(guī)意義上的數(shù)據(jù)表錯誤設(shè)計和優(yōu)秀設(shè)計原則纵搁，但是同樣也會有 MySQL 特定的一些情況岳悟，這會導(dǎo)致我們犯一些 MySQL 特定的錯誤。本篇討論常見的設(shè)計誤區(qū)派桩。

誤區(qū)一：過多的數(shù)據(jù)列

MySQL 存儲引擎的 API 是按照行緩沖區(qū)方式從服務(wù)端和存儲引擎復(fù)制數(shù)據(jù)构诚。服務(wù)端將緩沖區(qū)數(shù)據(jù)解碼成數(shù)據(jù)列。然而铆惑，將行緩沖區(qū)的格式轉(zhuǎn)換為數(shù)據(jù)行數(shù)據(jù)結(jié)構(gòu)的列可能會代價很高范嘱。MyISAM 固定使用與服務(wù)端匹配的行格式，因此無需轉(zhuǎn)換员魏。然而丑蛤，MyISAM 的可變行格式以及 InnoDB 的行格式總是需要進行轉(zhuǎn)換。轉(zhuǎn)換的代價依賴于列的數(shù)量撕阎。如果當(dāng)數(shù)據(jù)表的列超過上百列的時候受裹，會引起很高的 CPU 資源消耗——即便是使用到的列很少。曾經(jīng)看過一篇文章虏束，指的是一個多語言的解決方案棉饶，直接簡單粗暴地將系統(tǒng)支持的語言用對應(yīng)的列表示脑慧，例如：

CREATE TABLE t_multi_language_news (
  id INT PRIMARY KEY,
  title_cn VARCHAR(32),
  title_en VARCHAR(32),
  title_it VARCHAR(32),
  ...
  content_cn VARVHAR(256),
  content_en VARCHAR(256),
  conntent_it VARCHAR(256),
);

這種方式隨著系統(tǒng)支持的語言越多，數(shù)據(jù)表的列越多砰盐，最終導(dǎo)致性能嚴(yán)重下降。如果你設(shè)計一個數(shù)據(jù)表的列數(shù)量超過100時坑律，就需要考慮你的設(shè)計是否合理了岩梳。
應(yīng)對方式：首先是考慮業(yè)務(wù)本身的設(shè)計是否合理，如果確實一個實體需要很多字段來描述晃择，那么可以拆分數(shù)據(jù)表冀值，通過擴展信息表來做。舉個例子宫屠，對于資訊類的數(shù)據(jù)表列疗，因為內(nèi)容一般占據(jù)的空間會比較大，但是在列表不會直接查看浪蹂，就可以拆成資訊主表和資訊詳情表抵栈，主表存儲標(biāo)題、時間坤次、摘要古劲、縮略圖附件 id 等列表要查看的信息即可。而資訊詳情可以存儲資訊的內(nèi)容缰猴、來源产艾、原文鏈接等信息。

誤區(qū)二：過多的聯(lián)合查詢

MySQL 一次聯(lián)合查詢最多只能61張表滑绒。而有些設(shè)計主張不做冗余字段設(shè)計闷堡，這會導(dǎo)致復(fù)雜業(yè)務(wù)時需要連接多張表查詢。即便是聯(lián)合的表數(shù)量低于61個疑故，也會引起性能的下降杠览，而且整個 SQL 語句的維護將變得十分困難。作為一個設(shè)計的首要原則焰扳，就是如果想追求速度的話倦零，一次查詢不要跨太多的數(shù)據(jù)表做聯(lián)合查詢，尤其面臨高并發(fā)場景的時候吨悍。
應(yīng)對方式：首先扫茅，對于確定不會改變的字段，可以考慮冗余字段的方式減少聯(lián)合查詢育瓜。例如葫隙，一家企業(yè)的所屬省份信息，就可以把省份代碼躏仇、省份名稱冗余了恋脚，而無需再通過省份代碼去查詢省份名稱腺办。其次，確實需要查其他表的情況下糟描，可以考慮使用分步查詢的方法怀喉，通過應(yīng)用程序完成數(shù)據(jù)的組裝，這種效率在數(shù)據(jù)表很多的時候會更高效船响，而且代碼也更好維護躬拢。
誤區(qū)三：萬能的枚舉
例如下面這種表設(shè)計：

CREATE TABLE t_countries (
  ...
  country ENUM('', '1', '2', ..., '45'),
  ...
);

這種方式本來可以通過一個以整數(shù)為 key的字典的查找表實現(xiàn)。如果是業(yè)務(wù)上增加了一個枚舉见间，意味著整個表都需要使用 ALTER TABLE更新聊闯。而如果是使用應(yīng)用代碼的查找表，只需要增加新的鍵值對就好了米诉。
應(yīng)對方式：如果枚舉確定不會變動（例如性別）菱蔬，那么沒問題。如果枚舉可能會增加史侣，那么盡可能地通過應(yīng)用程序來實現(xiàn)拴泌。

誤區(qū)三：濫用 SET替代 ENUM

枚舉ENUM 類型是數(shù)據(jù)表列的值只能是值集合中的一個，而 SET 類型是該列可以有一個或多個值惊橱。如果確定一個列只會有一個值弛针，那么就應(yīng)該優(yōu)先使用枚舉，而不是集合李皇。例如下面的例子就是典型的濫用：

CREATE TABLE t_payment_way (
  ...
  is_default SET('Y', 'N') NOT NULL DEFAULT 'N',
  ...
);

很顯然削茁，is_default 要么是 Y，要么是 N掉房，因此這里應(yīng)該使用 ENUM茧跋。
應(yīng)對方式：從業(yè)務(wù)層面考慮列的值是不是可能有多個，如果只有1個可選值那么就用枚舉ENUM卓囚。

誤區(qū)四：生硬地避免NULL

很多文章都討論過盡可能地避免使用 NULL瘾杭，對于大部分場景這是一個好的設(shè)計，我們可以通過0哪亿，空字符串粥烁，約定的值等來表示空值。然而蝇棉，不要因為這個而生硬套用讨阻，如果是這個值本身就是一個無意義的值的時候，那么使用 NULL 可能更合適篡殷。例如钝吮，如果要是有-1代表一個無意義的整數(shù)，可能會導(dǎo)致代碼很復(fù)雜，甚至可能引起 bug奇瘦。例如下面的例子：

CREATE TABLE t_person (
  birthday DATETIME NOT NULL DEFAULT '0000-00-00 00:00:00',
  ...,
);

將一個 DATETIME 類型的默認值設(shè)置為全部是0會很奇怪棘催，假設(shè)我們要統(tǒng)計人員的年齡平均值的時候，會引起莫名其妙的問題耳标，而這種場景使用 NULL 就不會納入到統(tǒng)計中來醇坝〈纹拢可以通過設(shè)置 MySQL 的 SQL_MODE 參數(shù)禁止使用無意義的日期纲仍，避免出現(xiàn)這種情況。
應(yīng)對方式：設(shè)計表的時候可以盡量使用 NOT NULL 避免空值贸毕，但是不要過于生硬，對于有些字段使用默認值無法表名意義或與實際不符時夜赵，也是可以選擇使用 NULL 列的明棍。只是，需要注意索引列不要使用NULL寇僧。而實際上摊腋，絕大部分索引列不太可能會是 NULL。

誤區(qū)五：使用整數(shù)替換時間戳

之前有講到過時間格式如何選擇的問題嘁傀，實際上有些開發(fā)者會使用整數(shù)來存儲時間戳兴蒸，他們的理由是這樣效率更高。從某種意義上來說细办，可能會提高一點效率橙凳，但是幫助不大，因為在 MySQL 內(nèi)部DATETIME 和 TIMESTAMP 本身就是用整數(shù)存儲的笑撞。而如果使用整數(shù)存儲時間的話岛啸，意味著應(yīng)用程序中需要做時間轉(zhuǎn)換，或者是 SQL 語句要對指定的字段進行時間轉(zhuǎn)換茴肥，帶來的收益可能得不償失坚踩。
應(yīng)對方式：盡可能地使用 DATETIME 存儲時間，如果需要存儲秒級精度一下的時間瓤狐，那么可以考慮使用 BIGINT 來存儲瞬铸。

誤區(qū)六：忘記字段的最大存儲范圍

在實際中設(shè)計表的時候會忘記數(shù)據(jù)類型的存儲范圍，比如使用 TINYINT(2)并不是只能存儲兩位整數(shù)础锐，實際TINYINT(2) 可以存儲的范圍是-128-127嗓节。存儲超過255的整數(shù)。這種錯誤在使用整數(shù)類型的時候很容易出現(xiàn)問題皆警，在插入整數(shù)的時候赦政，MySQL 不會檢查實際的整數(shù)位數(shù)，而是按對應(yīng)存儲字節(jié)數(shù)的范圍存入，這種情況假設(shè)不注意會存入無意義的值恢着。例如下面的 INSERT 操作會成功桐愉，而我們可能誤以為 TINYINT(2)只能存儲2位整數(shù)：

CREATE TABLE t_int_test (
    id INT PRIMARY KEY,
    number TINYINT(2)
);

INSERT INTO t_int_test (id, number) VALUES (3,123);

應(yīng)對方式：在應(yīng)用程序中做數(shù)據(jù)校驗。

結(jié)語：在實際設(shè)計數(shù)據(jù)表的過程中掰派，除了需要考慮每個字段的數(shù)據(jù)類型之外从诲，還需要考慮存儲空間大小。對于常用的一些字段靡羡，如時間系洛、標(biāo)題、備注等略步，最好是內(nèi)部形成一定的規(guī)范描扯，大家遵照規(guī)范執(zhí)行，并且增加校驗?zāi)軌虮苊夂芏鄦栴}趟薄。