一呕寝、建表規(guī)約
1.【強制】表達是與否概念的字段,必須使用 is_xxx 的方式命名婴梧,數(shù)據(jù)類型是 unsigned tinyint
(1 表示是壁涎,0 表示否)。
說明:任何字段如果為非負數(shù)志秃,必須是 unsigned怔球。
注意:POJO 類中的任何布爾類型的變量,都不要加 is 前綴浮还,所以竟坛,需要在<resultMap>設置從 is_xxx 到
Xxx 的映射關系。數(shù)據(jù)庫表示是與否的值钧舌,使用 tinyint 類型担汤,堅持 is_xxx 的命名方式是為了明確其取值含
義與取值范圍。
正例:表達邏輯刪除的字段名 is_deleted洼冻,1 表示刪除崭歧,0 表示未刪除。
2撞牢、【強制】表名率碾、字段名必須使用小寫字母或數(shù)字叔营,禁止出現(xiàn)數(shù)字開頭,禁止兩個下劃線中間只
出現(xiàn)數(shù)字所宰。數(shù)據(jù)庫字段名的修改代價很大绒尊,因為無法進行預發(fā)布,所以字段名稱需要慎重考慮仔粥。
說明:MySQL 在 Windows 下不區(qū)分大小寫婴谱,但在 Linux 下默認是區(qū)分大小寫。因此躯泰,數(shù)據(jù)庫名谭羔、表名、
字段名麦向,都不允許出現(xiàn)任何大寫字母口糕,避免節(jié)外生枝。
正例:aliyun_admin磕蛇,rdc_config景描,level3_name
反例:AliyunAdmin,rdcConfig秀撇,level_3_name
3.【強制】表名不使用復數(shù)名詞超棺。
說明:表名應該僅僅表示表里面的實體內(nèi)容,不應該表示實體數(shù)量呵燕,對應于 DO 類名也是單數(shù)形式棠绘,符合
表達習慣。
4.【強制】禁用保留字再扭,如 desc氧苍、range、match泛范、delayed 等让虐,請參考 MySQL 官方保留字。
5.【強制】主鍵索引名為 pk_字段名罢荡;唯一索引名為 uk_字段名赡突;普通索引名則為 idx_字段名。
說明:pk_ 即 primary key区赵;uk_ 即 unique key惭缰;idx_ 即 index 的簡稱。
6.【強制】小數(shù)類型為 decimal笼才,禁止使用 float 和 double漱受。
說明:在存儲的時候,float 和 double 都存在精度損失的問題骡送,很可能在比較值的時候昂羡,得到不正確的
結(jié)果絮记。如果存儲的數(shù)據(jù)范圍超過 decimal 的范圍,建議將數(shù)據(jù)拆成整數(shù)和小數(shù)并分開存儲紧憾。
7.【強制】如果存儲的字符串長度幾乎相等到千,使用 char 定長字符串類型昌渤。
8.【強制】varchar 是可變長字符串赴穗,不預先分配存儲空間,長度不要超過 5000膀息,如果存儲長度
大于此值般眉,定義字段類型為 text,獨立出來一張表潜支,用主鍵來對應甸赃,避免影響其它字段索引效
率。
9.【強制】表必備三字段:id, create_time, update_time冗酿。
說明:其中 id 必為主鍵埠对,類型為 bigint unsigned、單表時自增裁替、步長為 1项玛。create_time, update_time
的類型均為 datetime 類型,前者現(xiàn)在時表示主動式創(chuàng)建弱判,后者過去分詞表示被動式更新襟沮。Java 開發(fā)手冊
37/57
10.【強制】所有的字段定義為NOT NULL,字段必須要設置默認值昌腰,為后期字段加索引做準備开伏,默認值為對應數(shù)據(jù)類型的值
說明:比如int默認0,string遭商,默認'',即空字符串固灵,時間默認為1900-01-01 00:00:00 ,其中update_time推薦如下定義劫流,方便后期更新時不用再次維護怎虫,
update_time
datetime NOT NULL DEFAULT '1900-01-01 00:00:00' ON UPDATE CURRENT_TIMESTAMP COMMENT '最后一次更新時間'
11.【強制】所有字段不能使用枚舉類型,后期不方便擴展困介,推薦使用int相關類型
12.【強制】因國際化需要大审,所有的字符存儲與表示,均采用 utf8 字符集座哩,那么字符計數(shù)方法需
要注意徒扶。
說明:
SELECT LENGTH("輕松工作"); 返回為 12
SELECT CHARACTER_LENGTH("輕松工作")根穷; 返回為 4
如果需要存儲表情姜骡,那么選擇 utf8mb4 來進行存儲导坟,注意它與 utf8 編碼的區(qū)別。
13.【推薦】表的命名最好是遵循“業(yè)務名稱_表的作用”圈澈。
正例:alipay_task / force_project / trade_config
14.【推薦】庫名與應用名稱盡量一致惫周。
15.【推薦】如果修改字段含義或?qū)ψ侄伪硎镜臓顟B(tài)追加時,需要及時更新字段注釋康栈。
16.【推薦】字段允許適當冗余递递,以提高查詢性能,但必須考慮數(shù)據(jù)一致啥么。冗余字段應遵循:
1) 不是頻繁修改的字段登舞。
2) 不是唯一索引的字段。
3) 不是 varchar 超長字段悬荣,更不能是 text 字段菠秒。
正例:各業(yè)務線經(jīng)常冗余存儲商品名稱,避免查詢時需要調(diào)用 IC 服務獲取氯迂。
17.【推薦】單表行數(shù)超過 500 萬行或者單表容量超過 2GB践叠,才推薦進行分庫分表。
說明:如果預計三年后的數(shù)據(jù)量根本達不到這個級別嚼蚀,請不要在創(chuàng)建表時就分庫分表禁灼。
18.【推薦】所有表和字段都要添加注釋COMMENT,從一開始就進行數(shù)據(jù)字典的維護
19.【參考】合適的字符存儲長度驰坊,不但節(jié)約數(shù)據(jù)庫表空間匾二、節(jié)約索引存儲,更重要的是提升檢索
速度拳芙。
二察藐、索引規(guī)約
1.【強制】業(yè)務上具有唯一特性的字段,即使是組合字段舟扎,也必須建成唯一索引分飞。
說明:不要以為唯一索引影響了 insert 速度,這個速度損耗可以忽略睹限,但提高查找速度是明顯的譬猫;另外,
即使在應用層做了非常完善的校驗控制羡疗,只要沒有唯一索引染服,根據(jù)墨菲定律,必然有臟數(shù)據(jù)產(chǎn)生叨恨。
2.【強制】超過三個表禁止 join柳刮。需要 join 的字段,數(shù)據(jù)類型保持絕對一致;多表關聯(lián)查詢時秉颗,
保證被關聯(lián)的字段需要有索引痢毒。大表禁止使用關聯(lián)查詢,具體多大算大表蚕甥,沒找到經(jīng)驗值哪替。
說明:即使雙表 join 也要注意表索引、SQL 性能菇怀。
3.【強制】在 varchar 字段上建立索引時凭舶,必須指定索引長度,沒必要對全字段建立索引敏释,根據(jù)
實際文本區(qū)分度決定索引長度库快。Java 開發(fā)手冊
38/57
說明:索引的長度與區(qū)分度是一對矛盾體摸袁,一般對字符串類型數(shù)據(jù)钥顽,長度為 20 的索引,區(qū)分度會高達 90%
以上靠汁,可以使用 count(distinct left(列名, 索引長度))/count(*)的區(qū)分度來確定蜂大。
4.【強制】頁面搜索嚴禁左模糊或者全模糊,如果需要請走搜索引擎來解決蝶怔。
說明:索引文件具有 B-Tree 的最左前綴匹配特性奶浦,如果左邊的值未確定,那么無法使用此索引踢星。
5.【推薦】如果有 order by 的場景澳叉,請注意利用索引的有序性。order by 最后的字段是組合索
引的一部分沐悦,并且放在索引組合順序的最后成洗,避免出現(xiàn) file_sort 的情況,影響查詢性能藏否。
正例:where a=? and b=? order by c; 索引:a_b_c
反例:索引如果存在范圍查詢瓶殃,那么索引有序性無法利用,如:WHERE a>10 ORDER BY b; 索引 a_b 無
法排序副签。
6.【推薦】大表分頁查詢時遥椿,推薦使用limit ,不推薦offset
說明:MySQL 并不是跳過 offset 行淆储,而是取 offset+N 行冠场,然后返回放棄前 offset 行,返回 N 行本砰,那當
offset 特別大的時候碴裙,效率就非常的低下,要么控制返回的總頁數(shù),要么對超過特定閾值的頁數(shù)進行 SQL
改寫青团。
三譬巫、SQL 語句
1.【強制】不要使用 count(列名)或 count(常量)來替代 count(),count()是 SQL92 定義的標
準統(tǒng)計行數(shù)的語法督笆,跟數(shù)據(jù)庫無關芦昔,跟 NULL 和非 NULL 無關。
說明:count(*)會統(tǒng)計值為 NULL 的行娃肿,而 count(列名)不會統(tǒng)計此列為 NULL 值的行咕缎。
2.【強制】count(distinct col) 計算該列除 NULL 之外的不重復行數(shù),注意 count(distinct col1,
col2) 如果其中一列全為 NULL料扰,那么即使另一列有不同的值凭豪,也返回為 0。
3.【強制】當某一列的值全是 NULL 時晒杈,count(col)的返回結(jié)果為 0嫂伞,但 sum(col)的返回結(jié)果為
NULL,因此使用 sum()時需注意 NPE 問題拯钻。
正例:可以使用如下方式來避免 sum 的 NPE 問題:SELECT IFNULL(SUM(column), 0) FROM table;
4.【強制】使用 ISNULL()來判斷是否為 NULL 值帖努。
說明:NULL 與任何值的直接比較都為 NULL。
1) NULL<>NULL 的返回結(jié)果是 NULL粪般,而不是 false拼余。
2) NULL=NULL 的返回結(jié)果是 NULL,而不是 true亩歹。
3) NULL<>1 的返回結(jié)果是 NULL匙监,而不是 true。
反例:在 SQL 語句中小作,如果在 null 前換行亭姥,影響可讀性。select * from table where column1 is null and
column3 is not null; 而ISNULL(column)
是一個整體躲惰,簡潔易懂致份。從性能數(shù)據(jù)上分析,ISNULL(column)
執(zhí)行效率更快一些础拨。
5.【強制】不得使用外鍵與級聯(lián)氮块,一切外鍵概念必須在應用層解決。
說明:(概念解釋)學生表中的 student_id 是主鍵诡宗,那么成績表中的 student_id 則為外鍵滔蝉。如果更新學
生表中的 student_id,同時觸發(fā)成績表中的 student_id 更新塔沃,即為級聯(lián)更新蝠引。外鍵與級聯(lián)更新適用于單機
低并發(fā),不適合分布式、高并發(fā)集群螃概;級聯(lián)更新是強阻塞矫夯,存在數(shù)據(jù)庫更新風暴的風險;外鍵影響數(shù)據(jù)庫
的插入速度吊洼。
6.【強制】禁止使用存儲過程训貌,存儲過程難以調(diào)試和擴展,更沒有移植性冒窍。
7.【強制】數(shù)據(jù)訂正(特別是刪除或修改記錄操作)時递沪,要先 select,避免出現(xiàn)誤刪除综液,確認無
誤才能執(zhí)行更新語句款慨。Java 開發(fā)手冊
40/57
-
【強制】對于數(shù)據(jù)庫中表記錄的查詢和變更,只要涉及多個表谬莹,都需要在列名前加表的別名(或
表名)進行限定檩奠。
說明:對多表進行查詢記錄、更新記錄届良、刪除記錄時笆凌,如果對操作列沒有限定表的別名(或表名)圣猎,并且
操作列在多個表中存在時士葫,就會拋異常。
正例:select t1.name from table_first as t1 , table_second as t2 where t1.id=t2.id;
反例:在某業(yè)務中送悔,由于多表關聯(lián)查詢語句沒有加表的別名(或表名)的限制慢显,正常運行兩年后,最近在
某個表中增加一個同名字段欠啤,在預發(fā)布環(huán)境做數(shù)據(jù)庫變更后荚藻,線上查詢語句出現(xiàn)出 1052 異常:Column
'name' in field list is ambiguous。
9.【強制】禁止select * 查詢洁段,禁止sql中使用復雜的函數(shù)
說明:消耗更多的cpu和io及網(wǎng)絡帶寬資源应狱,無法使用覆蓋索引
10.【推薦】SQL 語句中表的別名前加 as,并且以 t1祠丝、t2疾呻、t3、...的順序依次命名写半。
說明:1)別名可以是表的簡稱岸蜗,或者是根據(jù)表出現(xiàn)的順序,以 t1叠蝇、t2璃岳、t3 的方式命名。2)別名前加 as
使別名更容易識別。
正例:select t1.name from table_first as t1, table_second as t2 where t1.id=t2.id;
11.【推薦】in 操作能避免則避免铃慷,若實在避免不了单芜,需要仔細評估 in 后邊的集合元素數(shù)量,控
制在 1000 個之內(nèi)犁柜。