重點(diǎn)結(jié)論:司內(nèi)建表 字符集?CHARSET=utf8mb4撇叁,排序規(guī)則 COLLATE=utf8mb4_bin
前言
????????近期由于項(xiàng)目迭代供鸠,做了一些新建數(shù)據(jù)模型的表的操作,發(fā)現(xiàn)在測試環(huán)境的MySQL數(shù)據(jù)庫中陨闹,建表規(guī)范形態(tài)各異回季,也去參看了下司內(nèi)DBA的規(guī)范家制,一些規(guī)范還是有的,只是各團(tuán)隊(duì)執(zhí)行情況各異泡一,由此引入一些不必要的問題颤殴,本篇單對字符集、排序規(guī)則做下探究鼻忠。
司內(nèi)MySQL建表規(guī)范中關(guān)于字符集的內(nèi)容:
使用字符集utf8/utf8mb4
非特殊情況涵但,不允許指定與庫不一致的編碼規(guī)則與排序規(guī)則
深究一下
之前在這個(gè)地方確實(shí)沒深究過,團(tuán)隊(duì)比較成熟的情況帖蔓,大家各自按建表規(guī)范來就好了矮瘟,但是在交叉型項(xiàng)目,這些問題會(huì)比較凸顯塑娇。
那么utf8和utf8mb4的區(qū)別是什么澈侠?
參考官方文檔:
utf8是utf8mb3的別名,MySQL 8.0以后的版本標(biāo)記為deprecated埋酬,那么當(dāng)前比較utf8mb3和utf8mb4就OK了:
那么除了字符集哨啃,建表還需要制定排序規(guī)則Collations,此處我們只討論utf8mb4下的排序規(guī)則:
mysql>SELECT COLLATION_NAME, PAD_ATTRIBUTE FROM INFORMATION_SCHEMA.COLLATIONS WHERE CHARACTER_SET_NAME = 'utf8mb4';
utf8mb4_general_ci写妥、utf8mb4_unicode_ci和utf8mb4_bin 的區(qū)別是什么拳球?
比較:
utf8mb4_general_ci: 不區(qū)分大小寫,ci?是 case insensitive, 即 "大小寫不敏感", a 和 A 會(huì)在字符判斷中會(huì)被當(dāng)做一樣的珍特;
utf8mb4_unicode_ci: 校對規(guī)則僅部分支持Unicode校對規(guī)則算法,一些字符還是不能支持祝峻;utf8mb4_unicode_ci不能完全支持組合的記號;
utf8mb4_bin: 將字符串每個(gè)字符串用二進(jìn)制數(shù)據(jù)編譯存儲(chǔ)扎筒,區(qū)分大小寫莱找,而且可以存二進(jìn)制的內(nèi)容,bin?是二進(jìn)制, a 和 A 會(huì)別區(qū)別對待嗜桌。
使用的注意:
對于一種語言僅當(dāng)使用utf8mb4_unicode_ci排序做的不好時(shí)奥溺,才執(zhí)行與具體語言相關(guān)的utf8mb4字符集校對規(guī)則。例如症脂,對于德語和法語谚赎,utf8mb4_unicode_ci工作的很好淫僻,因此不再需要為這兩種語言創(chuàng)建特殊的utf8mb4校對規(guī)則诱篷。
utf8mb4_general_ci?也適用德語、法語或者俄語雳灵,但會(huì)有不準(zhǔn)棕所。如果你的應(yīng)用能夠接受這些,那么應(yīng)該使用 utf8mb4_general_ci悯辙,因?yàn)樗俣瓤炝帐 7駝t迎吵,使用utf8mb4_unicode_ci,因?yàn)樗容^準(zhǔn)確针贬。
NO PAD 和 PAD SPACE的區(qū)別击费?
最后看個(gè)官方示例:
NO PAD(處理)
如果字符后面有空格,那就把空格當(dāng)作一個(gè)字符處理桦他。也就是在對比的時(shí)候不會(huì)忽視空格的存在蔫巩。
PAD SPACE(忽略)
表示如果字符后面有空格,可以忽略空格來比較快压。也就是空格可有可無圆仔。
參考官方文檔:https://dev.mysql.com/doc/refman/8.0/en/charset.html