從SQL Server到MySql(2) : MySql 數(shù)據(jù)類型與優(yōu)化

1. 優(yōu)化數(shù)據(jù)結(jié)構(gòu)

  • 盡量避免null.
    • 可為NULL的列使索引,索引統(tǒng)計和值比較都更加復(fù)雜.
    • 它需要更多的存儲空間, 在MySql 里需要特殊的處理.
    • 索引可為NULL的列時,每個索引記錄需要一個額外的字節(jié). (InnoDB使用單獨的bit來存儲NULL值,會稍微好點).
  • 更小的通常更好. 它們占用更少的磁盤,內(nèi)存和緩存, 處理時需要的CPU 周期也更少.
  • 簡單就好. 簡單類型的操作需要更少的CPU周期.
  • 兩步進行數(shù)據(jù)類型的選擇:
    • 確定合適的大類型: 數(shù)字,字符串,時間等.
    • 根據(jù)存儲的長度和范圍, 允許的精度, 需要的物理空間 來選擇具體的類型.

2. 整數(shù)類型

2.1 整數(shù)類型

  • 不同的具體類型(包含無符號數(shù))決定的是如何在內(nèi)存和磁盤中保存數(shù)據(jù),并不影響性能,整數(shù)計算都使用64位的BIGINT.
  • 整型的寬度,例如INT(11)中的11, 只是規(guī)定了某些交互工具中, 用來顯式字符的個數(shù), 并不影響存儲和值范圍.

2.2 實數(shù)類型

  • 使用DOUBLE作為內(nèi)部浮點類型的計算類型.
  • Decimal需要額外的空間和計算開銷. 僅在需要對小數(shù)進行精確計算時才使用. 當(dāng)數(shù)據(jù)量大時可使用BIGINT替代.

3. 字符串類型

  • VARChar 需要額外的1或2個字節(jié)(根據(jù)最大長度的大小)記錄長度.
    • 比定長類型更節(jié)省空間, 因為僅使用必要的空間.
    • 若表使用Row_Format = Fixed 創(chuàng)建時,每一行都使用定長存儲,會浪費空間.
    • Update 時若造成行更長, 可能會導(dǎo)致碎片.
    • 適用場景: 字符串列的最大長度比平均長度大很多. 列更新少(不易產(chǎn)生碎片). 采用的字符集中每個字符都使用不同的字節(jié)數(shù)進行存儲.
  • CHAR 適合較短的字符串, 或所有值都接近一個長度.
  • Binary,VarBinary 在需要存儲二進制數(shù)據(jù)時, 其比較是按字節(jié)逐次比較,更加簡單高效.
  • Blob和Text 用于存儲很大的字符串.
    • 其值會被當(dāng)成獨立的對象處理. 當(dāng)值很大時,會使用外部空間存儲,內(nèi)部存儲指針.
    • 其列排序只對最前max_sort_length字節(jié)而非整個字節(jié)排序.
    • 不能對列全部長度的字符串進行索引.
    • Memory?引擎不支持Blob和Text. 若查詢使用了他們, 會造成磁盤臨時表的使用.
    • 應(yīng)避免使用它們. 如使用Substring將列值轉(zhuǎn)換為字符串.

4. 枚舉

  • 有時可以使用枚舉類代替常用的字符串類型.
  • 問題: 列表是固定的,添加或刪除必須使用alter table. 對于未來會變更的情況,盡量不使用,除非只在末尾添加元素.
  • 存儲枚舉時非常緊湊, 會根據(jù)列表值的數(shù)量壓縮到1/2字節(jié)中. 在內(nèi)部將值在列表中的位置保存為整數(shù). 并在.frm文件中保存'數(shù)字-字符串'映射關(guān)系的查找表.
  • 盡量避免使用數(shù)字作為枚舉常量, 這樣會有雙重性.
  • 按照內(nèi)部存儲的整數(shù)而不是定義的字符串的值進行排序的(也就是定義值時的順序).

5. 日期和時間類型

  • TimeStamp 保存了從1970 年以來的秒數(shù).
    • 只使用4個字節(jié)存儲,所以只能到2038 年.
    • 等同于UNIX時間戳.
      • from_unixtime()/unix_timestamp()進行日期和Unix時間戳的轉(zhuǎn)換.
    • 顯示值依賴于時區(qū).
    • TimeStamp 列默認為Not Null.
    • 其空間效率更高,所以應(yīng)盡量使用TimeStamp.
  • DateTime
    • 可保存從1001到9999 年, 精度為秒.
    • 將時間和日期封裝到格式為YYYYMMDDHHMMSS 的整數(shù)中,與時區(qū)無關(guān).
    • 使用8個字節(jié)存儲.

6. 位數(shù)據(jù)類型

  • BIT
    • 被當(dāng)做字符串類型,而不是數(shù)字類型.
    • 檢索出的結(jié)果是包含0和1的字串.
    • 但在數(shù)字上下文中得到的是字串對應(yīng)的數(shù)字值. 所以會產(chǎn)生二義性.
  • SET
    • 若需要保存很多true/false 值, 可以合并這些列到一個SET中.
      • 如ACL: SET('CAN_READ', 'CAN_WRITE', 'CAN_DELETE').
    • 內(nèi)部以一系列打包的位的集合來表示,從而有效地利用了存儲空間.
    • 問題是改變列定義(交換可讀和可寫的位置)?時的代價較大, 且無法在SET列上通過索引查找.
  • 在整數(shù)列上進行按位操作.
    • 一種替代SET的方式是使用一個整數(shù)包裝一系列的位. 如把8個位包裝到一個TINYINT中,并按位操作來使用.
    • 好處是可以不適用Alter Table 改變字段代表的"枚舉"值.
    • 缺點是查詢語句更難寫, 并且難以理解.

7. Schema 的設(shè)計陷阱

  • 太大的列.
    • 存儲引擎API需要在服務(wù)器層和存儲引擎層通過緩存格式拷貝數(shù)據(jù), 然后在服務(wù)器層將緩存內(nèi)容解碼成各個列. 從行緩存中將編碼過的列轉(zhuǎn)換成行數(shù)據(jù)結(jié)構(gòu)的代碼很高.
    • 定長行結(jié)構(gòu)與服務(wù)器層的行結(jié)構(gòu)正好匹配, 所以不需要轉(zhuǎn)換. 而變長結(jié)構(gòu)總是需要昂貴的轉(zhuǎn)換.
  • 太多的關(guān)聯(lián)
    • 所謂的"實體-屬性-值(EVA)"是一種糟糕的設(shè)計模式. 它需要過多的自關(guān)聯(lián).
  • 全能的枚舉
    • 類似enum('','0','1',....'31'). 會造成新增值時的alter table.
    • 應(yīng)該使用整數(shù)作為外鍵關(guān)聯(lián)到字典表或查找表來查找具體值.
  • 多數(shù)情況下,應(yīng)該避免使用NULL值,而使用替代(0,特殊值). 但不要極端.
    • MySql會在索引中存儲NULL值.
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌只锭,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,640評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件灌侣,死亡現(xiàn)場離奇詭異褥傍,居然都是意外死亡,警方通過查閱死者的電腦和手機宋雏,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,254評論 3 395
  • 文/潘曉璐 我一進店門芜飘,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人好芭,你說我怎么就攤上這事燃箭〕迥兀” “怎么了舍败?”我有些...
    開封第一講書人閱讀 165,011評論 0 355
  • 文/不壞的土叔 我叫張陵,是天一觀的道長敬拓。 經(jīng)常有香客問我邻薯,道長,這世上最難降的妖魔是什么乘凸? 我笑而不...
    開封第一講書人閱讀 58,755評論 1 294
  • 正文 為了忘掉前任厕诡,我火速辦了婚禮,結(jié)果婚禮上营勤,老公的妹妹穿的比我還像新娘灵嫌。我一直安慰自己壹罚,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,774評論 6 392
  • 文/花漫 我一把揭開白布寿羞。 她就那樣靜靜地躺著猖凛,像睡著了一般。 火紅的嫁衣襯著肌膚如雪绪穆。 梳的紋絲不亂的頭發(fā)上辨泳,一...
    開封第一講書人閱讀 51,610評論 1 305
  • 那天,我揣著相機與錄音玖院,去河邊找鬼菠红。 笑死,一個胖子當(dāng)著我的面吹牛难菌,可吹牛的內(nèi)容都是我干的试溯。 我是一名探鬼主播,決...
    沈念sama閱讀 40,352評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼郊酒,長吁一口氣:“原來是場噩夢啊……” “哼耍共!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起猎塞,我...
    開封第一講書人閱讀 39,257評論 0 276
  • 序言:老撾萬榮一對情侶失蹤试读,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后荠耽,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體钩骇,經(jīng)...
    沈念sama閱讀 45,717評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,894評論 3 336
  • 正文 我和宋清朗相戀三年铝量,在試婚紗的時候發(fā)現(xiàn)自己被綠了倘屹。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,021評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡慢叨,死狀恐怖纽匙,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情拍谐,我是刑警寧澤烛缔,帶...
    沈念sama閱讀 35,735評論 5 346
  • 正文 年R本政府宣布螟深,位于F島的核電站拣帽,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏痰驱。R本人自食惡果不足惜亡蓉,卻給世界環(huán)境...
    茶點故事閱讀 41,354評論 3 330
  • 文/蒙蒙 一晕翠、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧砍濒,春花似錦淋肾、人聲如沸硫麻。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,936評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽庶香。三九已至,卻和暖如春简识,著一層夾襖步出監(jiān)牢的瞬間赶掖,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,054評論 1 270
  • 我被黑心中介騙來泰國打工七扰, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留奢赂,地道東北人。 一個月前我還...
    沈念sama閱讀 48,224評論 3 371
  • 正文 我出身青樓颈走,卻偏偏與公主長得像膳灶,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子立由,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,974評論 2 355

推薦閱讀更多精彩內(nèi)容