?varchar類型的長度怎么確定?有什么樣的原則吟税,和Text和LongText的區(qū)別是什么凹耙?
1.知識背景
什么是VARCHAR、Text肠仪、LongText使兔?
它們都是MySQL數(shù)據(jù)庫的字符串類型,用來存儲字符數(shù)據(jù)藤韵。區(qū)別是存儲的數(shù)據(jù)長度、大小不一樣熊经。我們可以根據(jù)需求選擇使用哪種字符串類型泽艘。
2.知識剖析
首先介紹下字節(jié)和字符
字節(jié)的定義:字節(jié)(byte)是一種計量單位,8個二進(jìn)制位為一個字節(jié).表示數(shù)據(jù)量多少镐依,它是計算機(jī)信息技術(shù)用于計量存儲容量的一種計量單位匹涮。
字符的定義:字符是指計算機(jī)中使用的文字和符號,如:1槐壳、2然低、3、A、B雳攘、C带兜、!吨灭、#刚照、¥、.....喧兄、+无畔、——等這些符號。
在UTF8編碼中吠冤,一個英文字符占用一個字節(jié)浑彰,一個中文字符占用三個字節(jié)。
VARCHAR是可以保存長度可變的字符串拯辙。如:一個用戶名字段不能確定長度郭变,只知道不超過10個字符,就可以選擇varchar類型薄风。而另一種CHAR類型是只能保存長度固定的字符饵较。如:六位的郵編、股票代碼遭赂。
需要注意的是:
mysql數(shù)據(jù)庫的varcahr類型在4.1以下版本中最大長度限制為255字節(jié)
mysql5.0以上的版本中varchar數(shù)據(jù)類型的長度支持到了65535字節(jié)循诉。
Text和LongText 也是長度可變的類型
Text的最大長度是可以存儲 65535 (2^16 – 1) 個字符
LongText的最大長度是可以存儲4294967295 (2^32 – 1) 個字符。
3.常見問題
1.定義varchar字段時撇他,可不可以短的定義成varchar(20),長的定義成varchar(50),超長另算?
2.什么時候使用char,varchar,text
4.解決方案
1.根據(jù)需求與實(shí)際情況來考慮茄猫,不能千篇一律。 比如:用戶名困肩,誰的名字會有255/3=85個字符划纽?所以也沒必要那么長,但又不能定義成CHAR()锌畸,所以給個夠用的長度varchar(20)或更少varchar(10)即可勇劣,考慮少數(shù)民族可以長點(diǎn)。 varchar的長度潭枣,最好是在夠用(需要適當(dāng)預(yù)測未來需求)且方便管理的前提下盡可能短比默。
2詳見:
http://blog.csdn.net/ww122081351/article/details/18221013
5.擴(kuò)展思考
如果把字符串字段都設(shè)置成varchar(255)會怎樣?
1.MySQL建立索引時如果沒有限制索引的大小盆犁,索引長度會默認(rèn)采用的該字段的長度命咐,也就是說varchar(20)和varchar(255)對應(yīng)的索引長度分別為20*3(utf-8)(+2+1),255*3(utf-8)(+2+1),其中"+2"用來存儲長度信息谐岁,“+1”用來標(biāo)記是否為空醋奠,加載索引信息時用varchar(255)類型會占用更多的內(nèi)存榛臼;(備注:當(dāng)字段定義為非空的時候,是否為空的標(biāo)記將不占用字節(jié))
2.varchar(20)與varchar(255)都是保持可變的字符串窜司,當(dāng)使用ROW_FORMAT=FIXED(表中不存在可變字段,即靜態(tài)表)創(chuàng)建MyISAM表時沛善,會為每行使用固定的長度空間,這樣設(shè)置不同的varchar長度值時例证,存儲相同數(shù)據(jù)所占用的空間是不一樣路呜。通常情況下使用varchar(20)和varchar(255)保持'hello'占用的空間都是一樣的,但使用長度較短的列卻有巨大的優(yōu)勢织咧。較大的列使用更多的內(nèi)存胀葱,因?yàn)镸ySQL通常會分配固定大小的內(nèi)存塊來保存值,這對排序或使用基于內(nèi)存的臨時表尤其不好笙蒙。同樣的事情也會發(fā)生在使用文件排序或者基于磁盤的臨時表的時候抵屿。
6.基本數(shù)據(jù)類型需不需要設(shè)置顯示長度?int(M)中的M代表什么?
在int(m)中,這里的M代表的并不是存儲在數(shù)據(jù)庫中的具體的長度捅位,當(dāng)我們在選擇使用int類型的時候轧葛,不論int(3)、int(4)艇搀、int(8) 在磁盤上都是占用 4 btyes 的存儲空間尿扯。除了顯示給用戶的方式有點(diǎn)不同外,int(M) 跟 int 數(shù)據(jù)類型是相同的焰雕。
如果int的值為10
int(10)顯示結(jié)果為0000000010
int(3)顯示結(jié)果為010
就是顯示的長度不一樣而已 都是占用四個字節(jié)的空間
問答環(huán)節(jié):
問題1:MySQL的索引加載是進(jìn)內(nèi)存還是在硬盤處理?
回答:數(shù)據(jù)都會先進(jìn)內(nèi)存.
問題2:int(M)代表什么?
int型數(shù)據(jù)的顯示長度并沒有什么意義.完全可以不加.
問題3:一個中文占用幾個字節(jié)?
Unicode碼表的占用3個字節(jié)
GBK碼表的占用2個字節(jié).
鳴謝
感謝觀看,如有出錯,懇請指正
BY : 楊以杰
視頻中的PPT連接:ptteng.github.io/PPT/PPT-java/Java-task1-varchar.html#/