在c語(yǔ)言中座哩,使用以空字符結(jié)尾的字符數(shù)組來(lái)表示字符串芋忿。Redis在此基礎(chǔ)上定義了一種名為簡(jiǎn)單動(dòng)態(tài)字符串(Simple Dynamic String,SDS) 來(lái)表示字符串违帆。
SDS定義
struct sdshdr{
// 記錄buf數(shù)組中已經(jīng)使用的字節(jié)數(shù)量即保存的字符串的長(zhǎng)度
int len;
// 記錄buf數(shù)組總還未使用的字節(jié)數(shù)量
int free;
// 字節(jié)數(shù)組 用于保存字符串 這個(gè)數(shù)組不保存字符而是保存二進(jìn)制數(shù)據(jù)
char buf[];
}
在buf數(shù)組中律杠,也保留了一個(gè)空字符用作結(jié)尾簸喂,該字符不計(jì)入SDS的長(zhǎng)度中。
C語(yǔ)言使用長(zhǎng)度為n+1的字符數(shù)組來(lái)表示長(zhǎng)度為n的字符串侵续,字符數(shù)組最后一個(gè)元素總是空字符'\0'倔丈。
SDS的優(yōu)點(diǎn)
常數(shù)級(jí)復(fù)雜度獲取字符串的長(zhǎng)度
在SDS中l(wèi)en字段用于記錄字符串的長(zhǎng)度,因此獲取字符串的長(zhǎng)度的操作時(shí)間復(fù)雜度為O(1)状蜗。C語(yǔ)言中獲取一個(gè)字符串的長(zhǎng)度時(shí)間復(fù)雜度為O(n)需五,需要通過(guò)遍歷字符數(shù)組才能獲得。
設(shè)置和更新SDS的長(zhǎng)度是由SDS的API在執(zhí)行時(shí)自動(dòng)完成的轧坎,在使用SDS過(guò)程中不需要手動(dòng)去修改長(zhǎng)度宏邮。因此獲取字符串長(zhǎng)度這種操作不會(huì)成為Redis的性能瓶頸。即使反復(fù)去獲取一個(gè)特別長(zhǎng)的字符串的長(zhǎng)度缸血,時(shí)間復(fù)雜度為O(1)蜀铲,不會(huì)對(duì)系統(tǒng)性能造成任何影響。
避免緩沖區(qū)溢出
SDS的空間分配策略杜絕了發(fā)生緩沖區(qū)溢出的可能性属百。當(dāng)SDS的API在對(duì)buf數(shù)組進(jìn)行修改時(shí),會(huì)先檢查SDS的空間是否滿(mǎn)足修改所需要的要求变姨,如果不滿(mǎn)足族扰,則會(huì)自動(dòng)擴(kuò)展空間,然后執(zhí)行修改操作定欧。
減少頻繁修改字符串帶來(lái)的內(nèi)存重分配次數(shù)
在C語(yǔ)言中渔呵,每次修改字符串都會(huì)對(duì)字符數(shù)組進(jìn)行一次內(nèi)存重分配操作。內(nèi)存重分配涉及復(fù)雜的算法和系統(tǒng)調(diào)用砍鸠,是一種比較耗性能的操作扩氢。Redis通過(guò)內(nèi)存分配策略來(lái)避免了頻繁修改字符串帶來(lái)的性能損耗。
空間預(yù)分配
空間預(yù)分配用于優(yōu)化字符串增長(zhǎng)操作爷辱,當(dāng)對(duì)字符串進(jìn)行修改時(shí)并且需要擴(kuò)展空間時(shí)录豺,不僅會(huì)分配修改所必需的空間,還會(huì)分配額外的未使用空間饭弓。
當(dāng)修改完SDS后双饥,如果字符串的長(zhǎng)度小于1MB,程序會(huì)分配和len長(zhǎng)度相同的未使用空間弟断,此時(shí)len和free值相同咏花。
當(dāng)字符串的長(zhǎng)度大于等于1MB時(shí),程序會(huì)分配1MB的未使用空間阀趴。
空間預(yù)分配策略可以減少連續(xù)增長(zhǎng)字符串所需要的內(nèi)存重分配次數(shù)昏翰,將所需的內(nèi)存重分配次數(shù)從必須N次降低為最多N次苍匆。
惰性釋放空間
惰性釋放空間用于優(yōu)化字符串的縮短操作,當(dāng)需要縮短字符串時(shí)棚菊,不會(huì)立即回收縮短后多出來(lái)的字節(jié)浸踩,而是用free記錄起來(lái),方便后續(xù)使用窍株。
二進(jìn)制安全
C語(yǔ)言的字符串不能包含空字符民轴,因此只能保存文本數(shù)據(jù),不能保存圖片球订、音頻等二進(jìn)制數(shù)據(jù)后裸。Redis為了適用各種場(chǎng)景,SDS的API都是以處理二進(jìn)制的方式處理SDS存放在buf數(shù)組的數(shù)據(jù)冒滩。因此數(shù)據(jù)寫(xiě)入時(shí)和讀取時(shí)是一樣的微驶。buf數(shù)組用來(lái)保存二進(jìn)制數(shù)據(jù)而不是字符。SDS通過(guò)len的值來(lái)判斷字符串是否結(jié)束开睡。
兼容部分C中的函數(shù)
SDS遵循C語(yǔ)言字符串以空字符結(jié)尾的慣例因苹,因此可以使用部分C中的函數(shù),從而避免了不必要的代碼重復(fù)篇恒。