網(wǎng)頁(yè)請(qǐng)求的頭里有一個(gè)Content-Encoding字段來(lái)表示該網(wǎng)頁(yè)啟用了壓縮算法來(lái)提高網(wǎng)頁(yè)傳輸效率,一般情況下都是以Gzip或deflate為字段值,實(shí)際上是以deflate壓縮算法來(lái)壓縮的數(shù)據(jù)拟糕。
deflate 是最基礎(chǔ)的算法七咧,gzip在deflate的rawdata前增加了10個(gè)字節(jié)的 gzheader,尾部添加了8個(gè)字節(jié)的校驗(yàn)字節(jié)(可選 crc32 和 adler32) 和長(zhǎng)度標(biāo)識(shí)字節(jié)。
zlib庫(kù)是一個(gè)C++常用的解壓zip文件的庫(kù)剂娄,提供了各種各樣的接口以供調(diào)用。其中玄呛,deflate使用inflateInit()阅懦,而gzip使用inflateInit2()進(jìn)行初始化,比 inflateInit()多一個(gè)參數(shù): -MAX_WBITS徘铝,表示處理raw deflate數(shù)據(jù)耳胎。因?yàn)間zip數(shù)據(jù)中的zlib壓縮數(shù)據(jù)塊沒(méi)有zlib header的兩個(gè)字節(jié)。使用inflateInit2時(shí)要求zlib庫(kù)忽略zlib header惕它。
zlib提供了很多接口怕午,在這些復(fù)雜的操作之上封裝了最簡(jiǎn)單的兩個(gè)接口,compress和uncompress淹魄。我們一般直接調(diào)用就可以了诗轻。
簡(jiǎn)單介紹下常用的函數(shù):
1、 deflateInit() + deflate() + deflateEnd()
3個(gè)函數(shù)結(jié)合使用完成壓縮功能,具體用法看 example.c 的 test_deflate()函數(shù). 其實(shí) compress() 函數(shù)內(nèi)部就是用這3個(gè)函數(shù)實(shí)現(xiàn)的(工程 zlib 的 compress.c 文件)
2揭北、 inflateInit() + inflate() + inflateEnd()
和上面的類似,完成解壓縮功能扳炬,uncompress()函數(shù)的內(nèi)部實(shí)現(xiàn)使用的就是它們
3、uLong compressBound(uLong sourceLen);
計(jì)算需要的緩沖區(qū)長(zhǎng)度搔体,這個(gè)函數(shù)并不精確的計(jì)算壓縮后的數(shù)據(jù)有多長(zhǎng)恨樟,但是可以保證壓縮后的長(zhǎng)度不會(huì)這個(gè)結(jié)果還長(zhǎng),便于分配空間疚俱。
接下來(lái)就是我們最常用的一對(duì)函數(shù)
4劝术、int compress (Bytef *dest, uLongf *destLen, const Bytef *source, uLong sourceLen);
壓縮數(shù)據(jù),要注意的是壓縮后的BUF和大小是要預(yù)先分配好的,這也是我們?yōu)槭裁匆褂胏ompressBound這個(gè)函數(shù)的原因养晋。
5衬吆、int uncompress (Bytef *dest, uLongf *destLen,const Bytef *source, uLong sourceLen);
解壓縮數(shù)據(jù),同樣的绳泉,解壓后的BUF大小要預(yù)先知道逊抡,太小了會(huì)解壓失敗。
一般情況下零酪,compress和uncompress函數(shù)足以滿足我們的要求冒嫡。