談談對日期的壓縮存儲

最近在項目中做緩存的性能優(yōu)化,對熱點代碼/TP時間進行分析之后.發(fā)現(xiàn)這些性能不理想的請求,都是cache的value比較大導致的.所以自然想到的就是精簡字段.并且對數據進行壓縮存儲.這篇文章就談談其中對日期的壓縮處理.

字符串

最常規(guī)的日期存儲方式應該就是字符串.如"20171029",那這樣的字符串到底占用多大空間呢.我們可以讓代碼告訴我們.

    public static void main(String[] args) {
        String date = "20171029";
        byte[] dateBytes = date.getBytes();
        System.out.println(dateBytes.length);
    }

運行結果是: 8

我們可以看到,使用字符串存儲的日期.要占用8個字節(jié).如果一個數據包里大部分都是日期.那1KB的數據包只能存放128個日期.當日期很多的時候,會占用很多空間.

Long

了解Unix時間的都知道.我們可以用一個long類型來存儲日期.Java里long類型占用的空間也是8byte.和上面的字符串是一樣的.

Int

int在Java中占用4Byte.所代表的數字范圍是 -2^32 ~ 2^31-1.用來存儲日期完全夠用.所以我們完全可以使用int類型來存儲時間.這樣下來.我們用1KB的數據包就能存放256個日期了.

到這里看起來已經很好了.但是我們發(fā)現(xiàn).2^31-1 = 2147483647 遠遠大于99991231.也就是說這個int的前面很多個bit是空閑的.那我們有沒有可能繼續(xù)壓縮?

Mysql如何存儲日期

因為使用int存儲日期肯定是肯定不是最優(yōu)的.那如何知道更優(yōu)的方案呢.那就是去借鑒其他人的方案.那么數據庫一定是一個很好的選擇.因為對于數據庫來說,能存小,一定不會存大.經過查詢資料.Mysql是使用3個byte來存儲日期的.具體的公式是

yyyy * 32 * 16 + mm * 32 + dd

具體成二進制表示為:yyyyyyyy yyyyyyym mmmddddd

這個公式是什么意思呢.

  1. 日的范圍是1~31.我們使用5個bit就足夠存儲.
  2. 月的范圍是1~12.我們使用4個bit就足夠存儲.
  3. 對于3個byte的24位.還剩下15位.可以存儲2^15-1 = 32767個數據.用來當年已經足夠了.

Unix時間戳 + Mysql存儲方式 = 2Byte

看了Mysql的存儲方案,不難發(fā)現(xiàn),使用3Byte確實不錯.但是我們能不能做的更好,只用2個Byte.
我們可以看下.對于日和月的存儲已經沒有壓縮空間了.如果使用2個byte.則還有7個bit供我們使用.

2^7=128.如果直接用來存年份.肯定是不夠的.但是Unix時間戳還記得嗎.它是從1970年1月1日到現(xiàn)在的毫秒差.這個相對的思路如果加到我們的設計里呢.

我們這127不用來做絕對的時間,而是作為相對的時間存儲.那參照日期如果采用2017年.則可以存儲到2017 + 127 = 2144.對于一般的業(yè)務系統(tǒng).128年的偏移,足夠我們使用了.

使用二進制來表示則日期格式為:yyyyyyym mmmddddd

而使用這種2Byte類型的存儲.則1KB的數據包則可以存儲512個日期.相比一開始的128.多了3倍.

總結

你可能需要知道,2M的數據和2K的數據.在網絡傳輸中有什么區(qū)別.
才能理解這篇文章為什么會要對這種看似沒什么用字符串存儲進行優(yōu)化.
不過沒關系.多了解一下,總沒有錯.

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末瓦阐,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子亦鳞,更是在濱河造成了極大的恐慌,老刑警劉巖康谆,帶你破解...
    沈念sama閱讀 206,602評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件描扯,死亡現(xiàn)場離奇詭異,居然都是意外死亡迅耘,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,442評論 2 382
  • 文/潘曉璐 我一進店門监署,熙熙樓的掌柜王于貴愁眉苦臉地迎上來颤专,“玉大人,你說我怎么就攤上這事钠乏∑茱酰” “怎么了?”我有些...
    開封第一講書人閱讀 152,878評論 0 344
  • 文/不壞的土叔 我叫張陵晓避,是天一觀的道長簇捍。 經常有香客問我,道長俏拱,這世上最難降的妖魔是什么暑塑? 我笑而不...
    開封第一講書人閱讀 55,306評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮锅必,結果婚禮上梯投,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好分蓖,可當我...
    茶點故事閱讀 64,330評論 5 373
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著尔许,像睡著了一般么鹤。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上味廊,一...
    開封第一講書人閱讀 49,071評論 1 285
  • 那天蒸甜,我揣著相機與錄音,去河邊找鬼余佛。 笑死柠新,一個胖子當著我的面吹牛,可吹牛的內容都是我干的辉巡。 我是一名探鬼主播恨憎,決...
    沈念sama閱讀 38,382評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼郊楣!你這毒婦竟也來了憔恳?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 37,006評論 0 259
  • 序言:老撾萬榮一對情侶失蹤净蚤,失蹤者是張志新(化名)和其女友劉穎钥组,沒想到半個月后,有當地人在樹林里發(fā)現(xiàn)了一具尸體今瀑,經...
    沈念sama閱讀 43,512評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡程梦,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 35,965評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了橘荠。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片屿附。...
    茶點故事閱讀 38,094評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖砾医,靈堂內的尸體忽然破棺而出拿撩,到底是詐尸還是另有隱情,我是刑警寧澤如蚜,帶...
    沈念sama閱讀 33,732評論 4 323
  • 正文 年R本政府宣布压恒,位于F島的核電站,受9級特大地震影響错邦,放射性物質發(fā)生泄漏探赫。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,283評論 3 307
  • 文/蒙蒙 一撬呢、第九天 我趴在偏房一處隱蔽的房頂上張望伦吠。 院中可真熱鬧,春花似錦、人聲如沸毛仪。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,286評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽箱靴。三九已至腺逛,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間衡怀,已是汗流浹背棍矛。 一陣腳步聲響...
    開封第一講書人閱讀 31,512評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留抛杨,地道東北人够委。 一個月前我還...
    沈念sama閱讀 45,536評論 2 354
  • 正文 我出身青樓,卻偏偏與公主長得像怖现,于是被迫代替她去往敵國和親茁帽。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 42,828評論 2 345

推薦閱讀更多精彩內容

  • 1. Java基礎部分 基礎部分的順序:基本語法真竖,類相關的語法脐雪,內部類的語法,繼承相關的語法恢共,異常的語法战秋,線程的語...
    子非魚_t_閱讀 31,587評論 18 399
  • 編碼問題一直困擾著開發(fā)人員,尤其在 Java 中更加明顯讨韭,因為 Java 是跨平臺語言脂信,不同平臺之間編碼之間的切換...
    x360閱讀 2,465評論 1 20
  • 8086匯編 本筆記是筆者觀看小甲魚老師(魚C論壇)《零基礎入門學習匯編語言》系列視頻的筆記丽声,在此感謝他和像他一樣...
    Gibbs基閱讀 37,115評論 8 114
  • 書籍浩如煙海,如果花一生觉义,也未必能讀遍全書雁社。所謂的讀萬卷書,行萬里路晒骇,人生的格局和視野必然更加宏觀霉撵。但是如...
    糖鑫鑫閱讀 418評論 2 1
  • 莫名我就喜歡你磺浙,沒有理由,從認識你的那年起直到現(xiàn)在徒坡,或許還有將來撕氧,在你沒有女朋友的時候,光明正大的喜歡你崭参,有女朋...
    筱i柒閱讀 130評論 0 0