第一:Redis 是什么?
Redis是基于內(nèi)存椅亚、可持久化的日志型限番、Key-Value數(shù)據(jù)庫 高性能存儲系統(tǒng),并提供多種語言的API.
第二:出現(xiàn)背景
數(shù)據(jù)結(jié)構(gòu)(Data Structure)需求越來越多, 但memcache中沒有, 影響開發(fā)效率
性能需求, 隨著讀操作的量的上升需要解決什往,經(jīng)歷的過程有:
數(shù)據(jù)庫讀寫分離(M/S)–>數(shù)據(jù)庫使用多個Slave–>增加Cache (memcache)–>轉(zhuǎn)到Redis
解決寫的問題:
水平拆分扳缕,對表的拆分,將有的用戶放在這個表别威,有的用戶放在另外一個表躯舔;
可靠性需求
Cache的"雪崩"問題讓人糾結(jié)
Cache面臨著快速恢復(fù)的挑戰(zhàn)
開發(fā)成本需求
Cache和DB的一致性維護成本越來越高(先清理DB, 再清理緩存, 不行啊, 太慢了!)
開發(fā)需要跟上不斷涌入的產(chǎn)品需求
硬件成本最貴的就是數(shù)據(jù)庫層面的機器,基本上比前端的機器要貴幾倍省古,主要是IO密集型粥庄,很耗硬件;
維護性復(fù)雜
一致性維護成本越來越高豺妓;
BerkeleyDB使用B樹惜互,會一直寫新的,內(nèi)部不會有文件重新組織琳拭;這樣會導(dǎo)致文件越來越大训堆;大的時候需要進行文件歸檔,歸檔的操作要定期做白嘁;
這樣坑鱼,就需要有一定的down time;
基于以上考慮絮缅, 選擇了Redis
第三:Redis 在新浪微博中的應(yīng)用
Redis簡介
1. 支持5種數(shù)據(jù)結(jié)構(gòu)
支持strings, hashes, lists, sets, sorted sets
string是很好的存儲方式鲁沥,用來做計數(shù)存儲呼股。sets用于建立索引庫非常棒;
2. K-V 存儲 vs K-V 緩存
新浪微博目前使用的98%都是持久化的應(yīng)用画恰,2%的是緩存彭谁,用到了600+服務(wù)器
Redis中持久化的應(yīng)用和非持久化的方式不會差別很大:
非持久化的為8-9萬tps,那么持久化在7-8萬tps左右允扇;
當(dāng)使用持久化時缠局,需要考慮到持久化和寫性能的配比,也就是要考慮redis使用的內(nèi)存大小和硬盤寫的速率的比例計算蔼两;
3. 社區(qū)活躍
Redis目前有3萬多行代碼, 代碼寫的精簡甩鳄,有很多巧妙的實現(xiàn),作者有技術(shù)潔癖
Redis的社區(qū)活躍度很高额划,這是衡量開源軟件質(zhì)量的重要指標妙啃,開源軟件的初期一般都沒有商業(yè)技術(shù)服務(wù)支持,如果沒有活躍社區(qū)做支撐俊戳,一旦發(fā)生問題都無處求救揖赴;
Redis基本原理
redis持久化(aof) append online file:
寫log(aof), 到一定程度再和內(nèi)存合并. 追加再追加, 順序?qū)懘疟P, 對性能影響非常小
1. 單實例單進程
Redis使用的是單進程,所以在配置時抑胎,一個實例只會用到一個CPU燥滑;
在配置時,如果需要讓CPU使用率最大化阿逃,可以配置Redis實例數(shù)對應(yīng)CPU數(shù), Redis實例數(shù)對應(yīng)端口數(shù)(8核Cpu, 8個實例, 8個端口), 以提高并發(fā):
單機測試時, 單條數(shù)據(jù)在200字節(jié), 測試的結(jié)果為8~9萬tps铭拧;
2. Replication
過程: 數(shù)據(jù)寫到master–>master存儲到slave的rdb中–>slave加載rdb到內(nèi)存。
存儲點(save point): 當(dāng)網(wǎng)絡(luò)中斷了, 連上之后, 繼續(xù)傳.
Master-slave下第一次同步是全傳恃锉,后面是增量同步搀菩;、
3. 數(shù)據(jù)一致性
長期運行后多個結(jié)點之間存在不一致的可能性破托;
開發(fā)兩個工具程序:
1.對于數(shù)據(jù)量大的數(shù)據(jù)肪跋,會周期性的全量檢查;
2.實時的檢查增量數(shù)據(jù)土砂,是否具有一致性州既;
對于主庫未及時同步從庫導(dǎo)致的不一致,稱之為延時問題萝映;
對于一致性要求不是那么嚴格的場景吴叶,我們只需要要保證最終一致性即可;
對于延時問題序臂,需要根據(jù)業(yè)務(wù)場景特點分析蚌卤,從應(yīng)用層面增加策略來解決這個問題;
例如:
1.新注冊的用戶,必須先查詢主庫造寝;
2.注冊成功之后,需要等待3s之后跳轉(zhuǎn)吭练,后臺此時就是在做數(shù)據(jù)同步诫龙。
第四:分布式緩存的架構(gòu)設(shè)計
1.架構(gòu)設(shè)計
由于redis是單點,項目中需要使用鲫咽,必須自己實現(xiàn)分布式签赃。基本架構(gòu)圖如下所示:
2.分布式實現(xiàn)
通過key做一致性哈希分尸,實現(xiàn)key對應(yīng)redis結(jié)點的分布锦聊。
一致性哈希的實現(xiàn):
l????????hash值計算:通過支持MD5與MurmurHash兩種計算方式,默認是采用MurmurHash箩绍,高效的hash計算孔庭。
l????????一致性的實現(xiàn):通過java的TreeMap來模擬環(huán)狀結(jié)構(gòu),實現(xiàn)均勻分布
3.client的選擇
對于jedis修改的主要是分區(qū)模塊的修改材蛛,使其支持了跟據(jù)BufferKey進行分區(qū)圆到,跟據(jù)不同的redis結(jié)點信息,可以初始化不同的 ShardInfo卑吭,同時也修改了JedisPool的底層實現(xiàn)芽淡,使其連接pool池支持跟據(jù)key,value的構(gòu)造方法,跟據(jù)不同 ShardInfos豆赏,創(chuàng)建不同的jedis連接客戶端挣菲,達到分區(qū)的效果,供應(yīng)用層調(diào)用
4.模塊的說明
l????????臟數(shù)據(jù)處理模塊掷邦,處理失敗執(zhí)行的緩存操作白胀。
l????????屏蔽監(jiān)控模塊,對于jedis操作的異常監(jiān)控耙饰,當(dāng)某結(jié)點出現(xiàn)異澄屏可控制redis結(jié)點的切除等操作。
整個分布式模塊通過hornetq苟跪,來切除異常redis結(jié)點廷痘。對于新結(jié)點的增加,也可以通過reload方法實現(xiàn)增加件已。(此模塊對于新增結(jié)點也可以很方便實現(xiàn))
對于以上分布式架構(gòu)的實現(xiàn)滿足了項目的需求笋额。另外使用中對于一些比較重要用途的緩存數(shù)據(jù)可以單獨設(shè)置一些redis結(jié)點,設(shè)定特定的優(yōu)先級篷扩。另外對 于緩存接口的設(shè)計兄猩,也可以跟據(jù)需求,實現(xiàn)基本接口與一些特殊邏輯接口。對于cas相關(guān)操作枢冤,以及一些事物操作可以通過其watch機制來實現(xiàn)鸠姨。
聲明:所有博客服務(wù)于分布式框架,作為框架的技術(shù)支持及說明淹真,框架面向企業(yè)讶迁,是大型互聯(lián)網(wǎng)分布式企業(yè)架構(gòu),后期會介紹linux上部署高可用集群項目核蘸。
愿意了解框架技術(shù)或者源碼的朋友直接加求求(企鵝):2042849237歡迎大家一起學(xué)習(xí)研究相關(guān)技術(shù)
更多詳細源碼參考來源:http://minglisoft.cn/technology