Content-centric Caching Using Deep Reinforcement Learning in Mobile Computing

摘要:

本文提出了一種基于深度強化學習(DRL)的高速緩存存儲方法博个,使其能夠適應動態(tài)、復雜的移動網(wǎng)絡環(huán)境绷蹲。與LRU和LFU相比堂油,該機制不需要先驗的流行度分布知識修档,因此在實踐中具有更高的可采用率和靈活性碧绞。

數(shù)據(jù)集:

zipf數(shù)據(jù)集府框,\alpha =1.3 ,C=50 ,M=300  (基站容量為50,內(nèi)容種類為300);完全隨機數(shù)據(jù)集迫靖。

對比實驗:

采用了LFU院峡、LRU和DDPG算法作為對比算法

框架算法:

基于A3C框架,支持多線程和異步更新學習策略系宜。

相關工作:

在[16]中該工作將邊緣卸載任務視為馬爾可夫決策過程(MDP)照激。[17]提出了一種基于q -學習的分布式緩存替換策略來處理卸載任務,提出了一種適用于空間集群蜂窩網(wǎng)絡的概率緩存策略盹牧,不同流行程度的內(nèi)容以不同的緩存概率分布在基站集群中俩垃。因此,該方法可以靈活應對復雜內(nèi)容的流行挑戰(zhàn)汰寓。Blaszczyszyn[18]指出口柳,當基站覆蓋重疊區(qū)域時,始終緩存最流行的內(nèi)容不是主要策略有滑。通過推導出不同基站中最受歡迎內(nèi)容的存儲概率跃闹,可以顯著提高重疊覆蓋情況下的命中率。謝的[19]工作中毛好,在寡頭壟斷市場模型下望艺,分析了多個服務提供商服務器之間的緩存資源分配任務。此外肌访,他們還使用了動態(tài)非合作博弈方法來獲得SPSs所需的最佳緩存空間找默。在一項后續(xù)研究中,[20]將k近鄰與DDPG算法相結合吼驶。因此啡莉,該模型在高緩存命中率和低計算成本兩方面都優(yōu)于傳統(tǒng)的DQN方法。

模型構建:

給每個請求分配優(yōu)先級旨剥,流行度分為短期咧欣,中期和長期流行度,高優(yōu)先級內(nèi)容成為決定點擊率的重要因素轨帜;

并行代理:

傳統(tǒng)的方法是使用單個代理進行抽樣魄咕,這導致樣本之間的相關性很高。這個問題可能會導致神經(jīng)網(wǎng)絡過度擬合蚌父。為了解決這個問題哮兰,DQN提出了體驗回放。然而苟弛,DQN只能進行離線學習喝滞,在高動態(tài)環(huán)境下性能較差。因此膏秫,為了實現(xiàn)在線學習右遭,我們同時運行多個學習代理。這些代理相互作用并獨立學習。本地代理和全局代理相互更新它們的參數(shù)窘哈。因此吹榴,全局代理從每個本地代理匯總的樣本不再相關。此外滚婉,多cpu支持的并行學習提供了很高的學習效率图筹。

強化學習模型:

1、Action space:A={0, 1, 2, · · · , C}让腹,at= 0表示策略拒絕緩存當前請求远剩,at = i(0 < i≤C)表示替換內(nèi)容根據(jù)當前請求在緩存中索引i。

2骇窍、State space:s t = {R t .f, R 1 .f, · · · , R C .f }.我們在時間t中的狀態(tài)st定義為正在進行的請求R t和緩存內(nèi)容的所有特征的集合

3民宿、Reward function:r = r short +γ × r middle + γ **2 × r long .(γ是可調(diào)節(jié)的參數(shù))

模型圖

算法:

不是使用神經(jīng)網(wǎng)絡估計Q(s,a)(例如DQN),我們使用狀態(tài)s作為神經(jīng)網(wǎng)絡的輸入,并直接輸出動作的概率分布πθ。

結果:

zipf數(shù)據(jù)集緩存命中率結果圖

隨機分布數(shù)據(jù)集緩存命中率結果分布圖

?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末像鸡,一起剝皮案震驚了整個濱河市活鹰,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌只估,老刑警劉巖志群,帶你破解...
    沈念sama閱讀 217,542評論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異蛔钙,居然都是意外死亡锌云,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,822評論 3 394
  • 文/潘曉璐 我一進店門吁脱,熙熙樓的掌柜王于貴愁眉苦臉地迎上來桑涎,“玉大人,你說我怎么就攤上這事兼贡」ダ洌” “怎么了?”我有些...
    開封第一講書人閱讀 163,912評論 0 354
  • 文/不壞的土叔 我叫張陵遍希,是天一觀的道長等曼。 經(jīng)常有香客問我,道長凿蒜,這世上最難降的妖魔是什么禁谦? 我笑而不...
    開封第一講書人閱讀 58,449評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮废封,結果婚禮上州泊,老公的妹妹穿的比我還像新娘。我一直安慰自己漂洋,他們只是感情好遥皂,可當我...
    茶點故事閱讀 67,500評論 6 392
  • 文/花漫 我一把揭開白布力喷。 她就那樣靜靜地躺著,像睡著了一般渴肉。 火紅的嫁衣襯著肌膚如雪冗懦。 梳的紋絲不亂的頭發(fā)上爽冕,一...
    開封第一講書人閱讀 51,370評論 1 302
  • 那天仇祭,我揣著相機與錄音,去河邊找鬼颈畸。 笑死乌奇,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的眯娱。 我是一名探鬼主播礁苗,決...
    沈念sama閱讀 40,193評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼徙缴!你這毒婦竟也來了试伙?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 39,074評論 0 276
  • 序言:老撾萬榮一對情侶失蹤于样,失蹤者是張志新(化名)和其女友劉穎疏叨,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體穿剖,經(jīng)...
    沈念sama閱讀 45,505評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡蚤蔓,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,722評論 3 335
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了糊余。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片秀又。...
    茶點故事閱讀 39,841評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖贬芥,靈堂內(nèi)的尸體忽然破棺而出吐辙,到底是詐尸還是另有隱情,我是刑警寧澤蘸劈,帶...
    沈念sama閱讀 35,569評論 5 345
  • 正文 年R本政府宣布袱讹,位于F島的核電站,受9級特大地震影響昵时,放射性物質發(fā)生泄漏捷雕。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,168評論 3 328
  • 文/蒙蒙 一壹甥、第九天 我趴在偏房一處隱蔽的房頂上張望救巷。 院中可真熱鬧,春花似錦句柠、人聲如沸浦译。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,783評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽精盅。三九已至帽哑,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間叹俏,已是汗流浹背妻枕。 一陣腳步聲響...
    開封第一講書人閱讀 32,918評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留粘驰,地道東北人屡谐。 一個月前我還...
    沈念sama閱讀 47,962評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像蝌数,于是被迫代替她去往敵國和親愕掏。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,781評論 2 354

推薦閱讀更多精彩內(nèi)容