240 發(fā)簡信
IP屬地:甘肅
  • 這個(gè)Actor的更新凿试,好像有點(diǎn)問題吧武翎,和莫煩老師的方法差異很大棺蛛,而且我研究了下云茸,好像不等價(jià)哎雨女。

    深度強(qiáng)化學(xué)習(xí)-DDPG算法原理和實(shí)現(xiàn)

    在之前的幾篇文章中舶替,我們介紹了基于價(jià)值Value的強(qiáng)化學(xué)習(xí)算法Deep Q Network豆赏。有關(guān)DQN算法以及各種改進(jìn)算法的原理和實(shí)現(xiàn)束凑,可以參考之前的文章: 實(shí)戰(zhàn)深度強(qiáng)化學(xué)習(xí)...

  • 120
    講人話系列——DQN初探之2048

    概述 強(qiáng)化學(xué)習(xí)也火了好久晒旅,最近才有空來充充電。老實(shí)說汪诉,最開始強(qiáng)化學(xué)習(xí)的知識(shí)點(diǎn)還挺多的废恋,看了好久也沒太弄清楚幾個(gè)算法的關(guān)系,所以本著實(shí)踐出真知的想法扒寄,找個(gè)案例做下鱼鼓。2048小游...

  • 講人話系列——what can DNN do ?

    概述 神經(jīng)網(wǎng)絡(luò)大火的今天,各種花式模型層出不窮该编,有些默認(rèn)的說法如下:1.DNN理論上有無限擬合能力迄本,2.DCN(某推薦場景下的網(wǎng)絡(luò))有高階特征抽取能力,可以自動(dòng)提取特征课竣。針對...

  • @DaTingLi 模型有很多變形和發(fā)展嘉赎,你要抓住最通用的那個(gè)。

    講人話系列——企業(yè)中的文本分類

    概述 新型深度模型天天刷屏刷榜于樟,模型日新月異公条,做算法的不免感到焦慮。發(fā)現(xiàn)自己看論文的速度已經(jīng)趕不上他們發(fā)論文的速度了迂曲。在此啟發(fā)下赃份,想寫一寫自己工作的思考,面對一個(gè)領(lǐng)域奢米,我們?nèi)?..

  • @DaTingLi 一個(gè)意思抓韩,你可以理解為當(dāng)你要做一個(gè)模型時(shí)候,比較好的基礎(chǔ)方案鬓长。 他要足夠有效谒拴,足夠好用就可以了。

    講人話系列——企業(yè)中的文本分類

    概述 新型深度模型天天刷屏刷榜涉波,模型日新月異英上,做算法的不免感到焦慮炭序。發(fā)現(xiàn)自己看論文的速度已經(jīng)趕不上他們發(fā)論文的速度了。在此啟發(fā)下苍日,想寫一寫自己工作的思考惭聂,面對一個(gè)領(lǐng)域,我們?nèi)?..

  • 120
    講人話系列——分段約束的整數(shù)規(guī)劃問題

    概述 運(yùn)籌學(xué)是一個(gè)應(yīng)用廣泛的學(xué)科相恃,在電商的物流辜纲、倉儲(chǔ)都會(huì)有很多應(yīng)用。今天我們來講一個(gè)比較特殊的形式“分段約束”拦耐,以及如何將分段約束轉(zhuǎn)化標(biāo)準(zhǔn)的整數(shù)規(guī)劃問題耕腾。 問題描述 今日主角...

  • KKT的行文順序很難理解,對偶問題和KKT轉(zhuǎn)化本身就比較復(fù)雜杀糯,混在一起難以理解扫俺。

    SVM系列第七講--KKT條件

    上一講我們介紹了最優(yōu)化問題的兩種形式,無約束的和等式約束條件下的固翰,這一講狼纬,我們主要介紹不等式約束條件下的最優(yōu)化問題,并介紹一下我們的KKT條件骂际。 1疗琉、不等式約束條件 設(shè)目標(biāo)函...

  • @物質(zhì)決定意識(shí)地位決定立場 推薦是個(gè)比較大的方向,我抓了一些自己做過的點(diǎn)先匪,分享一下經(jīng)驗(yàn)种吸。完整的體系化知識(shí),網(wǎng)上多多少少能找到些??

    講人話系列——電商推薦系統(tǒng)

    概述 從18年11月開始呀非,接觸推薦系統(tǒng)半年左右時(shí)間坚俗,對推薦系統(tǒng)有了基本的認(rèn)識(shí)。相比于之前做的nlp任務(wù)岸裙,推薦系統(tǒng)復(fù)雜更多猖败,數(shù)據(jù)來源更復(fù)雜、pipeline更復(fù)雜降允、場景更復(fù)雜恩闻、...

  • 講人話系列——電商推薦系統(tǒng)

    概述 從18年11月開始,接觸推薦系統(tǒng)半年左右時(shí)間剧董,對推薦系統(tǒng)有了基本的認(rèn)識(shí)幢尚。相比于之前做的nlp任務(wù)破停,推薦系統(tǒng)復(fù)雜更多,數(shù)據(jù)來源更復(fù)雜尉剩、pipeline更復(fù)雜真慢、場景更復(fù)雜、...

  • 沒了理茎?

    2019-05-06

    五一給自己放了7天假期(不要問我是怎么湊出來的黑界,研究生沒啥課了hiahiahia~) 然后回來就很悲劇了,在返校途中接到導(dǎo)師奪命c(diǎn)all問我為什么走的最早來的最晚T.T功蜓,好吧...

  • 關(guān)于敏捷開發(fā)和TDD的一些思考

    通過昨天對老師的提問求厕,也算是對一直以來的困惑和思考做了個(gè)總結(jié)著隆。 敏捷開發(fā)是一種內(nèi)涵非常豐富的思想,面向用戶呀癣,面向需求美浦,而不是面向模塊。而TDD則是一種卓有成效地提高工作效率的...

亚洲A日韩AV无卡,小受高潮白浆痉挛av免费观看,成人AV无码久久久久不卡网站,国产AV日韩精品