想學(xué)會(huì)飛行的阿番

IP屬地：廣東

re.sub搞定連續(xù)特殊字符只保留第一個(gè)
數(shù)據(jù)處理的時(shí)候遇到一個(gè)問(wèn)題粱年，比如“春江??*(@花月夜”,想要把它轉(zhuǎn)成“春江?花月夜”,即壹瘟，只保留一串連續(xù)特殊字符中的第一個(gè)疙筹，用下面正則表達(dá)式就...

1047 0 0
系列論文閱讀——Policy Gradient Algorithms and so on(3)
從DPG到D4PG 前文提到的AC算法氓英，策略函數(shù)表示的是爽航，在當(dāng)前狀態(tài)下蛛勉，動(dòng)作空間的概率分布儡司，然后通過(guò)采樣選擇動(dòng)作沉删，即策略是隨機(jī)不確定的渐尿。那可否在...

0.1 1915 0 1

系列論文閱讀——Policy Gradient Algorithms and so on(2)
發(fā)個(gè)庫(kù)存，嘻嘻矾瑰，這篇主要講AC類算法演員-評(píng)論家算法（Actor-Critic）上文公式中我們采用的累計(jì)回報(bào)和()砖茸，雖然它是期望收益的無(wú)偏估...

0.1 409 0 1
系列論文閱讀——Policy Gradient Algorithms and so on(1)
以DQN為代表的絕大多數(shù)基于值的方法通過(guò)求解最優(yōu)值函數(shù)+選擇當(dāng)前價(jià)值最高的動(dòng)作來(lái)實(shí)現(xiàn)。策略高梯度算法則從另一個(gè)角度展開(kāi)——將策略參數(shù)化為殴穴，直接通...

0.1 381 0 1
使用 C# 的第一天遇到的問(wèn)題（doge）
遇到沙雕問(wèn)題： 1.HTTP could not register URL http://+:8000/HelloWCF/. Your proc...

1129 0 0
系列論文閱讀——DQN及其改進(jìn)
DQN 作為DRL的開(kāi)山之作凉夯，DeepMind的DQN可以說(shuō)是每一個(gè)入坑深度增強(qiáng)學(xué)習(xí)的同學(xué)必了解的第一個(gè)算法了吧。先前采幌，將RL和DL結(jié)合存在以下...

0.1 9325 0 5
952. Largest Component Size by Common Factor
思路過(guò)程：看到題目的一瞬間覺(jué)得so easy劲够，因?yàn)轭愃祁}目做到過(guò)好幾次，leetcode上很多求最大連通子圖大小之類的題目都可以用并查集來(lái)解決休傍。...

275 0 0

Tensorflow-API ：對(duì)于tensor特定值進(jìn)行邏輯判斷和操作
1.比較函數(shù) 2.這些比較函數(shù)會(huì)輸出bool類型的tensor,那么就可以配合tf.where來(lái)使用 x中為true的元素值不變征绎，false的元...

0.1 11737 0 3
【轉(zhuǎn)載】Python代碼規(guī)范和命名規(guī)范
看到一篇非常好的python規(guī)范匯總，轉(zhuǎn)發(fā)并mark一哈原文鏈接一磨取、簡(jiǎn)明概述 1人柿、編碼如無(wú)特殊情況, 文件一律使用 UTF-8 編碼如無(wú)...

475 0 0