何哀何歡 - 簡(jiǎn)書(shū)

何哀何歡

IP屬地：上海

增量計(jì)算平均數(shù)
我們想要的是通過(guò)之前的平均值，求新的平均值：只要知道了的算法握巢，就可以實(shí)現(xiàn)只要已有平均值和新添加值拇颅，就可以算出新的平均值用和帶入公式...

2461 2 0
pytorch.nn.Embadding 詳解
數(shù)據(jù)和枚舉的對(duì)應(yīng)關(guān)系：{A:1, B:2, C:3, ...} 網(wǎng)絡(luò)層輸入按照枚舉方式弥锄，比如是A的話朵夏，那么輸入層就是A: [1, 0, 0, 0...

1104 0 0

有理數(shù)是個(gè)什么鬼
是無(wú)知的可怕锌唾。有一類(lèi)數(shù)篓像，可以用兩個(gè)數(shù)的比值來(lái)表示嗜逻，比如在古希臘（及希臘系的英語(yǔ)）涩僻，這類(lèi)數(shù)叫 ratio（估算，計(jì)算栈顷，原因逆日，兩數(shù)的關(guān)系，和re...

206 0 0
probability / odds / logits到底是什么
probability：發(fā)生的概率發(fā)生的次數(shù)/總次數(shù)0：不發(fā)生 1：必發(fā)生 odds：發(fā)生比發(fā)生的概率 / 不發(fā)生的概率0：不發(fā)生妨蛹，：必發(fā)生...

1470 0 0
torch.distributions.Categorical
從一個(gè)樣本空間中屏富，抽樣。比如：我要抽 [0, 1, 2] 三個(gè)物體蛙卤，共100次狠半，那我希望： 0能抽到20次左右 1能抽到70次左右 2能抽到30次左右

0.2 11046 0 2
對(duì)Policy gradient的總結(jié)
policy gradient 其實(shí)就是的平均數(shù): corssentropy是加法，總和颤难。這里需要每一項(xiàng)神年，所以就取一個(gè)平均值。好算行嗤，就是遞...

810 0 0
游戲開(kāi)發(fā)職位
國(guó)內(nèi)游戲公司普遍分不清項(xiàng)目經(jīng)理和制作人已日，產(chǎn)品經(jīng)理的區(qū)別。我試著區(qū)分一下：國(guó)外制作人這個(gè)職位栅屏，不負(fù)責(zé) 游戲的設(shè)計(jì) 和發(fā)布（對(duì)這兩樣的...

0.1 350 0 1

Q-learning:Temporal Difference / Monte Carlo
Q-learning 是RL的核心 Q 代表 Quality 品質(zhì) 系統(tǒng)維護(hù)一個(gè)Q值表： 13.31.622.67.832.49.541.35....

0.1 525 0 1
Torch.gather()飘千、Torch.cat()
數(shù)組維度和方向（連接） gather() 函數(shù)是按照索引選取數(shù)字：一個(gè)二維數(shù)組，如果沿第0維選取元素栈雳，則按照將頭方向依次選取數(shù)字护奈。0，2哥纫，1就...

2336 0 0