何哀何歡 - 簡(jiǎn)書(shū)

何哀何歡

IP屬地：上海

增量計(jì)算平均數(shù)
我們想要的是通過(guò)之前的平均值付材，求新的平均值：只要知道了的算法庆寺，就可以實(shí)現(xiàn)只要已有平均值和新添加值，就可以算出新的平均值用和帶入公式...

2458 2 0
pytorch.nn.Embadding 詳解
數(shù)據(jù)和枚舉的對(duì)應(yīng)關(guān)系：{A:1, B:2, C:3, ...} 網(wǎng)絡(luò)層輸入按照枚舉方式蜒程，比如是A的話(huà)，那么輸入層就是A: [1, 0, 0, 0...

1097 0 0

有理數(shù)是個(gè)什么鬼
是無(wú)知的可怕。有一類(lèi)數(shù)，可以用兩個(gè)數(shù)的比值來(lái)表示置尔，比如在古希臘（及希臘系的英語(yǔ)），這類(lèi)數(shù)叫 ratio（估算，計(jì)算榜轿，原因，兩數(shù)的關(guān)系朵锣，和re...

205 0 0
probability / odds / logits到底是什么
probability：發(fā)生的概率發(fā)生的次數(shù)/總次數(shù)0：不發(fā)生 1：必發(fā)生 odds：發(fā)生比發(fā)生的概率 / 不發(fā)生的概率0：不發(fā)生谬盐，：必發(fā)生...

1461 0 0
torch.distributions.Categorical
從一個(gè)樣本空間中，抽樣诚些。比如：我要抽 [0, 1, 2] 三個(gè)物體飞傀，共100次，那我希望： 0能抽到20次左右 1能抽到70次左右 2能抽到30次左右

0.2 11038 0 2
對(duì)Policy gradient的總結(jié)
policy gradient 其實(shí)就是的平均數(shù): corssentropy是加法诬烹，總和砸烦。這里需要每一項(xiàng)，所以就取一個(gè)平均值绞吁。好算幢痘，就是遞...

810 0 0
游戲開(kāi)發(fā)職位
國(guó)內(nèi)游戲公司普遍分不清項(xiàng)目經(jīng)理和制作人，產(chǎn)品經(jīng)理的區(qū)別家破。我試著區(qū)分一下：國(guó)外制作人這個(gè)職位颜说，不負(fù)責(zé) 游戲的設(shè)計(jì) 和發(fā)布（對(duì)這兩樣的...

0.1 350 0 1

Q-learning:Temporal Difference / Monte Carlo
Q-learning 是RL的核心 Q 代表 Quality 品質(zhì) 系統(tǒng)維護(hù)一個(gè)Q值表： 13.31.622.67.832.49.541.35....

0.1 525 0 1
Torch.gather()、Torch.cat()
數(shù)組維度和方向（連接） gather() 函數(shù)是按照索引選取數(shù)字：一個(gè)二維數(shù)組汰聋，如果沿第0維選取元素门粪，則按照將頭方向依次選取數(shù)字。0烹困，2玄妈，1就...

2331 0 0