Deep Reinforcement learning agent會觀察environment的state 圖中的state和observati...
Meta learning 元學習=learn to learn 成為一個better learner 可以做語音和圖像的辨識肠鲫,來實現(xiàn)text ...
logistic regression 邏輯回歸和線性回歸一樣员帮,都是畫一條線,區(qū)別是選的loss function不一樣 邏輯回歸是交叉熵 線性...
Generative advertisrial model GAN的分類: 1:經(jīng)典版导饲,input是隨機的vector 經(jīng)典GAN Genera...
Transfer learning 核心思想:類比 遷移學習:數(shù)據(jù)和任務(wù)不一致 1:數(shù)據(jù)差不多捞高,但標簽和任務(wù)無關(guān) 2:數(shù)據(jù)標簽一致,但是數(shù)據(jù)本身...
Semi-supervise 和supervised learning 的區(qū)別:有 unlabelled data(無output渣锦,且遠大于la...
CNN CNN網(wǎng)絡(luò)的一層就是一個classifier CNN是DNN的簡化硝岗,不過為什么能簡化 ?以下三種情況袋毙,可以用相同的weight 1:im...
復(fù)習 regression輸出的是標量型檀,但classification輸出的是Boolean類型的值 bias太大說明現(xiàn)在是under fitt...
Gradient descent gradient就是,對每一個變量求偏微分听盖,然后組成變量 是learning rate胀溺,learning ra...