Astar主要用于求取網(wǎng)格形的地圖中勺像,兩個(gè)點(diǎn)之間的最短距離障贸,地圖中會(huì)有各種形狀的障礙物干擾。在求兩個(gè)點(diǎn)的最短路徑時(shí)吟宦,從起始點(diǎn)向終點(diǎn)進(jìn)行探索時(shí)篮洁,選...
圖片風(fēng)格遷移指的是將一個(gè)圖片的風(fēng)格轉(zhuǎn)換到另一個(gè)圖片中,如圖所示: 原圖片經(jīng)過(guò)一系列的特征變換殃姓,具有了新的紋理特征袁波,這就叫做風(fēng)格遷移。 VGG網(wǎng)絡(luò)...
補(bǔ)發(fā)一段對(duì)于遷移網(wǎng)絡(luò)的學(xué)習(xí)筆記蜗侈。手動(dòng)訓(xùn)練一些層數(shù)較深的神經(jīng)網(wǎng)絡(luò)會(huì)花費(fèi)大量的時(shí)間篷牌。我們可以利用一些常見(jiàn)的神經(jīng)網(wǎng)絡(luò)模型,使用已經(jīng)訓(xùn)練好的參數(shù)踏幻,對(duì)圖像...
GAN:對(duì)抗性生成網(wǎng)絡(luò)枷颊,通俗來(lái)講,即有兩個(gè)網(wǎng)絡(luò)一個(gè)是g(generator )網(wǎng)絡(luò)该面,用于生成偷卧,一個(gè)是d(discriminator)網(wǎng)絡(luò),用于判...
sklearn庫(kù)是一個(gè)強(qiáng)大的機(jī)器學(xué)習(xí)庫(kù)吆倦,幾乎所有機(jī)器學(xué)習(xí)的算法都可以用這個(gè)庫(kù)來(lái)實(shí)現(xiàn),接下來(lái)我們開(kāi)始學(xué)習(xí)這個(gè)庫(kù)坐求。 線性模型 如果我們想要處理線性回...
牛頓法和梯度下降法的差別 牛頓法:二次逼近梯度下降法:一階逼近 牛頓法:對(duì)局部凸的函數(shù)找到極小值蚕泽,對(duì)局部凹的函數(shù)找到極大值,對(duì)不凹不凸的函數(shù)可能...
MCTS桥嗤,即蒙特卡羅樹(shù)搜索须妻,是一類(lèi)搜索算法樹(shù)的統(tǒng)稱(chēng),可以較為有效地解決一些搜索空間巨大的問(wèn)題泛领。 如一個(gè)8*8的棋盤(pán)荒吏,第一步棋有64種著法,那么第...
我們知道渊鞋,著名的AlphaGo的基本組成是由策略網(wǎng)絡(luò)(Policy network)估值網(wǎng)絡(luò)(Value network)绰更,蒙特卡洛搜索樹(shù)(Mo...
強(qiáng)化學(xué)習(xí)的作用在于通過(guò)當(dāng)前的環(huán)境做出相應(yīng)的action瞧挤,得到最大的value如TensorFlow實(shí)戰(zhàn)中的例子: 在5x5的游戲棋盤(pán)中,藍(lán)色的代...