MadCoder - 簡(jiǎn)書

IP屬地：內(nèi)蒙古

Optimizer and BN
Deep Learning Optimizers optimizers 通用參數(shù) 待優(yōu)化參數(shù)：, 目標(biāo)函數(shù)：, 初始learning rate：...

530 0 0
Bag of tricks for Image Classification with CNN
Large-batch training Linear scaling learning ratee.g. ResNet-50 SGD 256 ...

359 0 0

Models in CV
Backbone Models 1. Inception Version 1 模型特點(diǎn)：采用不同大小的卷積核意味著不同大小的感受野，最后拼接...

338 0 0
Levenberg-Maquardt Algorithm 推導(dǎo)
前置知識(shí) 1. 牛頓法作用：1. 求根 2.求極值求根目標(biāo): 求解的根計(jì)算穿過(guò)初始點(diǎn) 并且斜率為的直線與x軸的交點(diǎn)可得? ...

3792 2 1
Distilling the Knowledge in a Neural Network
貢獻(xiàn) 提出知識(shí)蒸餾（Knowledge Distillation）方法榴芳，從大模型中學(xué)習(xí)到的知識(shí)中學(xué)習(xí)有用信息來(lái)訓(xùn)練小模型佛呻，在保證性能的前提...

1307 0 0