1
0
寫了 2767 字,被 5 人關(guān)注,獲得了 2 個(gè)喜歡
存在的問(wèn)題:在模型訓(xùn)練過(guò)程中,雖然增加minibatchsize能夠提高模型的泛化能力,并且加快模型的收斂胀滚。但是當(dāng)超過(guò)8k的時(shí)候,會(huì)出現(xiàn)難以優(yōu)化的情況,并且泛化能力也大大下降...