我們需要確保隨機(jī)梯度下降是收斂的,我們需要選取合適的α娜汁。 我們需要每多少個(gè)樣本,計(jì)算一次代價(jià)函數(shù)平均值兄朋,然后看它是否收斂掐禁。我們可以通過此來調(diào)整學(xué)習(xí)率α。