經(jīng)常被問一個問題坦胶,訓(xùn)練一個模型需要多少數(shù)據(jù)晴楔?這個問題不能一概而論滥崩,
- 取決于問題的復(fù)雜度
- 取決于算法的復(fù)雜度
一個簡單的解決方法是可以看看類似問題別人用了多少數(shù)據(jù)。但是如果問題比較特殊蜂科,可以做一個scalability的測試,看模型在不同大小數(shù)據(jù)集上的表現(xiàn)导匣,根據(jù)這個測試贡定,可以大致確定一個合理的數(shù)據(jù)需求。(不過這也和數(shù)據(jù)是否具有多樣性有關(guān))
更具體的分析可以參考這篇文章 https://machinelearningmastery.com/much-training-data-required-machine-learning/ 分析得非常好蚓耽。