DataLoader: 數(shù)據(jù)的迭代器重挑,數(shù)據(jù)是model直接可用的格式。分成一個(gè)個(gè)的batch帽馋。
DataSet : 根據(jù)索引闲坎,拿到數(shù)據(jù)后。對(duì)數(shù)據(jù)進(jìn)行 自定義的處理茬斧。具體處理邏輯腰懂,通過(guò) 定義 collate_fn調(diào)用的函數(shù)實(shí)現(xiàn)。將一個(gè)batch的數(shù)據(jù)進(jìn)行合并操作项秉。
? ? ? ? ? ? ? ? 本身還負(fù)責(zé)加載初始數(shù)據(jù)绣溜。
Sampler : 選取一部分 索引 ÷Π可自定義怖喻,可選擇pytorch中已經(jīng)實(shí)現(xiàn)的sampler底哗。如果自定義了sampler,那么shuffle需要設(shè)置為False锚沸。
參考:https://cloud.tencent.com/developer/article/1486791