zyq01 - 簡書

zyq01

IP屬地：北京

transformer語言模型原理解讀
一纺座、簡介基于假設(shè)：一個詞在句子中的意思竞阐，與上下文（語境）有關(guān)懦鼠。與哪些詞有關(guān)呢爹梁？Transformer就是：利用點積將句子中所有詞的影響當(dāng)成權(quán)重...

0.4 4073 1 4 1
Dataloader重要參數(shù)與內(nèi)部機制
@[TOC] 一、pytorch數(shù)據(jù)輸入 Dataset負(fù)責(zé)生產(chǎn)數(shù)據(jù)火的，DataLoader負(fù)責(zé)數(shù)據(jù)的分批（batch_size）猴贰、采樣(samp...

11989 0 1

google-research/bert官方代碼中的坑_run_classifier_效果很差原因
[[TOC好像還不支持]] 簡介 bert官方代碼google-research/bert中有很多很強的設(shè)定，稍有改動就會導(dǎo)致結(jié)果很差怜庸。此文檔簡...

2892 0 1