雙向模型只在encoder,不在decoder(前向預測)嗎绞灼?
類的繼承
github頁面上傳只有25M
類的寫法菜职,其中繼承自父類的構造方法寫作
super.__init__(**kwargs)
forward方法繼承自父類的forward參數(shù)寫法與內部碧磅,可以重寫
關于permute,view,resize(其中view只對連續(xù)變量起作用印蓖,功能相當于resize辽慕,permute相當于變量移動)
X=X.permute(idx(i),idx(j))
cat
cat((A,B),dim),dim=0,按行,dim=1,按列dim=0
注意sum的行操作導致只剩一行另伍,列操作導致只剩一列鼻百,如
np.sum(X,axis=0)則X.shape(x,y) to X.shape(1,y)