![240](https://upload.jianshu.io/users/upload_avatars/14913526/9298fca4-c853-41f8-b193-393a4b7c530c.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
transformer decoder里的K和V為什么要用encoder輸出的K和Vimage.pngIn "encoder-decoder a...
2049 統(tǒng)計(jì)最高分的節(jié)點(diǎn)數(shù)目[https://leetcode-cn.com/problems/count-nodes-with-the-hi...
attention mask如何使用 attention_mask List[int] 0-mask,1-attentionforward(,a...
快速加 快速冪 二分圖的最大匹配 一次A掉
雙向模型只在encoder锻离,不在decoder(前向預(yù)測)嗎凡简?類的繼承g(shù)ithub頁面上傳只有25M類的寫法贬墩,其中繼承自父類的構(gòu)造方法寫作 fo...
1.9.10號每日一題,好的優(yōu)化時間養(yǎng)成的好習(xí)慣拇惋,使得沒有被暴力卡住 一個班級里有 n 個學(xué)生周偎,編號為 0 到 n - 1 。每個學(xué)生會依次回答...
思想沒錯撑帖,缺點(diǎn)是沒有理解題意+數(shù)據(jù)結(jié)構(gòu)模糊+沒有預(yù)處理+取模和去除多余數(shù) 給你一個整數(shù)數(shù)組 nums 蓉坎。如果 nums 的一個子集中,所有元素的...
動態(tài)規(guī)劃胡嘿,僅僅與上一狀態(tài)有關(guān)的蛉艾,可以滾動數(shù)組 滾動數(shù)組時,一般生成一個新的數(shù)組衷敌,當(dāng)作新數(shù)組勿侯,因?yàn)橛洃洈?shù)組需要在外部設(shè)置全局變量去記憶,占用大量內(nèi)...
代碼寫的亂缴罗,更容易被卡 思路:模擬棧助琐,先把乘除計(jì)算完(合成數(shù)字),再算加減(需要做個逆序)超出時間限制因?yàn)槭褂胹um(op_stack)面氓,所以要...