大圣神通 - 簡書

0
關(guān)注
3
粉絲
19
文章
16599

字?jǐn)?shù)
6

收獲喜歡
1

總資產(chǎn)

IP屬地：浙江

大圣神通

QwenVL
Github: GitHub - QwenLM/Qwen-VL: The official repo of Qwen-VL (通義千問-VL) chat & pretrain...

543 0 0
大圣神通

InternVL 系列調(diào)研
MLLM模型基本范式： 1.主要調(diào)研InternVL 2.0-40B InternVL2-40B: 總計 40.07B; Vit: 5.54B; 143.17M；LLM: ...

828 1 1

大圣神通

筆記
1. BPE分詞 a). BytePairEncoding(BPE):字節(jié)對編碼，核心思想是將最常出現(xiàn)的子詞對合并，直到詞匯表達(dá)到預(yù)定的大小時停止。首先預(yù)分詞器初步切分，分詞...

83 0 0
大圣神通

大模型相關(guān)計劃資料匯總
簡單計劃： megatron deepspeed 代碼閱讀筆記（20230925更新中） - 知乎 (zhihu.com)[https://zhuanlan.zhihu.co...

86 0 0
大圣神通

Logistic 回歸(mnist數(shù)據(jù)集)

705 0 0
大圣神通

Ch03-02. 使用Tensorboardx可視化
tensorboard安裝pip install tensorboard然后安裝tensorboradx~~ pip install tensorboardx~~ pytor...

420 0 0
大圣神通

Ch03-01.使用Visdom進(jìn)行可視化(Pytorch入門)
Visdom的安裝很簡單，直接使用命令pip install visdom安裝即可证芭。在安裝完成后，使用命令python -m visdom.server 在本地啟動服務(wù)器担映，...

657 0 0

大圣神通

FLAT: 屠榜NER
Paper Name: FLAT: Chinese NER Using Flat-Lattice Transformer論文鏈接https://arxiv.org/pdf/2...

367 0 0
大圣神通

文檔智能理解相關(guān)
文檔智能理解：通用文檔預(yù)訓(xùn)練模型與數(shù)據(jù)集[https://www.sohu.com/a/434296274_787107]附錄 [1 ]LayoutLM 論文：https:/...

745 0 0
大圣神通

Ch02-02.數(shù)據(jù)加載和預(yù)處理(Pytorch基礎(chǔ))
Pytorch通過torch.utils.data對一般常用數(shù)據(jù)加載進(jìn)行封裝废士，可以容易的實(shí)現(xiàn)多線程數(shù)據(jù)預(yù)讀和批量加載，并且torchvision已經(jīng)預(yù)先實(shí)現(xiàn)了常用圖像數(shù)據(jù)集合...

247 0 0
大圣神通

常用深度學(xué)習(xí)模型壓縮和加速
模型壓縮和加速是兩個不同的話題蝇完，有時候壓縮并不一定能帶來加速的效果．壓縮重點(diǎn)在于較少網(wǎng)絡(luò)參數(shù)量官硝，加速則側(cè)重在降低計算復(fù)雜度，提升并行能力．模型壓縮和優(yōu)化可以從主要三個層次上來...

862 0 1
大圣神通

2020-10-03各種LossFunction匯總
１. Softmax loss:鼓勵目標(biāo)類別的輸出比其他要大短蜕，但是從其公式圖像上可以看出氢架，Softmax鼓勵不同類別特征分開，但是并不鼓勵分開很多朋魔，所以會出現(xiàn)如下圖情況岖研， s...

736 0 0

大圣神通

Ch02-01.神經(jīng)網(wǎng)絡(luò)包nn和優(yōu)化器optm(Pytorch基礎(chǔ))
pytorch 官方api[https://pytorch-cn.readthedocs.io/zh/latest/package_references/torch-nn/#...

329 0 0
大圣神通

Ch01-04.數(shù)據(jù)并行(Pytorch入門)
這一講主要介紹如何使用DataParallel使用多GPU， 1. 導(dǎo)入和參數(shù) Device device = torch.device('cuda:0' if torch....

284 0 0
大圣神通

Ch01-03.構(gòu)建神經(jīng)網(wǎng)絡(luò)(Pytorch入門)
使用torch.nn包來構(gòu)建神經(jīng)網(wǎng)絡(luò)上一講是autograd,nn包以來autograd包來定義模型并求導(dǎo)警检，一個nn.Module包含各個層和一個forward(input)...

282 0 0
大圣神通

Ch01-02.自動求導(dǎo)(Pytorch入門)
自動求導(dǎo)機(jī)制 PyTorch 中所有神經(jīng)網(wǎng)絡(luò)的核心是 autograd 包孙援。我們先簡單介紹一下這個包，然后訓(xùn)練第一個簡單的神經(jīng)網(wǎng)絡(luò)扇雕。autograd包為張量上的所有操作提供...

285 0 0
大圣神通

Ch01-01.Tensor操作(Pytorch入門)
1. 以_結(jié)尾操作 2. .size()和.view()方法類似與numpy里面的.shape和.reshape() 3.以結(jié)尾的操作都會用結(jié)果替換原來變量赃磨，例如x.cop...

150 0 1

大圣神通

2020-08-21 GPT3簡介
GPT-1 論文 Improving Language Understanding by Generative Pre-Training(2018) GPT-2 論文 Lan...

530 0 1
大圣神通

(一)Transformer及其attention詳解
GPT-2是基于海量數(shù)據(jù)集上訓(xùn)練的基于Transformer的巨大模型。本文探索GPT-2模型架構(gòu)洼裤，重點(diǎn)闡述其中關(guān)鍵的自注意力(self-attention)層。 Part1...

3236 0 2
大圣神通

暫無個人介紹

亚洲A日韩AV无卡,小受高潮白浆痉挛av免费观看,成人AV无码久久久久不卡网站,国产AV日韩精品