妮妮撲火 - 簡書

發(fā)簡信

妮妮撲火

4
關(guān)注
1
粉絲
7
文章
7288

字?jǐn)?shù)
0

收獲喜歡
0

總資產(chǎn)

IP屬地：湖南

趙小鬧鬧

擴(kuò)散模型與GLIDE
OpenAI最近發(fā)布了DALL-E 2.可看作是CLIP+GLIDE.GLIDE是一個擴(kuò)散模型邪码，想弄清楚DALL-E 2,需要先了解擴(kuò)散模型及GLIDE的原理裕菠。 1.DDPM...

4327 2 1
第一個讀書筆記

多模態(tài)模型匯總-按需更新三
注意：時間逆序排列關(guān)鍵詞：ALBEF, CLIP, UniT, Vx2TEXT 多模態(tài)模型匯總-按需更新一：2019年發(fā)布的多模態(tài)模型匯總[https://www.jians...

11258 0 8
菜根小友

ALBEF，BLIP和BLIP2全系列工作串講
只用Transformer Encoder的一些方法 ViLT 為了把目標(biāo)檢測從視覺端拿掉因為預(yù)訓(xùn)練目標(biāo)檢測器去抽視覺特征時闭专，會面臨很多局限性奴潘。（a）以VSE為代表，文本端...

4028 0 1
blackmanba_084b

BERT(一) Transformer原理理解
一年前看了transformer影钉，時間有點(diǎn)久了画髓，現(xiàn)在也忘記很多，今天還是回顧一下平委，把知識點(diǎn)記下奈虾，方便日后回憶～ ??，自己做算法剛開始也是做了一段NLP方向廉赔，后來完全轉(zhuǎn)向了圖像...

9794 0 25 2
AI信仰者

cnn+lstm+attention對時序數(shù)據(jù)進(jìn)行預(yù)測
1肉微、摘要本文主要講解：bilstm-cnn-attention對時序數(shù)據(jù)進(jìn)行預(yù)測主要思路：對時序數(shù)據(jù)進(jìn)行分塊，生成三維時序數(shù)據(jù)塊建立模型蜡塌，卷積層-bilstm層-att...

5523 0 2
不懂不學(xué)不問

實現(xiàn)常見CNN網(wǎng)絡(luò)結(jié)構(gòu)中添加注意力(attention)機(jī)制
目前常見網(wǎng)絡(luò)結(jié)構(gòu)有許多碉纳，例如： LeNet：基于漸變的學(xué)習(xí)應(yīng)用于文檔識別 AlexNet：具有深卷積神經(jīng)網(wǎng)絡(luò)的ImageNet分類 VGGNet：用于大規(guī)模圖像識別的非常深的...

48000 1 12 1
Valar_Morghulis

FLIP：隨機(jī)屏蔽大部分圖像塊來擴(kuò)展CLIP
Scaling Language-Image Pre-training via Masking 原文：https://arxiv.org/abs/2212.00794 作者：...

847 0 1
平常心七七

生活有點(diǎn)緊張感，可能比較好
突然發(fā)現(xiàn)一件特別有意思的事兒馏艾，就是當(dāng)要做的事有點(diǎn)十萬火急的時候劳曹，人的潛力會很快的發(fā)揮出來，這件事就做的特別的快琅摩。如果不急呢铁孵？人做起來也不急，在人不急的狀態(tài)下房资，潛力就會小很多...

267 0 18