斯文攸歸 - 簡書

斯文攸歸

IP屬地：北京

Hunyuan-Video
簡介 CausalConv3D VAE尔觉，降采樣倍數(shù)為時(shí)間上4倍右蒲，空間上8x8倍擴(kuò)散模型：FLUX的結(jié)構(gòu)（Dual-Stream DiT Blc...

68 0 0
排序算法
排序算法大的分類有兩類：一類是比較類排序，通過比較來確定元素間的相對次序柠新，由于其時(shí)間復(fù)雜度不能突破O(nlogn)，因此也稱為非線性時(shí)間比較類...

67 0 1

如題
當(dāng)這一天真的來臨的時(shí)候赂苗，我很淡然帆离，好像心里早已經(jīng)接受，又很無措僧叉，似乎還沒做好準(zhǔn)備奕枝。時(shí)光只解催人老，人生匆匆啊瓶堕，路上是訴不盡的別離隘道，您不是第一個(gè)離...

1.7 87 0 4
IP-Adapter
https://github.com/tencent-ailab/IP-Adapter.git 如何更精準(zhǔn)地控制SD生成圖片的結(jié)果，不需要復(fù)雜的...

1061 0 0
Imagen：Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding
相較于之前一些基于擴(kuò)散模型的text2image方法郎笆，Imagen一個(gè)基本的認(rèn)識是：用更大的在純文本上訓(xùn)練的自然語言模型（T5）作為text ...

1679 0 1
DALL-E-2:Hierarchical Text-Conditional Image Generation with CLIP Latents
OpenAI Text2Image based on CLIP and Diffusion Model 虛線以上部分表示CLIP的訓(xùn)練過程谭梗，預(yù)訓(xùn)...

1528 0 1
GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models
擴(kuò)散模型(diffusion model)可以生成高質(zhì)量的合成圖像，尤其當(dāng)基于某種條件引導(dǎo)(guidence)時(shí)宛蚓，可以用多樣性換保真性激捏。針對基于...

3255 0 0

CLIP:Learning Transferable Visual Models From Natural Language Supervision
一般的計(jì)算機(jī)視覺方法總是在一個(gè)類別已知且固定的數(shù)據(jù)集上去訓(xùn)練和預(yù)測，這限制了模型的泛化能力苍息，而直接從文本來學(xué)習(xí)圖像是有有前景的缩幸，因?yàn)槔昧烁鼜V泛...

0.1 558 0 2
SimSwap
上交+騰訊支持圖片視頻任意身份換臉(finetuning free);并且保持臉部屬性如表情/姿態(tài)/光照等。換臉的方法一般分兩類： Sour...

2139 0 0