零基礎(chǔ)學(xué)會AI繪畫Stable Diffusion

什么是Stable Diffusion

自從去年10月份Stable Diffusion開源以來,僅過了半年的時間,如今它已經(jīng)能夠創(chuàng)作出精美細(xì)致的二次元插畫盖溺,媲美真人的賽博Coser生真,以及具有獨(dú)特風(fēng)格的AI動畫。

無論你只是感興趣粘勒,還是想了解AI繪畫的潛力,又或者希望通過它為自媒體創(chuàng)建內(nèi)容屎即,甚至構(gòu)建一些工具站點(diǎn)庙睡,本篇教程都將幫助你實(shí)現(xiàn)這些目標(biāo)或者給你帶來一些思路。

0.jpg

這一技術(shù)的突破引起了許多人對AI繪畫領(lǐng)域的關(guān)注技俐。目前乘陪,AI繪畫仍然是一個相對新的技能分支,在網(wǎng)上的教學(xué)內(nèi)容相對有限虽另,主要以視頻教程為主暂刘。然而,視頻教程并不容易回顧和參考捂刺。

我打算寫一系列公開的文字教程谣拣,以最低的學(xué)習(xí)成本幫助你掌握這項(xiàng)技術(shù)募寨。即使你沒有任何美術(shù)或編程基礎(chǔ),只要你能夠使用鍵盤進(jìn)行輸入森缠,你就能夠輕松地參考我的教程拔鹰,并創(chuàng)作出屬于自己的AI繪畫作品。

在這個系列中贵涵,我將詳細(xì)介紹AI繪畫的基本原理列肢、應(yīng)用平臺的配置需求、安裝方法宾茂、軟件界面和基本操作步驟瓷马。我計劃撰寫大約15篇左右的文章。請關(guān)注我跨晴,你將能夠在相關(guān)合集中找到后續(xù)的教程欧聘。它們將帶領(lǐng)你進(jìn)一步深入探索文生圖、圖像生成的奧秘端盆,并通過綜合利用各種提示詞風(fēng)格模型和輔助工具來實(shí)現(xiàn)高質(zhì)量的繪畫作品怀骤。

原理解析

實(shí)際上,AI繪畫與人類的畫圖方式截然不同焕妙。它并不像人類那樣按照一定的步驟完成繪畫作品蒋伦,比如先草擬草圖,勾勒輪廓焚鹊,再上色痕届,最后進(jìn)行細(xì)節(jié)加工。相反寺旺,AI繪畫采用了一條人類從未設(shè)想過的路徑爷抓,即擴(kuò)散(diffusion)势决。通過深度學(xué)習(xí)的方式阻塑,它將許多不同的圖像轉(zhuǎn)換為抽象內(nèi)容,并逐漸開始理解這個擴(kuò)散的過程果复。每學(xué)習(xí)一張圖像陈莽,它會通過一些方法提取圖像中的信息特征,并與原圖建立聯(lián)系虽抄。

在實(shí)際的繪制過程中走搁,這一過程變得更加復(fù)雜。例如迈窟,圖像需要經(jīng)過潛在空間的壓縮私植,通過對比式的語言、文字和訓(xùn)練來實(shí)現(xiàn)內(nèi)容匹配车酣,然后借助對抗神經(jīng)網(wǎng)絡(luò)來提高學(xué)習(xí)的準(zhǔn)確性曲稼。隨著深入探索索绪,你將逐漸接觸到這些概念。如果你對這些術(shù)語不僅不感到乏味贫悄,反而感到興奮和神秘瑞驱,我們可以在單獨(dú)的一篇文章中對其展開解釋。然而窄坦,在此刻唤反,你只需記住抽象和擴(kuò)散這兩個概念,就可以開始接下來的學(xué)習(xí)了鸭津。

SD簡介

市場上的大部分主流AI繪畫產(chǎn)品基本上都使用類似的原理來生成圖像彤侍。

實(shí)際上,市場上有很多可用于AI繪畫的應(yīng)用程序逆趋,例如DALL-E,MidJourney,NovelAI等拥刻。但其中大部分都需要依賴云服務(wù)器來運(yùn)行,效率不高父泳,而且一些應(yīng)用還需要支付會員費(fèi)用以購買更多的使用額度般哼。然而,在2022年8月惠窄,出現(xiàn)了一款名為"Stable Diffusion"的應(yīng)用程序蒸眠,通過算法迭代,將AI繪畫的精細(xì)度提升到了一個新的水平杆融,并且可以在幾秒鐘內(nèi)完成圖像生成楞卡,而且可以在任何一臺配備民用級顯卡的電腦上運(yùn)行。在這里脾歇,我們將使用這款應(yīng)用程序進(jìn)行創(chuàng)作蒋腮。借助它的幫助,你可以輕松地繪制出各種風(fēng)格的作品藕各,比如動漫風(fēng)格的插畫池摧、立繪國風(fēng)水墨和逼真的照片級圖像。通過"LoRa" "ControlNet"等功能激况,SD還能夠?qū)崿F(xiàn)對美術(shù)風(fēng)格作彤、角色細(xì)節(jié)、姿勢和動作構(gòu)圖的精確控制乌逐。

除了以上介紹的特點(diǎn)之外竭讳,還有一個非常重要的因素,即該應(yīng)用是完全開源的浙踢。這意味著你可以在自己的電腦上部署整個程序绢慢,并且可以完全免費(fèi)地使用它進(jìn)行繪畫,而且沒有數(shù)量限制洛波。市場上大多數(shù)商業(yè)級的AI繪畫應(yīng)用都是基于Stable Diffusion進(jìn)行開發(fā)的胰舆。因此逻杖,如果你能掌握其根本邏輯,就能夠輕松地使用任何一個門檻比它更低的工具思瘟。

安裝及程序運(yùn)行

要下載Stable Diffusion這個軟件荸百,與大多數(shù)生產(chǎn)力工具不同的是,Stable Diffusion實(shí)際上并不是一個完整的軟件滨攻。它最初是以開源方式發(fā)布的够话,只是一段源代碼,對非專業(yè)人士來說可能難以理解光绕。

為了獲得更好的使用體驗(yàn)女嘲,你可以使用B站 秋葉aaaki 提供的啟動器。這里是他的視頻诞帐,https://www.bilibili.com/video/BV1iM4y1y7oA 欣尼,視頻簡介里就有大佬的整合包。特別感謝大佬為此付出的辛勤努力停蕉。

5.png

下載后愕鼓,通常需要解壓縮文件夾,然后將其放在你可以找到的位置慧起,這樣就算是完成了安裝菇晃。以秋葉安裝包為例,你可以點(diǎn)擊啟動器蚓挤,等待文件加載和更新完成磺送,然后按照指引點(diǎn)擊一鍵啟動。

![15.png](https://upload-images.jianshu.io/upload_images/5134986-dcdcb016255aefec.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

這會打開一個命令行窗口灿意,系統(tǒng)會在其中加載所需的各種文件估灿。加載完成后,瀏覽器會自動打開Web UI界面缤剧。如果沒有自動打開馅袁,請注意命令行窗口中“by running on local url”后面的地址,并在瀏覽器中手動打開該地址鞭执。


20.png

每次啟動程序時司顿,都需要重復(fù)上述過程。請注意兄纺,瀏覽器中的Web UI界面只是一個操作界面,而命令行窗口中的內(nèi)容才是程序的核心化漆,也是進(jìn)行繪畫的整個過程估脆。完成繪畫后,請確保關(guān)閉命令行窗口的運(yùn)行座云。

基本界面

當(dāng)你在瀏覽器中打開Web UI后疙赠,你就可以開始繪圖了付材。讓我們先了解一下Web UI界面。頂部的一整行標(biāo)簽對應(yīng)了Web UI的不同功能圃阳。

25.png

文生圖 圖生圖

我們在繪圖中最常用的是前兩個標(biāo)簽厌衔,即"文生圖"和"圖生圖",它們代表了兩種基本的繪圖方式捍岳。我會在接下來分別詳細(xì)介紹它們富寿,

附加功能

而"附加功能"標(biāo)簽主要用于對圖像進(jìn)行AI放大處理,可以生成更清晰的大圖锣夹。我們將在后續(xù)的教程討論页徐。

設(shè)置

點(diǎn)擊后面的"設(shè)置",你可以在此設(shè)置與繪圖過程相關(guān)的選項(xiàng)银萍,例如圖像保存路徑和采樣參數(shù)等变勇。在剛開始的階段,保持默認(rèn)設(shè)置一般不會出現(xiàn)問題贴唇。

擴(kuò)展

旁邊的"擴(kuò)展"菜單主要用于安裝和管理額外的插件搀绣。在后續(xù)的教程中,我們也會嘗試安裝插件戳气,并在你的Web UI界面中添加額外的標(biāo)簽豌熄,例如用于加載LoRa模型的"Additional Network"。我將在后面與你分享它的用途物咳。

作圖流程

現(xiàn)在锣险,讓我們動手做一張圖吧,完成后你就會對它有一個大致的了解览闰。請查看你的界面芯肤,

模型相關(guān)的基本概念

左上角有一個選項(xiàng)可以選擇"Stable Diffusion"模型。我們剛剛安裝的Web UI實(shí)際上只是一個執(zhí)行程序压鉴,但AI是從那里學(xué)習(xí)各種不同的繪畫風(fēng)格的呢崖咨?它借助于許多使用圖片素材訓(xùn)練出來的模型,通過閱讀大量圖片積累經(jīng)驗(yàn)油吭。不同的模型可以為你的作品帶來完全不同的畫面內(nèi)容和畫風(fēng)击蹲。我們將后續(xù)的教程進(jìn)一步科普模型的概念。

為了方便你后續(xù)的學(xué)習(xí)和探索婉宰,我為你準(zhǔn)備了一個基礎(chǔ)模型:"cutegirlmix4"歌豺,和一個Lora:“mix4”這,個模型是用抖音網(wǎng)紅訓(xùn)練的,生成的圖片不是任何特定的真人心包。私信我类咧,獲得這兩個模型的下載鏈接。在后面的教程中,我將系統(tǒng)地介紹一些獲取模型的方法痕惋。當(dāng)你的技巧足夠成熟后区宇,你還可以嘗試自己訓(xùn)練一些符合你需求的模型。

在下載完模型后值戳,請打開Web UI的根目錄下的"models"文件夾议谷。把chilloutmix_開頭的文件放到Stable-diffusion文件夾下。mix4放到Lora文件夾下(沒這個文件夾可以新建一個)堕虹。

30.png

讓我們加載一下這個chilloutmix_模型卧晓,點(diǎn)擊選擇chilloutmix_選項(xiàng),等待加載過程中命令行窗口中會顯示相應(yīng)的操作進(jìn)程鲫凶。加載完成后會有提示禀崖,并且選框中的模型名稱也會切換到chilloutmix_

35.png

文生圖

加載完成后螟炫,先打開"文生圖"選項(xiàng)波附。所謂的"文生圖"是指你輸入一段文字描述,AI會根據(jù)你的描述生成一幅圖像昼钻。這些輸入的描述文字就是"prompt"提示詞掸屡。你可以用自然語言嘗試描述一幅畫面,例如描述一個可愛的女孩然评,晚上仅财,在城市中,下雨碗淌。但請注意盏求,提示詞不支持中文。這時亿眠,你可以打開任何一個翻譯軟件碎罚,將你剛剛描述的話語翻譯成英文,然后復(fù)制粘貼到提示詞框中纳像。也可以直接復(fù)制我的提示詞

<pre class="md-fences md-end-block ty-contain-cm modeLoaded" spellcheck="false" lang="" cid="n46" mdtype="fences" style="box-sizing: border-box; overflow: visible; font-family: var(--monospace); font-size: 0.9em; display: block; break-inside: avoid; text-align: left; white-space: normal; background-image: inherit; background-position: inherit; background-size: inherit; background-repeat: inherit; background-attachment: inherit; background-origin: inherit; background-clip: inherit; background-color: rgb(248, 248, 248); position: relative !important; border: 1px solid rgb(231, 234, 237); border-radius: 3px; padding: 8px 4px 6px; margin-bottom: 15px; margin-top: 15px; width: inherit; color: rgb(51, 51, 51); font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: 400; letter-spacing: normal; orphans: 2; text-indent: 0px; text-transform: none; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration-thickness: initial; text-decoration-style: initial; text-decoration-color: initial;"><lora:mix4:0.5>,mix4,(8k, RAW photo, best quality, masterpiece:1.2), (realistic, photo-realistic:1.37),1girl,cute,cityscape, night, rain, wet, professional lighting, photon mapping, radiosity, physically-based rendering,</pre>

模型

但僅有提示詞是不夠的荆烈。為了讓AI能更準(zhǔn)確地理解我們的意圖,并發(fā)揮其能力竟趾,我們需要在提示詞后面加上一串更長的"魔咒"憔购。上面的提示詞中mix4,(8k, RAW photo, best quality, masterpiece:1.2), (realistic, photo-realistic:1.37)就屬于"魔咒“。

提示詞框分為正向提示詞和反向提示詞兩部分岔帽,分別用于控制你希望在畫面中出現(xiàn)的內(nèi)容和希望排除的內(nèi)容玫鸟。對于下面的反向提示詞,我也提供了一段"魔咒"供你使用山卦,將其復(fù)制到相應(yīng)位置可以避免一些畫面上的問題鞋邑。如果你想更詳細(xì)地了解這些所謂的"咒語"的含義诵次,以及其中各種花里胡哨的括號和數(shù)字的作用账蓉,后面我會詳細(xì)介紹枚碗。下面是我用的負(fù)面提示詞,你也可以直接復(fù)制铸本。

<pre class="md-fences md-end-block ty-contain-cm modeLoaded" spellcheck="false" lang="" cid="n50" mdtype="fences" style="box-sizing: border-box; overflow: visible; font-family: var(--monospace); font-size: 0.9em; display: block; break-inside: avoid; text-align: left; white-space: normal; background-image: inherit; background-position: inherit; background-size: inherit; background-repeat: inherit; background-attachment: inherit; background-origin: inherit; background-clip: inherit; background-color: rgb(248, 248, 248); position: relative !important; border: 1px solid rgb(231, 234, 237); border-radius: 3px; padding: 8px 4px 6px; margin-bottom: 15px; margin-top: 15px; width: inherit; color: rgb(51, 51, 51); font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: 400; letter-spacing: normal; orphans: 2; text-indent: 0px; text-transform: none; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration-thickness: initial; text-decoration-style: initial; text-decoration-color: initial;">paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, glans</pre>

尺寸規(guī)格

但僅有提示詞還不夠肮雨,你還需要通過下方一系列參數(shù)來定義圖像的尺寸規(guī)格和生成方式。這也是接下來的教程我們將討論的內(nèi)容箱玷。你可以參考我的設(shè)定來進(jìn)行設(shè)置怨规。

生成

設(shè)置完成后,點(diǎn)擊右上角的"生成"按鈕锡足,然后靜待程序加載片刻后波丰,你就會得到一幅描繪女孩在夜色下的圖片。這就是你使用AI繪制的作品了舶得。

40.png
45.png

修改提示詞

對于效果你滿意嗎掰烟?哦,你想讓女孩換一個動作沐批,你只需要在提示詞里加上looking back,,女孩就可以轉(zhuǎn)身看你了

50.png

這個小例子只是最最最最簡單的使用纫骑,但是英文本篇教程也比較長了,我將會把跟多的操作放在后續(xù)的教程中九孩。

希望這個小例子可以幫助你充分體會AI繪畫的奇妙之處和樂趣所在先馆。在不斷的探索和實(shí)踐中,你可能會像我一樣越來越感受到人工智能的智慧躺彬,因?yàn)樗_實(shí)可以聽懂你的話語并做出相應(yīng)的修改煤墙。在后面的教程中矫限,我將帶你探索通過提示詞和更多高級手段易稠,你甚至可以精確控制人物的發(fā)色拇泣、服飾攒发、畫面構(gòu)圖和風(fēng)景等俩檬。

保存

完成AI繪畫后义屏,你無需特別保存圖片构蹬,因?yàn)樗猩傻膱D片都會保存在你的本地文件夾中碎乃。

在Web UI的標(biāo)簽欄中犁河,有一個圖庫瀏覽器鳖枕,你可以按類別查看通過不同方式生成的圖像。如果你想導(dǎo)出圖片桨螺,就像在瀏覽器中保存一張圖片一樣宾符,只需右鍵點(diǎn)擊并選擇"另存為"即可。此外灭翔,你也可以在Web UI的根目錄中找到一個名為"output"的文件夾魏烫,所有的圖片都存儲在其中。"txt2img-images"是文生圖,"img2img-images"是圖生圖哄褒,復(fù)制出來也是一樣的稀蟋。圖庫瀏覽器還有許多高級功能,例如完整記錄了圖像生成的各種信息呐赡,你還可以快速打開已完成的圖像退客,并對其進(jìn)行局部重繪等。我們將在后面更詳細(xì)地討論這些特性链嘀。


55.png

配置要求

盡管Stable Fusion非常易于使用萌狂,但它仍然有一些配置要求。首先怀泊,它只能在Windows或Mac操作系統(tǒng)的電腦上運(yùn)行茫藏。不論是在Windows還是Mac電腦上,它的Web用戶界面的操作基本上是相似的霹琼。

其次务傲,它需要一張性能強(qiáng)大的獨(dú)立顯卡來提供繪制所需的計算能力。盡管理論上來說碧囊,任何一個品牌的顯卡都可以提供所需的計算能力树灶,但根據(jù)大多數(shù)用戶的交流經(jīng)驗(yàn),英偉達(dá)(NVIDIA)的顯卡在性能和穩(wěn)定性方面表現(xiàn)出色糯而。簡單來判斷的話天通,如果你擁有一臺可以流暢玩游戲的電腦,那么它應(yīng)該能夠滿足AI繪畫程序的運(yùn)行需求熄驼。

總結(jié)

AI繪畫本質(zhì)在于成為人的畫筆助手像寒,即由人提出創(chuàng)意方案,而AI負(fù)責(zé)完成具體的繪畫過程瓜贾。Stable Diffusion 能讓不具備繪畫經(jīng)驗(yàn)的人迅速達(dá)到初級甚至中級設(shè)計師的水準(zhǔn)诺祸,同時具備快速繪圖的能力(這是傳統(tǒng)設(shè)計師所不具備的優(yōu)勢)。在如今的互聯(lián)網(wǎng)時代祭芦,內(nèi)容自然會吸引流量筷笨,而流量往往意味著金錢。我計劃系統(tǒng)性地研究學(xué)習(xí)Stable Diffusion龟劲,并持續(xù)更新Stable Diffusion的教程胃夏、盈利思路以及商業(yè)模式。關(guān)注我昌跌,第一時間獲取第一手信息仰禀。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市蚕愤,隨后出現(xiàn)的幾起案子答恶,更是在濱河造成了極大的恐慌饺蚊,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,252評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件悬嗓,死亡現(xiàn)場離奇詭異污呼,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)烫扼,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,886評論 3 399
  • 文/潘曉璐 我一進(jìn)店門曙求,熙熙樓的掌柜王于貴愁眉苦臉地迎上來碍庵,“玉大人映企,你說我怎么就攤上這事【苍。” “怎么了堰氓?”我有些...
    開封第一講書人閱讀 168,814評論 0 361
  • 文/不壞的土叔 我叫張陵,是天一觀的道長苹享。 經(jīng)常有香客問我双絮,道長,這世上最難降的妖魔是什么得问? 我笑而不...
    開封第一講書人閱讀 59,869評論 1 299
  • 正文 為了忘掉前任囤攀,我火速辦了婚禮,結(jié)果婚禮上宫纬,老公的妹妹穿的比我還像新娘焚挠。我一直安慰自己,他們只是感情好漓骚,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,888評論 6 398
  • 文/花漫 我一把揭開白布蝌衔。 她就那樣靜靜地躺著,像睡著了一般蝌蹂。 火紅的嫁衣襯著肌膚如雪噩斟。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,475評論 1 312
  • 那天孤个,我揣著相機(jī)與錄音剃允,去河邊找鬼。 笑死齐鲤,一個胖子當(dāng)著我的面吹牛斥废,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播佳遂,決...
    沈念sama閱讀 41,010評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼营袜,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了丑罪?” 一聲冷哼從身側(cè)響起荚板,我...
    開封第一講書人閱讀 39,924評論 0 277
  • 序言:老撾萬榮一對情侶失蹤凤壁,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后跪另,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體拧抖,經(jīng)...
    沈念sama閱讀 46,469評論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,552評論 3 342
  • 正文 我和宋清朗相戀三年免绿,在試婚紗的時候發(fā)現(xiàn)自己被綠了唧席。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,680評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡嘲驾,死狀恐怖淌哟,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情辽故,我是刑警寧澤徒仓,帶...
    沈念sama閱讀 36,362評論 5 351
  • 正文 年R本政府宣布,位于F島的核電站誊垢,受9級特大地震影響掉弛,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜喂走,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,037評論 3 335
  • 文/蒙蒙 一殃饿、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧芋肠,春花似錦乎芳、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,519評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至碘裕,卻和暖如春携取,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背帮孔。 一陣腳步聲響...
    開封第一講書人閱讀 33,621評論 1 274
  • 我被黑心中介騙來泰國打工雷滋, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人文兢。 一個月前我還...
    沈念sama閱讀 49,099評論 3 378
  • 正文 我出身青樓晤斩,卻偏偏與公主長得像,于是被迫代替她去往敵國和親姆坚。 傳聞我的和親對象是個殘疾皇子澳泵,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,691評論 2 361

推薦閱讀更多精彩內(nèi)容