首個(gè)中文Stable Diffusion模型開源芬失,IDEA研究院封神榜團(tuán)隊(duì)開啟中文AI藝術(shù)時(shí)代

轉(zhuǎn)載自| 機(jī)器之心

生成內(nèi)容一直被視為AI領(lǐng)域中最具有挑戰(zhàn)性的能力朱沃,最近大火的 AI 繪畫背后,是 Stable Diffusion 模型的開源衰絮,催生了眾多 AI 繪畫的應(yīng)用,得益于 Stability AI 的開源精神,這一創(chuàng)變推動(dòng)了整個(gè)以英文為主的下游文生圖生態(tài)的蓬勃發(fā)展炼幔。

然而在國內(nèi),目前大部分團(tuán)隊(duì)主要是基于翻譯API + 英文 stable diffusion 模型進(jìn)行開發(fā)史简,但由于中英文之間所得存在文化差異導(dǎo)致遇到中文獨(dú)特的敘事和表達(dá)時(shí)江掩,這種模型就很難給出正確匹配的圖片內(nèi)容。因此乘瓤,IDEA 研究院認(rèn)知計(jì)算與自然語言研究中心(IDEA CCNL)開源了第一個(gè)中文版本的 stable diffusion 模型“太乙 Stable Diffusion”环形,讓中文的世界真正擁有具備中國文化內(nèi)核的 AIGC 模型。


[if !supportLists]l?[endif]太乙Stable Diffusion 純中文版本:https://huggingface.co/IDEA-CCNL/Taiyi-Stable-Diffusion-1B-Chinese-v0.1

[if !supportLists]l?[endif]太乙Stable Diffusion 中英雙語版本:https://huggingface.co/IDEA-CCNL/Taiyi-Stable-Diffusion-1B-Chinese-EN-v0.1


1

『中文運(yùn)筆衙傀,意境浮現(xiàn)』

君不見黃河之水天上來抬吟,唯美,油畫


滔滔江水统抬,連綿不絕火本,唯美,插畫


飛流直下三千尺聪建,唯美钙畔,插畫


長城,清晨金麸,朦朧擎析,唯美,插畫


夢回江南挥下,中國古代小鎮(zhèn)揍魂,唯美桨醋,插畫


云南苗家古寨,原始森林现斋,鳥語花香喜最,唯美,插畫


中國的未來城市庄蹋,科幻插畫


2

『中文vs英文的圖片生成』





3

『中文指導(dǎo)的特定風(fēng)格生成』

小橋流水人家瞬内,水彩

(Taiyi-Stable-Diffusion-1B-Chinese-EN-v0.1)


小橋流水人家,Van Gogh style

(Taiyi-Stable-Diffusion-1B-Chinese-EN-v0.1)?


4

『太乙系列文本生成圖像模型技術(shù)揭秘』

第一個(gè)開源中文CLIP 模型

2022 年 7 月限书,IDEA CCNL開源了第一個(gè)中文 CLIP 模型遂鹊,目前已經(jīng)有 4 個(gè)版本。


[if !supportLists]l?[endif]Taiyi-CLIP-Roberta-102M-Chinese:https://huggingface.co/IDEA-CCNL/Taiyi-CLIP-Roberta-102M-Chinese

[if !supportLists]l?[endif]Taiyi-CLIP-Roberta-large-326M-Chinese:https://huggingface.co/IDEA-CCNL/Taiyi-CLIP-Roberta-large-326M-Chinese

[if !supportLists]l?[endif]Taiyi-CLIP-RoBERTa-102M-ViT-L-Chinese:https://huggingface.co/IDEA-CCNL/Taiyi-CLIP-RoBERTa-102M-ViT-L-Chinese

[if !supportLists]l?[endif]Taiyi-CLIP-RoBERTa-326M-ViT-H-Chinese:https://huggingface.co/IDEA-CCNL/Taiyi-CLIP-RoBERTa-326M-ViT-H-Chinese


以Taiyi-CLIP-Roberta-large-326M-Chinese 為例蔗包,IDEA CCNL用中文語言模型替換了開源的英文 CLIP 中語言編碼器秉扑,在訓(xùn)練過程中凍結(jié)了視覺編碼器并且只微調(diào)這個(gè)中文語言模型,在 1 億級(jí)別的中文數(shù)據(jù)上訓(xùn)練了 24 個(gè) epoch调限,一共過了約 30 億中文圖文數(shù)據(jù)舟陆,得到了這個(gè)包含圖片信息的中文表征語言模型,為后續(xù)訓(xùn)練中文 Diffusion 相關(guān)的模型奠定了重要的基礎(chǔ)耻矮。

第一個(gè)開源中文Disco Diffusion 模型

2022 年 10 月秦躯,IDEA CCNL開源了第一個(gè)中文 Disco Diffusion 模型 Taiyi-Diffusion-532M-Nature-Chinese,該模型由 Katherine Crowson's 的無條件擴(kuò)散模型在自然風(fēng)景圖上微調(diào)而來裆装。結(jié)合Taiyi-CLIP-Roberta-large-326M-Chinese 可以實(shí)現(xiàn)中文生成各種風(fēng)格的風(fēng)景圖片踱承。

東臨碣石,以觀滄海哨免,水何澹澹茎活,山島竦峙:


第一個(gè)開源中文Stable Diffusion的模型

2022年 11 月,IDEA CCNL開源了第一個(gè)中文 Stable Diffusion 的模型和中英雙語 Stable Diffusion 模型琢唾。

[if !supportLists]·?[endif]

太乙Stable Diffusion純中文版本(Taiyi-Stable-Diffusion-1B-Chinese-v0.1)

[if !supportLists]·?[endif]

該模型利用已經(jīng)開源的太乙CLIP模型 (Taiyi-CLIP-RoBERTa-102M-ViT-L-Chinese) 替換了英文 stable-diffusion-v1-4 中的語言編碼器载荔,因?yàn)樘?CLIP 模型已經(jīng)具備了很強(qiáng)的中文圖文概念,所以直接凍結(jié)英文 stable diffusion 的生成模型部分采桃,在億級(jí)別的高質(zhì)量數(shù)據(jù)上微調(diào)語言編碼器懒熙,調(diào)整學(xué)習(xí)率等超參數(shù),將太乙 CLIP 模型理解的中文圖文概念與 stable diffusion 生成能力對(duì)齊普办。

[if !supportLists]·?[endif]

太乙Stable Diffusion中英雙語版本(Taiyi-Stable-Diffusion-1B-Chinese-EN-v0.1)

[if !supportLists]·?[endif]

不同于太乙Stable Diffusion純中文版本工扎,這個(gè)模型希望在支持中文的情況下,同時(shí)能保留 stable-diffusion-v1-4 的英文生成能力衔蹲。由于 stable-diffusion-v1-4 原有語言模型不具備太乙 CLIP 模型強(qiáng)大的中文圖文概念肢娘,IDEA CCNL希望在它的基礎(chǔ)上增加了中文數(shù)據(jù)訓(xùn)練,這里采取了兩階段的訓(xùn)練。第一階段也是凍住 stable-diffusion-v1-4 的生成模型部分蔬浙,在億級(jí)別的高質(zhì)量數(shù)據(jù)上微調(diào)語言編碼器,調(diào)整學(xué)習(xí)率等超參數(shù)贞远,訓(xùn)練語言模型中文部分的表征畴博。第二階段放開 stable-diffusion-v1-4 的生成模型部分,增強(qiáng)中文引導(dǎo)圖片生成的能力蓝仲,目前訓(xùn)練中的一個(gè) checkpoint 已取得不錯(cuò)的效果并進(jìn)行了開源俱病。

使用方法

如果需要進(jìn)行古詩場景、中文概念生成袱结,建議嘗試中文版本Taiyi-Stable-Diffusion-1B-Chinese-v0.1亮隙。如果需要一些通用場景和概念的生成,尤其是有中文混合英文需要垢夹,建議嘗試中英雙語版本 Taiyi-Stable-Diffusion-1B-Chinese-EN-v0.1溢吻。

中文版本:


中英雙語版本:


5

『太乙- 中文 Stable Diffusion 的未來』

目前在龐大的中國市場中,有將近10億的文化產(chǎn)業(yè)正在被 AIGC 沖擊并快速創(chuàng)新發(fā)展果元,也有更多的新機(jī)遇在裂變中產(chǎn)生促王。由于此前的 AIGC 模型還無法和特殊的中國文化背景相結(jié)合,致力于成為中文認(rèn)知智能的基礎(chǔ)設(shè)施的 IDEA 研究院認(rèn)知計(jì)算與自然語言中心而晒,希望通過推出太乙模型蝇狼,助力加快在 AIGC 全球市場化中中國的文化產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型的創(chuàng)新發(fā)展,促進(jìn)各個(gè)相關(guān)行業(yè)的升級(jí)倡怎。而太乙所在的封神榜預(yù)訓(xùn)練模型開源體系迅耘,已經(jīng)開源 80 個(gè)模型,覆蓋 AIGC监署、自然語言理解颤专、受控文本生成等多個(gè)領(lǐng)域,成為中文最大的預(yù)訓(xùn)練模型開源體系钠乏⊙基于封神榜模型的 GTS 模型生產(chǎn)平臺(tái),自動(dòng)生產(chǎn)的 1 億參數(shù)模型缓熟,擊敗眾多百億千億參數(shù)模型累魔,進(jìn)入 FewCLUE 榜單前三名,機(jī)器自動(dòng)化生成模型的能力達(dá)到了算法專家水平够滑,AI 生產(chǎn) AI 的時(shí)代正在到來垦写。

IDEA CCNL認(rèn)為,在 AIGC 中彰触,人的作用是更為重要的梯投,生成式 AI 應(yīng)悄無聲息地融入大眾生活中并更好地幫助拓展人類的想象力邊界。所以,與 AI 互動(dòng)生產(chǎn)的內(nèi)容分蓖,是幫助AIGC走向下一個(gè)生產(chǎn)力階段的關(guān)鍵尔艇。因此,IDEA CCNL除了基礎(chǔ)模型和基礎(chǔ)算法的研究之外么鹤,還在研究更精準(zhǔn)的文本生成和基中文于文本的交互式圖片編輯终娃。以太乙為核心的 AIGC 模型會(huì)持續(xù)更新和升級(jí),敬請(qǐng)期待蒸甜。

歡迎對(duì)太乙感興趣的小伙伴們聯(lián)系IDEA CCNL棠耕,一起共建中文 AIGC 的新世界。

封神榜相關(guān)鏈接:


封神榜總論文(中英雙語):https://arxiv.org/abs/2209.02970


封神榜主頁:https://github.com/IDEA-CCNL/Fengshenbang-LM(封神榜大模型)是 IDEA 研究院認(rèn)知計(jì)算與自然語言研究中心主導(dǎo)的大模型開源體系柠新,成為中文認(rèn)知智能的基礎(chǔ)設(shè)施窍荧。

huggingface地址:https://huggingface.co/IDEA-CCNL

封神榜doc: https://fengshenbang-doc.readthedocs.io/zh/latest/

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市恨憎,隨后出現(xiàn)的幾起案子蕊退,更是在濱河造成了極大的恐慌,老刑警劉巖憔恳,帶你破解...
    沈念sama閱讀 211,265評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件咕痛,死亡現(xiàn)場離奇詭異,居然都是意外死亡喇嘱,警方通過查閱死者的電腦和手機(jī)茉贡,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,078評(píng)論 2 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來者铜,“玉大人腔丧,你說我怎么就攤上這事∽餮蹋” “怎么了愉粤?”我有些...
    開封第一講書人閱讀 156,852評(píng)論 0 347
  • 文/不壞的土叔 我叫張陵,是天一觀的道長拿撩。 經(jīng)常有香客問我衣厘,道長,這世上最難降的妖魔是什么压恒? 我笑而不...
    開封第一講書人閱讀 56,408評(píng)論 1 283
  • 正文 為了忘掉前任影暴,我火速辦了婚禮,結(jié)果婚禮上探赫,老公的妹妹穿的比我還像新娘型宙。我一直安慰自己,他們只是感情好伦吠,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,445評(píng)論 5 384
  • 文/花漫 我一把揭開白布妆兑。 她就那樣靜靜地躺著魂拦,像睡著了一般。 火紅的嫁衣襯著肌膚如雪搁嗓。 梳的紋絲不亂的頭發(fā)上芯勘,一...
    開封第一講書人閱讀 49,772評(píng)論 1 290
  • 那天,我揣著相機(jī)與錄音腺逛,去河邊找鬼荷愕。 笑死,一個(gè)胖子當(dāng)著我的面吹牛屉来,可吹牛的內(nèi)容都是我干的路翻。 我是一名探鬼主播狈癞,決...
    沈念sama閱讀 38,921評(píng)論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼茄靠,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了蝶桶?” 一聲冷哼從身側(cè)響起慨绳,我...
    開封第一講書人閱讀 37,688評(píng)論 0 266
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎真竖,沒想到半個(gè)月后脐雪,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,130評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡恢共,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,467評(píng)論 2 325
  • 正文 我和宋清朗相戀三年战秋,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片讨韭。...
    茶點(diǎn)故事閱讀 38,617評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡脂信,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出透硝,到底是詐尸還是另有隱情狰闪,我是刑警寧澤,帶...
    沈念sama閱讀 34,276評(píng)論 4 329
  • 正文 年R本政府宣布濒生,位于F島的核電站埋泵,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏罪治。R本人自食惡果不足惜丽声,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,882評(píng)論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望觉义。 院中可真熱鬧恒序,春花似錦、人聲如沸谁撼。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,740評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至喊巍,卻和暖如春屠缭,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背崭参。 一陣腳步聲響...
    開封第一講書人閱讀 31,967評(píng)論 1 265
  • 我被黑心中介騙來泰國打工呵曹, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人何暮。 一個(gè)月前我還...
    沈念sama閱讀 46,315評(píng)論 2 360
  • 正文 我出身青樓奄喂,卻偏偏與公主長得像,于是被迫代替她去往敵國和親海洼。 傳聞我的和親對(duì)象是個(gè)殘疾皇子跨新,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,486評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容