AI訓(xùn)練圖片不夠蔓搞?試試用AI生成技術(shù)豐富任意目標(biāo)的圖片集


在人工智能視覺檢測領(lǐng)域,我們知道随橘,要識別出某個目標(biāo)來喂分,比如識別出一個人在抽煙,都是需要大量有人抽煙的圖片素材來輸入給AI模型進行訓(xùn)練机蔗,讓它學(xué)習(xí)到相關(guān)的特征蒲祈,注意,這些特征并不是我們通常意義上可以用文字描述出來的特征蜒车,而是純感官上的直覺讳嘱,要賦予AI的也是這種直覺。

為了收集這類有目標(biāo)的圖片酿愧,以前往往需要付出很多的成本,比如采購相關(guān)的圖片視頻數(shù)據(jù)邀泉、在網(wǎng)上花時間搜索公開數(shù)據(jù)庫嬉挡、或者干脆再自己扮演角色來模仿動作并采集圖片。但汇恤,最近遇到了一個比較難收集素材的需求:檢測廚房里有老鼠出沒庞钢。芭比Q了,老鼠可不會配合人來擺拍因谎,都是人不再的時候才出動基括,而是啥時候出動也是個未知數(shù)呀,所以要采集到老鼠出沒的視頻很難的财岔。那就去網(wǎng)上搜索风皿?百度到的結(jié)果,與我想要的背景不太相符匠璧。那有沒有一種可以融入我們預(yù)設(shè)好的現(xiàn)實中的背景桐款,并更好的穩(wěn)定輸出目標(biāo)的方式呢?《生成式人工智能》一書中夷恍,提到了一個不錯的方式魔眨,是運動到AI質(zhì)檢領(lǐng)域,但是思路可以擴展到整個視覺分析領(lǐng)域酿雪。書中提到:

沒有很多缺陷圖片數(shù)據(jù)來訓(xùn)練遏暴,視覺模型就很難達到不錯的效果,AI質(zhì)檢也會存在漏檢率或者誤檢率偏高的情況指黎。對于這個問題朋凉,我們會采用一種樣本增強的技術(shù)來對缺陷庫進行補充。而傳統(tǒng)的樣本增強技術(shù)無非是對原始圖片進行各種方式的變換袋励,常見的有平移侥啤、旋轉(zhuǎn)当叭、縮放、翻轉(zhuǎn)等等盖灸,這種方式對于個別小樣本問題鮮有成效蚁鳖。隨著生成式AI的發(fā)展,出現(xiàn)了一種新的解決方案來應(yīng)對這個問題赁炎,即利用生成式AI模型對缺陷圖片進行生成醉箕,再利用生成出來的缺陷圖片進行視覺模型的訓(xùn)練。

在這個過程中徙垫,通過兩個步驟對缺陷圖片進行擴充讥裤。第一步,對于同一個缺陷類型姻报,設(shè)計不同缺陷位置的圖己英,可以通過人工構(gòu)建或平移等方式生成,我們把這些圖稱為種子圖吴旋。第二步是重點损肛,對于每一張這樣的種子圖,生成不同缺陷強度的圖片荣瑟,如圖4-16所示治拿,每一行從左到右,缺陷強度都逐步下降笆焰,各自生成6張不同強度的缺陷圖片劫谅,實際操作過程中可以生成更多。這樣一來嚷掠,缺陷庫就一下子豐富了捏检。


通過這種方式,模型對弱對比度缺陷的檢測能力顯著提高叠国,整體檢測性能也在顯著提升未檩,而這讓我們看到,生成式AI已經(jīng)在AI質(zhì)檢領(lǐng)域產(chǎn)生了積極的作用粟焊,也讓更多場景下的AI質(zhì)檢應(yīng)用成為可能冤狡。

書中提到的例子是運用到工業(yè)質(zhì)檢領(lǐng)域的,有些缺陷通常在生產(chǎn)中都希望盡量避免项棠,所以這相關(guān)的樣本和素材本來就少悲雳,要去模擬也未必能夠覆蓋全。通過AIGC的方式香追,倒是一個不錯的思路合瓢,這樣可以大量輸出基于指定背景的目標(biāo)添加,而且每次都可以生成不重樣的圖片透典。首先技術(shù)已日趨成熟晴楔,通過圖生圖工具顿苇,輸入背景圖片,然后可以在指定區(qū)域增加目標(biāo)税弃,最新的Midjourney纪岁,DALL-E3都帶有這種局部控制功能,今天我也拿國內(nèi)AIGC繪圖做得好且免費的商湯秒畫來試試效果则果。
  1. 首先點擊“添加參考圖”幔翰,上傳一張圖片,這里我放一張餐飲店廚房的背景圖西壮。

2.打開局部控制遗增,繪制區(qū)域,將在這里增加目標(biāo)款青。3.選擇基模型為“Artist v0.3.0 Beta”,因為最新的v0.3.5還不支持局部繪制做修。


4.輸入提示詞:一只家鼠,全身抡草,長尾巴缓待,四只腳,奔跑中渠牲。點擊生成。5.得到四張圖片步悠。如果不夠還可以一次生成8張圖片签杈,目前并不是每一張效果都好,文本引導(dǎo)強度 可以設(shè)置高些鼎兽,比如18.但還是要挑選下答姥,比如以下效果:


5.再結(jié)合我之前分享過的AIGC視頻工具:pika labs或gen-2,見文章:免費AI視頻生成神器pika labs:超越gen-2的驚艷效果對比谚咬,讓你的圖片躍動生動我們可以把生成的圖片輸入進去鹦付,得到動態(tài)視頻。

如此择卦,不管是圖片還是視頻敲长,我們都可以用AIGC的方式來大量生成了,再也不用擔(dān)心圖片量不夠了秉继。用AI的方式解決AI的問題祈噪,將是提高效率、擴展思路的好方法尚辑,值得嘗試和推廣辑鲤,大家要是有相關(guān)需求,歡迎找我咨詢杠茬,進一步詳聊月褥。


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末弛随,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子宁赤,更是在濱河造成了極大的恐慌舀透,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,546評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件礁击,死亡現(xiàn)場離奇詭異盐杂,居然都是意外死亡,警方通過查閱死者的電腦和手機哆窿,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,224評論 3 395
  • 文/潘曉璐 我一進店門链烈,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人挚躯,你說我怎么就攤上這事强衡。” “怎么了码荔?”我有些...
    開封第一講書人閱讀 164,911評論 0 354
  • 文/不壞的土叔 我叫張陵漩勤,是天一觀的道長。 經(jīng)常有香客問我缩搅,道長越败,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,737評論 1 294
  • 正文 為了忘掉前任硼瓣,我火速辦了婚禮究飞,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘堂鲤。我一直安慰自己亿傅,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,753評論 6 392
  • 文/花漫 我一把揭開白布瘟栖。 她就那樣靜靜地躺著葵擎,像睡著了一般。 火紅的嫁衣襯著肌膚如雪半哟。 梳的紋絲不亂的頭發(fā)上酬滤,一...
    開封第一講書人閱讀 51,598評論 1 305
  • 那天,我揣著相機與錄音镜沽,去河邊找鬼敏晤。 笑死,一個胖子當(dāng)著我的面吹牛缅茉,可吹牛的內(nèi)容都是我干的嘴脾。 我是一名探鬼主播,決...
    沈念sama閱讀 40,338評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼译打!你這毒婦竟也來了耗拓?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,249評論 0 276
  • 序言:老撾萬榮一對情侶失蹤奏司,失蹤者是張志新(化名)和其女友劉穎乔询,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體韵洋,經(jīng)...
    沈念sama閱讀 45,696評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡竿刁,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,888評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了搪缨。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片食拜。...
    茶點故事閱讀 40,013評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖副编,靈堂內(nèi)的尸體忽然破棺而出负甸,到底是詐尸還是另有隱情,我是刑警寧澤痹届,帶...
    沈念sama閱讀 35,731評論 5 346
  • 正文 年R本政府宣布呻待,位于F島的核電站,受9級特大地震影響队腐,放射性物質(zhì)發(fā)生泄漏蚕捉。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,348評論 3 330
  • 文/蒙蒙 一柴淘、第九天 我趴在偏房一處隱蔽的房頂上張望鱼冀。 院中可真熱鬧,春花似錦悠就、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,929評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至盹靴,卻和暖如春炸茧,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背稿静。 一陣腳步聲響...
    開封第一講書人閱讀 33,048評論 1 270
  • 我被黑心中介騙來泰國打工梭冠, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人改备。 一個月前我還...
    沈念sama閱讀 48,203評論 3 370
  • 正文 我出身青樓控漠,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子盐捷,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,960評論 2 355

推薦閱讀更多精彩內(nèi)容