頭條
構(gòu)建 LLM 應(yīng)用程序
用 LLM 構(gòu)建看起來很酷的東西很容易,而讓這個(gè)看起來很酷的東西產(chǎn)生實(shí)際生產(chǎn)力卻有很多困難廉羔。許多挑戰(zhàn)來自自然語言的歧義偏形,以及如何存儲(chǔ)提示。 Chip Huyen 的這篇文章給出了他對(duì)此問題的深刻的見解,并給出了一個(gè)他覺得比較有前途的 LLM 應(yīng)用程序列表廓潜。
AWS 推出 Bedrock 服務(wù)
亞馬遜宣布了一項(xiàng)名為 Bedrock 的 AWS 新服務(wù)阱佛,允許客戶使用來自不同公司的基礎(chǔ)模型,例如anthropic 和stability AI耍缴。這個(gè)想法是采用開放模型加上客戶自己的書(只需將其指向 s3)砾肺。最近有很多關(guān)于數(shù)據(jù)隱私和安全的討論,有了這項(xiàng)服務(wù)防嗡,人們可以在自己的 AWS 基礎(chǔ)設(shè)施中運(yùn)行模型变汪,從隱私的角度來看這很有吸引力。亞馬遜還宣布了兩個(gè)新模型蚁趁,并允許個(gè)人開發(fā)者免費(fèi)訪問他們的代碼模型裙盾。
研究
DreamPose:通過Stable Diffusion實(shí)現(xiàn)時(shí)尚圖像到視頻的合成
DreamPose 是一種基于Stable Diffusion的圖像到視頻合成模型。給定人物和姿勢序列的輸入圖像,DreamPose 會(huì)按照姿勢序列合成輸入人物的逼真視頻闷煤。
兒童動(dòng)畫數(shù)據(jù)集
2021 年童芹,Meta 發(fā)布了一個(gè)很酷的演示,演示了使用 AI 為孩子們的圖畫制作動(dòng)畫±鹉茫現(xiàn)在他們已經(jīng)開源了包含 100k+ 個(gè)示例假褪、動(dòng)畫代碼、姿勢查找等的數(shù)據(jù)集近顷。它似乎獲得了版權(quán)許可生音,因此對(duì)那些有興趣在自動(dòng)化動(dòng)畫領(lǐng)域工作的人很有用。很高興看到這次Meta 在過濾數(shù)據(jù)集時(shí)采取了一些額外的努力來保護(hù)隱私窒升。
Vicuna:一款開源聊天機(jī)器人缀遍,以 90% 的 ChatGPT 質(zhì)量給 GPT-4 留下深刻印象
本文介紹了 Vicuna-13B,這是一種開源聊天機(jī)器人饱须,通過在用戶對(duì)話數(shù)據(jù)上 fine tuen LLaMA 得到域醇。 Vicuna-13B 在超過 90% 的情況下優(yōu)于 LLaMA 和 Stanford Alpaca 等其他模型,同時(shí)與 OpenAI ChatGPT 和 Google Bard 相比蓉媳,質(zhì)量達(dá)到 90% 他們以上譬挚。訓(xùn)練 Vicuna-13B 的費(fèi)用在 300 美元左右,代碼和演示是公開的酪呻,可用于非商業(yè)用途减宣。
工程
使用 VidStyleODE 進(jìn)行視頻編輯
VidStyleODE 結(jié)合了 StyleGAN 和 Neural-ODEs 用于分離視頻表示,支持外觀操作玩荠、運(yùn)動(dòng)操作漆腌、圖像動(dòng)畫和視頻插值/外推等應(yīng)用。
Continual Diffusion
文本到圖像的 diffusion models 在使用順序概念進(jìn)行定制化時(shí)會(huì)面臨災(zāi)難性的遺忘問題阶冈,導(dǎo)致對(duì)過去概念的圖像生成效果不佳闷尿。我們提出的 C-LoRA 方法通過持續(xù)自我調(diào)節(jié)的low-rank適應(yīng)克服了這個(gè)問題,在持續(xù)擴(kuò)散中優(yōu)于baseline女坑,并在圖像分類的 rehearsal-free 持續(xù)學(xué)習(xí)中設(shè)置了最新的最高標(biāo)準(zhǔn)填具。
動(dòng)態(tài)視頻的自適應(yīng)人像摳圖
Adam 是一種用于動(dòng)態(tài)視頻的自適應(yīng)遮罩框架,它通過同時(shí)區(qū)分前景和背景并捕獲各種非結(jié)構(gòu)化視頻中的 alpha 遮罩細(xì)節(jié)來解決無 trimap 方法的局限性堂飞。利用互連的編碼器-解碼器網(wǎng)絡(luò)和Transformer網(wǎng)絡(luò)灌旧,Adam 提高了消光真實(shí)感和時(shí)間相干性绑咱,為復(fù)雜的真實(shí)世界視頻實(shí)現(xiàn)了同類模型中的最佳的通用性绰筛。
雜七雜八
Chroma 的駐場黑客
在最近的籌款活動(dòng)之后,矢量數(shù)據(jù)庫初創(chuàng)公司 Chroma 希望聘請(qǐng)一名黑客描融,為期 3 個(gè)月铝噩,以構(gòu)建需要長期記憶的酷炫 AI 應(yīng)用程序。具體來說窿克,他們希望這位黑客能夠自我驅(qū)動(dòng)并構(gòu)建強(qiáng)大的應(yīng)用程序骏庸!考慮到在語言模型之上進(jìn)行 MVP 開發(fā)的便利性毛甲,我希望看到更多此類職位出現(xiàn)。
人工智能如何顛覆視頻游戲
這篇文章探討了人工智能顛覆視頻游戲行業(yè)的潛力具被,強(qiáng)調(diào)了機(jī)器學(xué)習(xí)和程序內(nèi)容生成方面的創(chuàng)新如何改變游戲開發(fā)玻募、用戶體驗(yàn)和該行業(yè)的整體經(jīng)濟(jì)。
人工智能不斷增加的人力和環(huán)境成本
本文認(rèn)為一姿,雖然生成式 AI 是一項(xiàng)令人興奮的發(fā)展七咧,但考慮其人力和環(huán)境成本至關(guān)重要,例如增加的能源消耗叮叹、碳排放以及侵蝕創(chuàng)意專業(yè)或利用人類生成內(nèi)容的風(fēng)險(xiǎn)艾栋。
Meta 開源了它的動(dòng)畫繪圖模型
Meta 開源了一個(gè) AI 項(xiàng)目,可以將用戶的涂鴉轉(zhuǎn)化為動(dòng)畫蛉顽,使開發(fā)人員和藝術(shù)家能夠使用該技術(shù)蝗砾。
歐洲隱私監(jiān)管機(jī)構(gòu)創(chuàng)建 ChatGPT 工作組
歐洲數(shù)據(jù)保護(hù)委員會(huì)將在周四的會(huì)議上討論人工智能政策,強(qiáng)調(diào)在歐盟解決數(shù)據(jù)隱私携冤、道德問題和圍繞人工智能的監(jiān)管框架越來越重要悼粮。
Midjourney AI 指南 (Notion Page)
使用 Midjourney 的指南。
EditAnything (GitHub Repo)
一個(gè)旨在編輯和生成圖像中的任何內(nèi)容的項(xiàng)目噪叙,由 Segment Anything矮锈、ControlNet、BLIP2 和 Stable Diffusion 組成睁蕾。