頭條
Anthropic 為 Claude 添加系統(tǒng)提示
https://docs.anthropic.com/en/release-notes/system-prompts
Anthropic 為所有模型添加了系統(tǒng)提示并更新了日期笙各。
Salesforce 推出文本轉視頻生成
https://www.arxiv.org/abs/2408.12590
Salesforce 推出了 xGen-VideoSyn-1,這是一種文本轉視頻 (T2V) 模型,可根據(jù)文本描述生成逼真的場景。該模型使用視頻變分自動編碼器 (VidVAE) 來壓縮視頻數(shù)據(jù)汹忠,從而降低計算需求,并使用擴散變換器 (DiT) 來提高時間一致性和泛化能力。
研究
無限數(shù)據(jù)集中心
https://huggingface.co/spaces/infinite-dataset-hub/infinite-dataset-hub
由 phi-3-mini 提供支持飞蛹,該空間使用稀有提示來生成有關任何主題的數(shù)據(jù)漾肮。它不是最準確的厂抖,但它令人著迷且功能強大。
Neural 資產
https://neural-assets-paper.github.io/
神經網絡可以通過調節(jié)每個對象的表示來表示和操縱 2D 場景中的 3D 對象克懊。這項工作很可能是 3D 對象解開的圣杯忱辅。
文本引導的 3D 動畫
https://arxiv.org/abs/2408.12885v1
研究人員引入了一種名為 T3M 的新方法,用于創(chuàng)建由文本輸入引導的 3D 動畫谭溉。與以前僅依賴語音的技術不同墙懂,T3M 可以實現(xiàn)更準確、可定制的動畫扮念,使其成為虛擬現(xiàn)實损搬、游戲和電影制作的寶貴工具。
工程
BiRefNet
https://github.com/ZhengPeng7/BiRefNet
使用雙參考分割去除背景的最新技術柜与。
RB 調制
https://github.com/google/RB-Modulation/
Google 有一種非常新穎的方法來個性化擴散模型巧勤,其性能優(yōu)于許多常用方法。它可用于 PyTorch弄匕,經過一些輕微的修改即可與 Flux 配合使用颅悉。
使用視覺語言模型進行圖像編輯
https://github.com/a-new-b/flex_edit
FlexEdit 是一種圖像編輯方法,它將視覺大型語言模型 (VLLM) 與自由形狀蒙版相結合迁匠,以便根據(jù)語言指令進行更精確的編輯剩瓶。
雜七雜八
AI 公司正從創(chuàng)造神轉向制造產品
https://www.aisnakeoil.com/p/ai-companies-are-pivoting-from-creating
AI 公司正在努力尋找適合 LLM 的產品市場,這導致了大量投資城丧,但商業(yè)成功卻有限延曙。阻礙 AI 產品可行性的五個主要挑戰(zhàn)是成本、可靠性亡哄、隱私問題枝缔、安全和保障問題以及用戶界面限制』瞧剑克服這些社會技術問題對于 AI 在消費產品中的有效集成和廣泛采用至關重要魂仍。
D-ID 推出了一款包括語音克隆和唇形同步的 AI 視頻翻譯工具
D-ID 推出了一項 AI 視頻翻譯功能,可以克隆說話者的聲音并同步翻譯視頻中的唇形動作拣挪。它支持 30 種語言擦酌,旨在降低全球活動的本地化成本。它可供訂閱者使用菠劝,計劃起價為每年 56 美元赊舶。該技術與 YouTube 和 Vimeo 等公司提供的類似產品以及眾多 AI 語音克隆工具競爭。
我的朋友 Claude
https://trevorklee.substack.com/p/my-friend-claude
由于工作需求增加,作者依靠 Anthropic 的LLM Claude 進行技術寫作笼平,這凸顯了LLM 在專業(yè)環(huán)境中日益增長的實用性园骆。盡管需要專家驗證,但 Claude 的幫助已被證明具有成本效益寓调,并強調了面對人工智能驅動的自動化的細分專家的快速變化的前景锌唾。隨著 Claude 等人工智能工具越來越多地融入日常任務,作者反思了知識工作的潛在轉變夺英。
ShellMate AI
https://www.producthunt.com/posts/shellmate-ai
由 OpenAI 提供支持的 Mac 終端生產力工具晌涕。
Phi 3.5 的快速微調
https://colab.research.google.com/drive/1lN6hPQveB_mHSnTOYifygFcrO8C1bxq4
使用 Unsloth 快速微調新 Microsoft 模型的腳本。
Vyond 推動 AI 視頻的企業(yè)時代
https://www.vyond.com/blog/vyond-new-all-in-one-2024-release/
Vyond 是一個針對企業(yè)用例的 AI 視頻創(chuàng)建平臺痛悯。