頭條
OpenAI 正在為 DALL-E 3 添加新水印
https://www.theverge.com/2024/2/6/24063954/ai-watermarks-dalle3-openai-content-credentials
OpenAI 正在按照內(nèi)容來源和真實(shí)性聯(lián)盟 (C2PA) 的標(biāo)準(zhǔn)鳞芙,在 DALL-E 3 生成的圖像中添加水印翻具,以包含不可見的元數(shù)據(jù)和用于來源驗(yàn)證的可見 CR 符號(hào)而芥。
Microsoft Copilot for Sales 和 Copilot for Service 現(xiàn)已全面上市
https://cloudblogs.microsoft.com/dynamics365/bdm/2024/02/01/microsoft-copilot-for-sales-and-copilot-for-service-are-now-generally-available
微軟人工智能驅(qū)動(dòng)的 Copilot for Sales and Service 現(xiàn)已全面上市羔味。 它與 Salesforce 等 CRM 系統(tǒng)集成叉抡,可提高銷售和服務(wù)專業(yè)人員的工作效率椰于。 這些工具可自動(dòng)執(zhí)行重復(fù)任務(wù)并直接在 Microsoft 365 應(yīng)用程序中提供見解淘菩,旨在改善客戶交互并簡化業(yè)務(wù)工作流程。 像埃維諾這樣的早期采用者表示霜幼,使用這些 AI 功能可以節(jié)省大量時(shí)間并提高客戶參與度嫩码。
研究
CLIP 在完全合成數(shù)據(jù)上進(jìn)行訓(xùn)練
https://arxiv.org/abs/2402.01832
刪除 LAION 等大規(guī)模數(shù)據(jù)集,以及有效的版權(quán)問題辛掠,使得訓(xùn)練大規(guī)模圖像模型變得具有挑戰(zhàn)性谢谦。 這項(xiàng)工作表明,可以使用 3000 萬張合成生成的圖像來訓(xùn)練強(qiáng)大的 CLIP 模型萝衩。
適用于移動(dòng)設(shè)備的微型語言模型
https://arxiv.org/abs/2402.02791v1
這項(xiàng)研究探討了如何通過關(guān)注參數(shù)較少的微型模型來使強(qiáng)大的語言模型更適合移動(dòng)設(shè)備。
多模式LLM中應(yīng)對(duì)幻覺的新工具
https://arxiv.org/abs/2402.03190v1
為了解決多模態(tài)大語言模型 (MLLM) 中幻覺的關(guān)鍵問題没咙,研究人員開發(fā)了 MHaluBench猩谊,這是一種評(píng)估幻覺檢測(cè)方法的新基準(zhǔn)。
工程
最先進(jìn)的背景去除(GitHub Repo)
https://huggingface.co/briaai/RMBG-1.4
Bria AI 開源(非商業(yè))其背景去除模型和工具祭刚,包括訓(xùn)練數(shù)據(jù)混合和性能指標(biāo)牌捷。 與其他開放模型相比,這是一個(gè)重大改進(jìn)涡驮。
使用 InteractiveVideo 創(chuàng)建您自己的視頻
https://invictus717.github.io/InteractiveVideo/
InteractiveVideo 引入了一種新穎的視頻制作方式暗甥,用戶可以與創(chuàng)作過程進(jìn)行動(dòng)態(tài)交互。 與傳統(tǒng)方法不同捉捅,這種用戶友好的框架允許使用文本撤防、圖像、繪畫甚至拖放進(jìn)行實(shí)時(shí)修改棒口。
AI 中的數(shù)學(xué)推理 (GitHub Repo)
https://github.com/deepseek-ai/deepseek-math
DeepSeekMath 7B 是專門為解決復(fù)雜數(shù)學(xué)問題而設(shè)計(jì)的語言模型寄月。 它接受了大量以數(shù)學(xué)為中心的內(nèi)容的培訓(xùn)辜膝。
雜七雜八
開源1.3B文本轉(zhuǎn)語音模型
https://huggingface.co/metavoiceio/metavoice-1B-v0.1
新的 Meta Voice 模型是一個(gè)小型而強(qiáng)大的文本轉(zhuǎn)語音模型,支持生成和語音克隆漾肮。
AGI 帶來的變革
https://dcgross.com/agitrades
像 GPT-5 這樣的先進(jìn)人工智能可能會(huì)對(duì)市場厂抖、房地產(chǎn)、勞動(dòng)力克懊、能源忱辅、國民經(jīng)濟(jì)、地緣政治和經(jīng)濟(jì)的通脹動(dòng)態(tài)產(chǎn)生重大影響谭溉,從而導(dǎo)致對(duì)價(jià)值累積墙懂、全球權(quán)力轉(zhuǎn)移以及就業(yè)和經(jīng)濟(jì)結(jié)構(gòu)變化的重新評(píng)估 。
技術(shù)工業(yè)革命
https://www.notboring.co/p/the-techno-industrial-revolution
隨著人工智能工具和業(yè)務(wù)用例變得更加復(fù)雜夜只,我們將開始看到越來越多的技術(shù)在現(xiàn)實(shí)世界中的應(yīng)用垒在。 審視這一機(jī)遇的一個(gè)視角是人工智能如何使流程更便宜、更高效扔亥,同時(shí)大幅提高利潤场躯。 這可能會(huì)開啟一種全新的做事方式,而以前由于利潤太薄而沒有經(jīng)濟(jì)意義旅挤。 本文探討了其中的一些示例踢关。
Fabric (GitHub Repo)
https://github.com/danielmiessler/fabric
一個(gè)使用人工智能增強(qiáng)人類能力的開源框架。