頭條
OpenAI 的運營智能體
https://links.tldrnewsletter.com/rrge8y
Operator是新推出的人工智能智能體,能通過與瀏覽器交互在網(wǎng)頁上執(zhí)行任務(wù),可進行打字摔癣、點擊和滾動等操作拂玻。它由計算機使用智能體(CUA)模型驅(qū)動僵蛛,利用GPT-4的視覺能力和強化學(xué)習(xí)在圖形界面中導(dǎo)航惠况,并執(zhí)行用戶定義的任務(wù),比如填寫表格或訂購食品雜貨承匣。
人工智能初創(chuàng)公司Anthropic推出帶引用源的API
https://www.anthropic.com/news/introducing-citations-api
Anthropic公司新的引用API可幫助人工智能模型生成帶有詳細且可驗證引用的回復(fù)蓖乘,提高輸出結(jié)果的可信度。
LUMA AI發(fā)布RAY2
Ray2是一個大規(guī)模視頻生成模型韧骗,在逼真視覺效果方面樹立了新標桿嘉抒,其動態(tài)自然連貫,事件序列符合邏輯袍暴。它基于Luma全新的多模態(tài)架構(gòu)進行訓(xùn)練些侍,計算量是Ray1的10倍。Ray2最初將向Dream Machine的付費用戶開放政模,可實現(xiàn)5秒的文本到視頻生成岗宣。
研究
優(yōu)化大語言模型(LLMs)的推理效率
https://arxiv.org/abs/2501.12570v1
一種新的微調(diào)方法在保持準確性的同時減少了推理模型的推理時間,提高了復(fù)雜任務(wù)的性能淋样。
預(yù)測遺傳表型
https://arxiv.org/abs/2410.01795v1
FREEFORM是一個利用大語言模型(LLMs)改進基因分型數(shù)據(jù)的特征選擇和工程的框架耗式。
多模態(tài)檢測模型的合成基準測試
https://opendatalab.github.io/LOKI/
LOKI是一個綜合基準測試,用于評估視覺語言模型(VLMs)在檢測新奇且具有挑戰(zhàn)性的物品方面的能力如何趁猴。
工程
INTEGURU(GitHub 倉庫)
https://github.com/Integuru-AI/Integuru
Integuru是一款人工智能代理刊咳,能對平臺內(nèi)部API進行逆向工程,生成Python集成代碼儡司。它通過分析瀏覽器網(wǎng)絡(luò)請求和依賴關(guān)系娱挨,自動執(zhí)行下載資源等操作。用戶可以輸入提示信息并提供.har文件捕犬,來創(chuàng)建所需的可執(zhí)行代碼让蕾。
合成數(shù)據(jù)引擎(GitHub 倉庫)
https://github.com/mostly-ai/mostlyai-engine
TabularARGN是一個靈活的框架,旨在處理混合型或听、多變量和序列數(shù)據(jù)集探孝。它支持諸如公平感知生成、填補以及對任意列子集進行條件生成等高級功能誉裆。
評估提煉的大語言模型(GitHub 倉庫)
https://github.com/aegis1863/llms-distillation-quantification
這個代碼庫提供了兩個互補指標來量化大語言模型蒸餾顿颅。
其他
VIRTUOSO SMALL擊敗PHI 4
https://huggingface.co/arcee-ai/Virtuoso-Small
Virtuoso的參數(shù)數(shù)量與新發(fā)布的Phi模型相同,在基準測試中得分很高足丢,而且在一些現(xiàn)實任務(wù)中似乎更有用粱腻,因為Phi模型的合成數(shù)據(jù)在這些任務(wù)中可能會出問題 。
Gemini App 接下來會有哪些新功能斩跌?
https://9to5google.com/2025/01/16/gemini-app-features/
谷歌正在改版Gemini應(yīng)用绍些,有重新設(shè)計的覆蓋界面、即將推出的2.0功能耀鸦,還有像針對移動端的深度研究這樣的新功能柬批。Astra項目將通過實時攝像頭和屏幕共享增強Gemini Live啸澡。其他新增整合功能包括支持Gemini擴展程序、兼容Wear OS氮帐,以及一個沉浸式旅行規(guī)劃工具嗅虏。
Snowflake稱其突破可將人工智能推理時間縮短超50%
https://siliconangle.com/2025/01/16/snowflake-claims-breakthrough-can-cut-ai-inferencing-times-50
Snowflake整合了自家人工智能研究部門的SwiftKV技術(shù),以優(yōu)化大語言模型推理上沐。這讓一些Llama模型的吞吐量提高了50%皮服,成本降低了多達75%。SwiftKV通過回收大語言模型各層的隱藏狀態(tài)來提高效率参咙,在不顯著損失準確性的情況下減少內(nèi)存使用和計算開銷龄广。這項技術(shù)將應(yīng)用于Snowflake的Cortex AI中的其他模型,提升摘要生成等任務(wù)以及實時人工智能應(yīng)用的性能蕴侧。
英偉達的人工智能非玩家角色簡直是一場噩夢
https://www.engadget.com/gaming/pc/nvidias-ai-npcs-are-a-nightmare-140313701.html
英偉達的ACE技術(shù)在2025年國際消費電子展上亮相择同,為《絕地求生》和《動物朋克》等游戲的人工智能驅(qū)動非玩家角色提供支持,但常常導(dǎo)致語音機械戈盈、互動平淡。
這款人工智能摩托車頭盔有望徹底消除盲區(qū)
https://newatlas.com/motorcycles/icr-ai-helmet/
智能顱骨頭盔公司推出了iC-R谆刨,這是一款集成人工智能的智能摩托車頭盔塘娶,能提升安全性和連接性。
從Gmail到Word痊夭,你的隱私設(shè)置和人工智能正進入一種新關(guān)系刁岸。
軟件中集成人工智能引發(fā)隱私擔憂,因為很多應(yīng)用程序可能在未經(jīng)明確同意的情況下使用個人數(shù)據(jù)來訓(xùn)練人工智能模型她我。