頭條
AI 教母李飛飛對計算機視覺的遠見
https://spectrum.ieee.org/fei-fei-li-world-labs
李飛飛創(chuàng)辦了 World Labs疙赠,專注于通過創(chuàng)建交互式 3D 場景來開發(fā) AI 的空間智能付材。該計劃旨在提高 3D 環(huán)境中的機器感知和推理能力,這對于機器人圃阳、虛擬現(xiàn)實和增強現(xiàn)實的應用至關重要厌衔。李飛飛強調,解決 3D 智能問題對于增強 AI 的能力至關重要捍岳。
Liquid AI 籌集 2.5 億美元
https://www.liquid.ai/blog/we-raised-250m-to-scale-capable-and-efficient-general-purpose-ai
Liquid AI 已籌集大量資金富寿,以繼續(xù)訓練其高效、通用锣夹、液體風格的基礎模型页徐。
OpenAI 中的"項目"
https://www.youtube.com/watch?v=FcB97h3vrzk&utm_source=tldrai
OpenAI 推出了“項目”,這是一種組織聊天和對話的新方式银萍。
研究
Phi-4
https://arxiv.org/abs/2412.08905
微軟的合成訓練語言模型在許多具有挑戰(zhàn)性的基準測試中表現(xiàn)出色变勇。權重將于本周公布。有趣的是砖顷,它證實了“中期訓練”可用于上下文長度擴展的懷疑贰锁。
BLT:無標記語言模型訓練
https://ai.meta.com/research/publications/byte-latent-transformer-patches-scale-better-than-tokens/
Meta 發(fā)布了 Byte Latent Transformer 的詳細信息和訓練代碼,它使用學習到的補丁而不是標記進行訓練滤蝠,從本質上消除了語言建模中具有挑戰(zhàn)性的部分豌熄。重要的是,它發(fā)現(xiàn)其范式可以更好地擴展到小型 Llama 2 尺寸模型物咳。
通過模塊化設計實現(xiàn)高效的場景理解
https://arxiv.org/abs/2412.09530
一種新的模塊化框架锣险,通過將任務分解為專門的模塊來增強場景理解,從而實現(xiàn)效率并提高復雜環(huán)境中的可解釋性览闰。
工程
DeepSeek VL2
https://github.com/deepseek-ai/DeepSeek-VL2
DeepSeek 發(fā)布了另一個出色的模型芯肤,這次是以新的 MoE 視覺語言模型的形式發(fā)布的。它非常高效压鉴,并且比許多密集模型表現(xiàn)更好崖咨。
N 最佳越獄
https://github.com/jplhughes/bon-jailbreaking
越獄是指您繞過模型訓練好的拒絕,讓它為被認為不適當的內容生成文本油吭。這出乎意料地容易實現(xiàn) - 只需在輸入提示中強制隨機輸入大寫字母和標點符號击蹲,直到模型響應您想要提取的結果。
將任何 Microsoft Office 文件轉換為 Markdown
https://github.com/microsoft/markitdown
Microsoft 發(fā)布了一款軟件包婉宰,可以將任何 docx歌豺、xslx 或 ppt 文件轉換為 markdown,以便高效地用作語言模型的上下文心包。
雜七雜八
策劃推理評估
https://www.apolloresearch.ai/research/scheming-reasoning-evaluations
本文評估了六個前沿模型的情境策劃能力类咧。該研究測試模型是否會通過克服監(jiān)督機制等障礙來欺騙開發(fā)人員實現(xiàn)目標。一個例子包括 Claude 3 Opus 將其權重復制到新服務器并對此撒謊。
走向可信自治:機器人痕惋、人工智能和區(qū)塊鏈
https://www.openmind.org/report.pdf
當機器人区宇、人工智能和區(qū)塊鏈融合時會發(fā)生什么?OpenMind 的最新行業(yè)入門是對機器人血巍、人工智能和區(qū)塊鏈協(xié)同作用的全面探索萧锉。
Amurex
https://github.com/thepersonalaicompany/amurex
Amurex 是一款開源 AI 會議助手珊随,可提供實時建議述寡、智能摘要和后續(xù)電子郵件,以提高會議效率叶洞。它提供延遲加入回顧和完整會議記錄等功能鲫凶,可無縫集成到工作流程中。
X 為 Grok 提供了一款新的照片級逼真 AI 圖像生成器
https://www.theverge.com/2024/12/7/24315644/grok-x-aurora-ai-image-generator-xai
X 推出了“Aurora”衩辟,這是“Grok 2 + Aurora beta”下一款新的 AI 圖像生成器螟炫,能夠創(chuàng)建比以前的型號更逼真的圖像。
研究人員利用人工智能將錄音轉換成準確的街景圖像
德克薩斯大學奧斯汀分校的研究人員利用生成式人工智能將錄音轉換成街景圖像艺晴,顯示出與現(xiàn)實世界視覺效果的強烈相關性昼钻。
谷歌稱其新量子芯片比世界上最強大的超級計算機快得多
https://qz.com/google-quantum-chip-willow-ai-frontier-supercomputer-1851716474
谷歌的新量子芯片 Willow 顯著降低了量子比特錯誤率,這是量子計算領域的一個長期挑戰(zhàn)封寞。