頭條
SAKANA稱其人工智能生成的論文通過同行評審
日本人工智能初創(chuàng)公司Sakana用其AI Scientist - v2生成了一篇被ICLR研討會接受的論文,但因透明度問題在初步評審后撤回。盡管Sakana強調(diào)了人工智能的潛力于樟,但批評者稱人類判斷力至關(guān)重要肢娘,且研討會較高的接受率促成了論文被接受雄可。懷疑論者仍持謹(jǐn)慎態(tài)度固惯,強調(diào)人工智能的技術(shù)缺陷,以及制定規(guī)范以防止科學(xué)評審過程受影響的必要性疑务。
谷歌助手將被Gemini取代儿奶。
https://blog.google/products/gemini/google-assistant-gemini-mobile/
谷歌助手正過渡到Gemini框往,這是一款更個性化、由人工智能驅(qū)動的助手闯捎,旨在與應(yīng)用程序和服務(wù)集成椰弊,同時利用生成式人工智能。
谷歌對美國人工智能政策的回應(yīng)
https://blog.google/outreach-initiatives/public-policy/google-us-ai-action-plan-comments/
谷歌勾勒出其對美國人工智能政策的愿景瓤鼻,主張對人工智能基礎(chǔ)設(shè)施進行投資秉版,簡化政府采用流程,并制定利于創(chuàng)新的國際標(biāo)準(zhǔn)茬祷,以維持其在人工智能領(lǐng)域的領(lǐng)先地位清焕。
研究
無需歸一化的Transformer
https://arxiv.org/abs/2503.10622
大多數(shù)Transformer模型都通過層歸一化進行歸一化處理。這可以看作是將模型歸一化到一個球體上牲迫。不過耐朴,如果你精心設(shè)置雙曲正切函數(shù),就可以在保持穩(wěn)定性的同時省去層歸一化盹憎。這現(xiàn)在就相當(dāng)于歸一化到一個超立方體上。
DILOCO的規(guī)模定律
https://arxiv.org/abs/2503.09799
DeepMind發(fā)表了一篇論文铐刘,詳細(xì)介紹了強大的跨數(shù)據(jù)中心訓(xùn)練算法DiLoCo的擴展定律陪每。這些定律顯示了即使跨大洲同步梯度,模型訓(xùn)練也能有多穩(wěn)定。
用Whisper進行說話者識別
https://arxiv.org/abs/2503.10446v1
WSI利用聯(lián)合損失優(yōu)化檩禾,將Whisper ASR編碼器重新用于多語言說話人識別挂签。在識別不同語言和環(huán)境中的說話人方面,它的表現(xiàn)優(yōu)于Pyannote盼产、ECAPA TDNN和Xvector饵婆。
工程
視覺推理模型(GitHub 倉庫)
https://github.com/groundlight/r1_vlm
用于訓(xùn)練視覺語言模型(VLMs)以提升基礎(chǔ)能力和推理能力的工具包。
優(yōu)化勞動力學(xué)習(xí)智能體(GitHub 倉庫)
https://github.com/camel-ai/owl
OWL是一個智能體框架戏售,看似合理且性能不錯侨核。它能實現(xiàn)簡單的組合,甚至能復(fù)制一些閉源智能體的功能灌灾。
用于大語言模型(LLM)檢索的分層檢索增強生成(RAG)(GitHub 倉庫)
https://github.com/hhy-huang/HiRAG
HiRAG引入了一種基于分層知識的檢索增強生成(RAG)方法搓译,可提高特定領(lǐng)域任務(wù)中的語義理解和索引能力。
其他
LUMA用于多模態(tài)模型的全新預(yù)訓(xùn)練方法
https://lumalabs.ai/news/inductive-moment-matching
Luma首席科學(xué)家宋佳明(他創(chuàng)建了最早的擴散模型加速算法)推出了歸納矩匹配(IMM)——一種新的多模態(tài)預(yù)訓(xùn)練方法锋喜,該方法樣本質(zhì)量更高些己,效率提高了10倍,超越了擴散模型嘿般。
Thunder Kittens
https://hazyresearch.stanford.edu/blog/2025-03-15-tk-blackwell
ThunderKittens是用于編寫高效能CUDA內(nèi)核的強大且簡單的抽象工具段标。本文探討如何將該框架用于英偉達最新的布萊克韋爾系列GPU。主要區(qū)別在于從數(shù)據(jù)流的角度去思考炉奴。
開放模型真的開放嗎逼庞?
https://techcrunch.com/2025/03/14/open-ai-model-licenses-often-carry-concerning-restrictions/
許多被標(biāo)注為“開源”的人工智能模型都有嚴(yán)格的許可條款。谷歌新推出的Gemma 3模型以及Meta類似的發(fā)布產(chǎn)品引發(fā)了對商業(yè)限制的擔(dān)憂盆佣,這可能會影響依賴這些技術(shù)的小公司往堡。
亞馬遜通用人工智能負(fù)責(zé)人稱,亞馬遜沒有任何部門能“不受”人工智能影響
https://techcrunch.com/2025/03/03/no-part-of-amazon-is-unaffected-by-ai-says-its-head-of-agi/
亞馬遜通用人工智能副總裁維沙爾·沙瑪證實共耍,人工智能已融入亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)虑灰、機器人技術(shù)和Alexa中,凸顯了該公司廣泛的人工智能部署痹兜。
癌癥檢測全景挑戰(zhàn)
https://links.tldrnewsletter.com/BjcMaW
PANORAMA研究是一項國際項目穆咐,旨在評估人工智能模型和放射科醫(yī)生在通過CT增強掃描檢測胰腺癌方面的表現(xiàn)。
人工智能公司效仿DeepSeek字旭,用“蒸餾”技術(shù)打造更便宜的模型
像OpenAI对湃、微軟和Meta這樣的領(lǐng)先人工智能公司,正通過用 “教師” 大語言模型(LLM)訓(xùn)練較小系統(tǒng)的方式遗淳,利用 “蒸餾” 來創(chuàng)建更具成本效益的模型拍柒。