頭條
Waymo 融資 56 億美元
https://waymo.com/blog/2024/10/investing-to-bring-the-waymo-driver-to-more-riders/
Waymo 的無人駕駛出租車服務(wù)廣受歡迎脊另。該公司已籌集額外資金,以擴大其在已運營的幾個城市和數(shù)百萬英里之外的業(yè)務(wù)箫爷。
Pixtral 12B 權(quán)重發(fā)布
https://huggingface.co/mistralai/Pixtral-12B-Base-2409
Pixtral 12B 基礎(chǔ)模型權(quán)重已在 Hugging Face 上發(fā)布场绿。
AI 珠寶
https://techcrunch.com/2024/10/27/arcade-a-new-ai-product-creation-platform-designed-this-necklace/
Arcade AI 已經(jīng)建立了一個生成產(chǎn)品平臺,可以根據(jù)文本提示創(chuàng)建獨特且優(yōu)質(zhì)的珠寶物品灼擂。最好的部分是壁查, 可以購買提示的東西。
研究
評估特征轉(zhuǎn)向
https://www.anthropic.com/research/evaluating-feature-steering
如何評估特征轉(zhuǎn)向的能力和功效剔应?Anthropic 今年早些時候?qū)?Golden Gate Claude 進行了實驗睡腿。它發(fā)現(xiàn)許多特征,尤其是類似的安全特征峻贮,具有共同的控制范圍席怪。
Crosscoders
https://transformer-circuits.pub/2024/crosscoders/index.html
Crosscoders 是稀疏自動編碼器的擴展,可用于更好地理解語言模型的內(nèi)部機制纤控。
檢索增強時間序列擴散模型
https://arxiv.org/abs/2410.18712v1
新的檢索增強時間序列擴散模型 (RATD) 旨在通過整合檢索和指導(dǎo)機制來穩(wěn)定和改進時間序列擴散模型挂捻。RATD 的兩步流程從數(shù)據(jù)庫中檢索相關(guān)歷史數(shù)據(jù),并使用這些數(shù)據(jù)作為參考來指導(dǎo)去噪階段船万。
工程
NotebookLlama
https://github.com/meta-llama/llama-recipes/tree/main/recipes/quickstart/NotebookLlama
Meta 發(fā)布了一份快速入門指南刻撒,用于重新創(chuàng)建 Google 非常流行的 NotebookLM 系統(tǒng)的基本版本骨田。
MLLM 中的圖表推理
https://github.com/hewei2001/reachqa
代碼作為中介翻譯 (CIT) 是一種增強多模態(tài)語言模型 (MLLM) 中視覺推理的新方法,它使用代碼將圖表視覺效果轉(zhuǎn)換為文本声怔。
概率視覺語言模型
https://arxiv.org/abs/2410.18857v1
概率語言圖像預(yù)訓(xùn)練 (ProLIP) 是一種視覺語言模型 (VLM)态贤,它以概率方式從圖像文本對中學(xué)習(xí)。與假設(shè)嚴(yán)格一對一匹配的傳統(tǒng)模型不同醋火,ProLIP 可以捕獲現(xiàn)實世界數(shù)據(jù)中的多對多關(guān)系悠汽。
雜七雜八
Meta 推出 Spirit LM 開源模型,結(jié)合文本和語音輸入/輸出
Meta 推出了一款開源多模態(tài)語言模型芥驳,旨在將文本和語音輸入輸出與富有表現(xiàn)力柿冲、聽起來自然的語音功能相結(jié)合。Meta Spirit LM 旨在通過使用語音晚树、音調(diào)和聲調(diào)標(biāo)記來增強情感表達并在 ASR姻采、TTS 和語音分類等任務(wù)中保持自然表現(xiàn)力,從而超越現(xiàn)有的語音 AI爵憎。
如何在兩周內(nèi)學(xué)習(xí)LLM:綜合路線圖
本文概述了為期 14 天的學(xué)習(xí)路線圖慨亲,以了解LLM的基礎(chǔ)知識,涵蓋自我注意宝鼓、幻覺和混合專家等高級技術(shù)等主題刑棵。它包括從頭開始構(gòu)建LLM的資源、各種文獻和在線資料愚铡,所有這些都匯編在 GitHub 存儲庫中蛉签。本文強調(diào)個性化學(xué)習(xí)方法,并強調(diào)基礎(chǔ)數(shù)學(xué)沥寥、編程和深度學(xué)習(xí)概念的重要性碍舍。
IBM 推出面向企業(yè) AI 的開源 Granite 3.0 LLM
https://venturebeat.com/ai/ibm-debuts-open-source-granite-3-0-llms-for-enterprise-ai/
IBM 正在通過新的 Granite 3.0 LLM 擴展其企業(yè) AI 產(chǎn)品,重點關(guān)注開源解決方案和性能邑雅。這些模型可在多個平臺上使用片橡,包括安全功能,并針對各種企業(yè)用例進行了量身定制淮野。IBM 強調(diào)使用 Apache 2.0 進行真正的開源許可對于實現(xiàn)靈活的企業(yè)采用和創(chuàng)新的重要性捧书。
Marly
https://github.com/marly-ai/marly
Marly 是一個開源數(shù)據(jù)處理器,允許代理使用 JSON 查詢非結(jié)構(gòu)化數(shù)據(jù)骤星。
微軟推出可以處理客戶查詢的“AI 員工”
微軟正在推出自主 AI 代理來提高生產(chǎn)力经瓷,允許企業(yè)為客戶服務(wù)和供應(yīng)鏈管理等任務(wù)構(gòu)建自定義機器人。
字節(jié)跳動實習(xí)生因在 AI 模型中植入惡意代碼而被解雇
字節(jié)跳動已證實一名實習(xí)生干擾了 AI 模型訓(xùn)練洞难,并駁斥了數(shù)千萬美元損失的夸大說法舆吮。