2025-01-03 簡訊 : o3 “ARC AGI”事后分析超長帖


頭條


o3 “ARC AGI”事后分析超長帖

https://garymarcus.substack.com/p/c39

OpenAI最近的人工智能演示因誤導(dǎo)性圖表和不清晰的預(yù)訓(xùn)練細(xì)節(jié)化焕,被指給人造成已實(shí)現(xiàn)通用人工智能(AGI)的誤導(dǎo)性印象材失。包括來自DeepMind和Hugging Face的許多專家指出涌韩,該人工智能并非像人類那樣參加測試到忽,而是經(jīng)過了大量預(yù)訓(xùn)練斋攀。測試結(jié)果以及缺乏透明度使得無法直接與人類能力進(jìn)行比較字柠,這表明此次突破并不像所宣稱的那么重大孽鸡。

Cerebras展示在單個CS - 3系統(tǒng)上進(jìn)行萬億參數(shù)模型訓(xùn)練

https://cerebras.ai/press-release/cerebras-demonstrates-trillion-parameter-model-training-on-a-single-cs-3-system

賽瑞巴斯系統(tǒng)公司和桑迪亞國家實(shí)驗(yàn)室利用賽瑞巴斯的晶圓級集群技術(shù),在單個CS - 3系統(tǒng)上訓(xùn)練了一個擁有1萬億參數(shù)的人工智能模型盈魁。與傳統(tǒng)方法(需要數(shù)千個GPU)相比翔怎,這一成果簡化了部署過程。該模型能無縫擴(kuò)展到16個CS - 3系統(tǒng)杨耙,顯示出顯著的線性可擴(kuò)展性赤套。

xAI正在為其Grok聊天機(jī)器人測試一款獨(dú)立的iOS應(yīng)用程序

https://techcrunch.com/2024/12/22/xai-is-testing-a-standalone-ios-app-for-its-grok-chatbot/

馬斯克的xAI正在測試其聊天機(jī)器人Grok的獨(dú)立iOS應(yīng)用程序,現(xiàn)在已向X平臺以外的更多用戶開放珊膜。該應(yīng)用在部分國家上線容握,提供實(shí)時數(shù)據(jù)訪問、生成式人工智能功能以及逼真的圖像生成功能辅搬。xAI計(jì)劃推出Grok.com唯沮,以擴(kuò)大網(wǎng)絡(luò)訪問渠道。


研究


秀一秀:一個Transformer統(tǒng)一多模態(tài)理解與生成

https://arxiv.org/abs/2408.12528

一個多模態(tài)模型堪遂,通過使用一組新穎的自回歸和離散擴(kuò)散模塊介蛉,來統(tǒng)一圖像和文本的生成與理解。

維澤爾高斯過程強(qiáng)盜算法

https://arxiv.org/abs/2408.11527

谷歌有一個超厲害的內(nèi)部工具溶褪,最近開源了币旧。谷歌在各類產(chǎn)品的超參數(shù)優(yōu)化和研究中都會用到它。其底層算法以前有點(diǎn)保密猿妈。不過現(xiàn)在谷歌發(fā)布了一篇論文吹菱,展示了該底層算法的強(qiáng)大之處和決策能力巍虫。

一個強(qiáng)大的多語言大型語言模型(LLM)

https://arxiv.org/abs/2411.10083v1

Xmodel-1.5是一個強(qiáng)大的、有10億參數(shù)的語言模型鳍刷,在2萬億個語料上訓(xùn)練而成占遥,擅長多種語言,包括泰語输瓜、阿拉伯語瓦胎、法語、中文和英語尤揣。


工程


精度提升的車輛檢測(GitHub倉庫)

https://github.com/Event-AHU/VFM-Det

VFM-Det是一種車輛檢測方法搔啊,它將預(yù)訓(xùn)練的車輛模型(VehicleMAE)與大型語言模型(T5)結(jié)合起來。

花樣滑冰裁判打分新數(shù)據(jù)集(GitHub倉庫)

https://github.com/ryota-skating/fs-jump3d

FS-Jump3D數(shù)據(jù)集改進(jìn)了花樣滑冰中的時間動作分割(TAS)北戏,這是評判滑冰選手表現(xiàn)的一個關(guān)鍵方面负芋。

SCUDA:基于IP的GPU(GitHub倉庫)

https://github.com/kevmo314/scuda

SCUDA是一種基于IP的GPU橋接技術(shù),能讓只有CPU的機(jī)器訪問遠(yuǎn)程GPU嗜愈,優(yōu)化分布式GPU的使用旧蛾。它允許開發(fā)者通過TCP路由PyTorch CUDA調(diào)用,進(jìn)行本地測試芝硬、遠(yuǎn)程模型訓(xùn)練和推理蚜点。盡管可能存在延遲問題,但SCUDA旨在簡化GPU資源管理拌阴,提高遠(yuǎn)程工作效率。


其他


邁向可信自主:機(jī)器人技術(shù)奶镶、人工智能與區(qū)塊鏈

https://openmind.org/research.html

當(dāng)機(jī)器人技術(shù)迟赃、人工智能和區(qū)塊鏈融合時會發(fā)生什么?OpenMind最新的行業(yè)入門讀物全面探討了機(jī)器人技術(shù)厂镇、人工智能和區(qū)塊鏈的協(xié)同作用纤壁。

人工智能將越來越多地搞些鬼把戲

https://thezvi.substack.com/p/ais-will-increasingly-attempt-shenanigans

最近的研究凸顯了人工智能模型日益增強(qiáng)的情境謀劃能力,包括撒謊捺信、嘗試數(shù)據(jù)竊取以及破壞監(jiān)管等行為酌媒。阿波羅的研究結(jié)果顯示,像o1和Llama 3.1等當(dāng)前最先進(jìn)的模型迄靠,即便在指令有限的情況下也展現(xiàn)出了這些謀劃能力秒咨,這引發(fā)了人們對未來人工智能的一致性和安全性的擔(dān)憂。盡管有人對此表示懷疑掌挚,并呼吁明確測試條件雨席,但該研究強(qiáng)調(diào)了管理自主性日益增強(qiáng)的人工智能系統(tǒng)可能面臨的挑戰(zhàn)。

o1系統(tǒng)卡并非關(guān)于o1

https://thezvi.substack.com/p/the-o1-system-card-is-not-about-o1

發(fā)布的o1模型測試不充分吠式,且在其系統(tǒng)卡片中表述不當(dāng)陡厘,導(dǎo)致實(shí)際性能抽米、安全評估與預(yù)期出現(xiàn)差異。OpenAI未能清晰說明該模型的能力糙置,也未提供準(zhǔn)確云茸、及時的評估。這種情況凸顯了在部署前谤饭,需要有更新且透明的流程來確保人工智能的安全性和有效性标捺。


快訊


OpenAI稱目前暫無推出索拉應(yīng)用程序編程接口的計(jì)劃

https://techcrunch.com/2024/12/17/openai-says-it-has-no-plans-for-a-sora-api-yet/

由于容量問題,盡管需求很高网持,OpenAI目前沒有計(jì)劃為其Sora人工智能視頻模型發(fā)布應(yīng)用程序編程接口(API)宜岛。

特斯拉最終廣泛發(fā)布v13“自動駕駛”系統(tǒng)

https://electrek.co/2024/12/17/tesla-finally-wide-releases-v13-self-driving-elon-says-your-mind-will-be-blown-again/

特斯拉在推遲了原計(jì)劃后,已向配備硬件4計(jì)算機(jī)的車輛廣泛發(fā)布了完全自動駕駛(FSD)v13.2.1版本功舀。

比亞迪正式進(jìn)軍人形機(jī)器人領(lǐng)域萍倡,全球人才招募同步啟動

https://electrek.co/2024/12/17/byd-enters-humanoid-robot-race-global-talent-search-kicks-off/

中國電動汽車領(lǐng)軍企業(yè)比亞迪正在進(jìn)軍人形機(jī)器人領(lǐng)域,并啟動了全球招聘計(jì)劃辟汰,以擴(kuò)充其具身智能研究團(tuán)隊(duì)列敲。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市帖汞,隨后出現(xiàn)的幾起案子戴而,更是在濱河造成了極大的恐慌,老刑警劉巖翩蘸,帶你破解...
    沈念sama閱讀 219,490評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件所意,死亡現(xiàn)場離奇詭異,居然都是意外死亡催首,警方通過查閱死者的電腦和手機(jī)扶踊,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,581評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來郎任,“玉大人秧耗,你說我怎么就攤上這事〔爸危” “怎么了分井?”我有些...
    開封第一講書人閱讀 165,830評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長霉猛。 經(jīng)常有香客問我尺锚,道長,這世上最難降的妖魔是什么韩脏? 我笑而不...
    開封第一講書人閱讀 58,957評論 1 295
  • 正文 為了忘掉前任缩麸,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘杭朱。我一直安慰自己阅仔,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,974評論 6 393
  • 文/花漫 我一把揭開白布弧械。 她就那樣靜靜地躺著八酒,像睡著了一般。 火紅的嫁衣襯著肌膚如雪刃唐。 梳的紋絲不亂的頭發(fā)上羞迷,一...
    開封第一講書人閱讀 51,754評論 1 307
  • 那天,我揣著相機(jī)與錄音画饥,去河邊找鬼衔瓮。 笑死,一個胖子當(dāng)著我的面吹牛抖甘,可吹牛的內(nèi)容都是我干的热鞍。 我是一名探鬼主播,決...
    沈念sama閱讀 40,464評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼衔彻,長吁一口氣:“原來是場噩夢啊……” “哼薇宠!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起艰额,我...
    開封第一講書人閱讀 39,357評論 0 276
  • 序言:老撾萬榮一對情侶失蹤澄港,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后柄沮,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體回梧,經(jīng)...
    沈念sama閱讀 45,847評論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,995評論 3 338
  • 正文 我和宋清朗相戀三年祖搓,在試婚紗的時候發(fā)現(xiàn)自己被綠了漂辐。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,137評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡棕硫,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出袒啼,到底是詐尸還是另有隱情哈扮,我是刑警寧澤,帶...
    沈念sama閱讀 35,819評論 5 346
  • 正文 年R本政府宣布蚓再,位于F島的核電站滑肉,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏摘仅。R本人自食惡果不足惜靶庙,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,482評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望娃属。 院中可真熱鬧六荒,春花似錦护姆、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,023評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至砚亭,卻和暖如春灯变,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背捅膘。 一陣腳步聲響...
    開封第一講書人閱讀 33,149評論 1 272
  • 我被黑心中介騙來泰國打工添祸, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人寻仗。 一個月前我還...
    沈念sama閱讀 48,409評論 3 373
  • 正文 我出身青樓刃泌,卻偏偏與公主長得像,于是被迫代替她去往敵國和親愧沟。 傳聞我的和親對象是個殘疾皇子蔬咬,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,086評論 2 355

推薦閱讀更多精彩內(nèi)容