2025-01-03 簡訊 : o3 “ARC AGI”事后分析超長帖

頭條

o3 “ARC AGI”事后分析超長帖

https://garymarcus.substack.com/p/c39

OpenAI最近的人工智能演示因誤導(dǎo)性圖表和不清晰的預(yù)訓(xùn)練細(xì)節(jié)化焕，被指給人造成已實(shí)現(xiàn)通用人工智能（AGI）的誤導(dǎo)性印象材失。包括來自DeepMind和Hugging Face的許多專家指出涌韩，該人工智能并非像人類那樣參加測試到忽，而是經(jīng)過了大量預(yù)訓(xùn)練斋攀。測試結(jié)果以及缺乏透明度使得無法直接與人類能力進(jìn)行比較字柠，這表明此次突破并不像所宣稱的那么重大孽鸡。

Cerebras展示在單個CS - 3系統(tǒng)上進(jìn)行萬億參數(shù)模型訓(xùn)練

https://cerebras.ai/press-release/cerebras-demonstrates-trillion-parameter-model-training-on-a-single-cs-3-system

賽瑞巴斯系統(tǒng)公司和桑迪亞國家實(shí)驗(yàn)室利用賽瑞巴斯的晶圓級集群技術(shù)，在單個CS - 3系統(tǒng)上訓(xùn)練了一個擁有1萬億參數(shù)的人工智能模型盈魁。與傳統(tǒng)方法（需要數(shù)千個GPU）相比翔怎，這一成果簡化了部署過程。該模型能無縫擴(kuò)展到16個CS - 3系統(tǒng)杨耙，顯示出顯著的線性可擴(kuò)展性赤套。

xAI正在為其Grok聊天機(jī)器人測試一款獨(dú)立的iOS應(yīng)用程序

https://techcrunch.com/2024/12/22/xai-is-testing-a-standalone-ios-app-for-its-grok-chatbot/

馬斯克的xAI正在測試其聊天機(jī)器人Grok的獨(dú)立iOS應(yīng)用程序，現(xiàn)在已向X平臺以外的更多用戶開放珊膜。該應(yīng)用在部分國家上線容握，提供實(shí)時數(shù)據(jù)訪問、生成式人工智能功能以及逼真的圖像生成功能辅搬。xAI計(jì)劃推出Grok.com唯沮，以擴(kuò)大網(wǎng)絡(luò)訪問渠道。

研究

秀一秀：一個Transformer統(tǒng)一多模態(tài)理解與生成

https://arxiv.org/abs/2408.12528

一個多模態(tài)模型堪遂，通過使用一組新穎的自回歸和離散擴(kuò)散模塊介蛉，來統(tǒng)一圖像和文本的生成與理解。

維澤爾高斯過程強(qiáng)盜算法

https://arxiv.org/abs/2408.11527

谷歌有一個超厲害的內(nèi)部工具溶褪，最近開源了币旧。谷歌在各類產(chǎn)品的超參數(shù)優(yōu)化和研究中都會用到它。其底層算法以前有點(diǎn)保密猿妈。不過現(xiàn)在谷歌發(fā)布了一篇論文吹菱，展示了該底層算法的強(qiáng)大之處和決策能力巍虫。

一個強(qiáng)大的多語言大型語言模型（LLM）

https://arxiv.org/abs/2411.10083v1

Xmodel-1.5是一個強(qiáng)大的、有10億參數(shù)的語言模型鳍刷，在2萬億個語料上訓(xùn)練而成占遥，擅長多種語言，包括泰語输瓜、阿拉伯語瓦胎、法語、中文和英語尤揣。

工程

精度提升的車輛檢測（GitHub倉庫）

https://github.com/Event-AHU/VFM-Det

VFM-Det是一種車輛檢測方法搔啊，它將預(yù)訓(xùn)練的車輛模型（VehicleMAE）與大型語言模型（T5）結(jié)合起來。

花樣滑冰裁判打分新數(shù)據(jù)集（GitHub倉庫）

https://github.com/ryota-skating/fs-jump3d

FS-Jump3D數(shù)據(jù)集改進(jìn)了花樣滑冰中的時間動作分割（TAS）北戏，這是評判滑冰選手表現(xiàn)的一個關(guān)鍵方面负芋。

SCUDA：基于IP的GPU（GitHub倉庫）

https://github.com/kevmo314/scuda

SCUDA是一種基于IP的GPU橋接技術(shù)，能讓只有CPU的機(jī)器訪問遠(yuǎn)程GPU嗜愈，優(yōu)化分布式GPU的使用旧蛾。它允許開發(fā)者通過TCP路由PyTorch CUDA調(diào)用，進(jìn)行本地測試芝硬、遠(yuǎn)程模型訓(xùn)練和推理蚜点。盡管可能存在延遲問題，但SCUDA旨在簡化GPU資源管理拌阴，提高遠(yuǎn)程工作效率。

其他

邁向可信自主：機(jī)器人技術(shù)奶镶、人工智能與區(qū)塊鏈

https://openmind.org/research.html

當(dāng)機(jī)器人技術(shù)迟赃、人工智能和區(qū)塊鏈融合時會發(fā)生什么？OpenMind最新的行業(yè)入門讀物全面探討了機(jī)器人技術(shù)厂镇、人工智能和區(qū)塊鏈的協(xié)同作用纤壁。

人工智能將越來越多地搞些鬼把戲

https://thezvi.substack.com/p/ais-will-increasingly-attempt-shenanigans

最近的研究凸顯了人工智能模型日益增強(qiáng)的情境謀劃能力，包括撒謊捺信、嘗試數(shù)據(jù)竊取以及破壞監(jiān)管等行為酌媒。阿波羅的研究結(jié)果顯示，像o1和Llama 3.1等當(dāng)前最先進(jìn)的模型迄靠，即便在指令有限的情況下也展現(xiàn)出了這些謀劃能力秒咨，這引發(fā)了人們對未來人工智能的一致性和安全性的擔(dān)憂。盡管有人對此表示懷疑掌挚，并呼吁明確測試條件雨席，但該研究強(qiáng)調(diào)了管理自主性日益增強(qiáng)的人工智能系統(tǒng)可能面臨的挑戰(zhàn)。

o1系統(tǒng)卡并非關(guān)于o1

https://thezvi.substack.com/p/the-o1-system-card-is-not-about-o1

發(fā)布的o1模型測試不充分吠式，且在其系統(tǒng)卡片中表述不當(dāng)陡厘，導(dǎo)致實(shí)際性能抽米、安全評估與預(yù)期出現(xiàn)差異。OpenAI未能清晰說明該模型的能力糙置，也未提供準(zhǔn)確云茸、及時的評估。這種情況凸顯了在部署前谤饭，需要有更新且透明的流程來確保人工智能的安全性和有效性标捺。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市帖汞，隨后出現(xiàn)的幾起案子戴而，更是在濱河造成了極大的恐慌，老刑警劉巖翩蘸，帶你破解...
沈念sama閱讀 219,490評論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件所意，死亡現(xiàn)場離奇詭異，居然都是意外死亡催首，警方通過查閱死者的電腦和手機(jī)扶踊，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,581評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來郎任，“玉大人秧耗，你說我怎么就攤上這事〔爸危” “怎么了分井？”我有些...
開封第一講書人閱讀 165,830評論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長霉猛。經(jīng)常有香客問我尺锚，道長，這世上最難降的妖魔是什么韩脏？我笑而不...
開封第一講書人閱讀 58,957評論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任缩麸，我火速辦了婚禮，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘杭朱。我一直安慰自己阅仔，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,974評論 6贊 393
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布弧械。她就那樣靜靜地躺著八酒，像睡著了一般。火紅的嫁衣襯著肌膚如雪刃唐。梳的紋絲不亂的頭發(fā)上羞迷，一...
開封第一講書人閱讀 51,754評論 1贊 307
城市分裂傳說
那天，我揣著相機(jī)與錄音画饥，去河邊找鬼衔瓮。笑死，一個胖子當(dāng)著我的面吹牛抖甘，可吹牛的內(nèi)容都是我干的热鞍。我是一名探鬼主播，決...
沈念sama閱讀 40,464評論 3贊 420
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼衔彻，長吁一口氣：“原來是場噩夢啊……” “哼薇宠！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起艰额，我...
開封第一講書人閱讀 39,357評論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤澄港，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后柄沮，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體回梧，經(jīng)...
沈念sama閱讀 45,847評論 1贊 317
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,995評論 3贊 338
?白月光啟示錄
正文我和宋清朗相戀三年祖搓，在試婚紗的時候發(fā)現(xiàn)自己被綠了漂辐。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 40,137評論 1贊 351
活死人
序言：一個原本活蹦亂跳的男人離奇死亡棕硫，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出袒啼，到底是詐尸還是另有隱情哈扮，我是刑警寧澤，帶...
沈念sama閱讀 35,819評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布蚓再，位于F島的核電站滑肉，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏摘仅。R本人自食惡果不足惜靶庙，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,482評論 3贊 331
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望娃属。院中可真熱鬧六荒，春花似錦护姆、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,023評論 0贊 22
一樁弒父案卵皂，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至砚亭，卻和暖如春灯变，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背捅膘。一陣腳步聲響...
開封第一講書人閱讀 33,149評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工添祸，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人寻仗。一個月前我還...
沈念sama閱讀 48,409評論 3贊 373
代替公主和親
正文我出身青樓刃泌，卻偏偏與公主長得像，于是被迫代替她去往敵國和親愧沟。傳聞我的和親對象是個殘疾皇子蔬咬，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,086評論 2贊 355

2025-01-03 簡訊 : o3 “ARC AGI”事后分析超長帖

2025-01-03 簡訊 : o3 “ARC AGI”事后分析超長帖

頭條

o3 “ARC AGI”事后分析超長帖

Cerebras展示在單個CS - 3系統(tǒng)上進(jìn)行萬億參數(shù)模型訓(xùn)練

xAI正在為其Grok聊天機(jī)器人測試一款獨(dú)立的iOS應(yīng)用程序

研究

秀一秀：一個Transformer統(tǒng)一多模態(tài)理解與生成

維澤爾高斯過程強(qiáng)盜算法

一個強(qiáng)大的多語言大型語言模型（LLM）

工程

精度提升的車輛檢測（GitHub倉庫）

花樣滑冰裁判打分新數(shù)據(jù)集（GitHub倉庫）

SCUDA：基于IP的GPU（GitHub倉庫）

其他

邁向可信自主：機(jī)器人技術(shù)奶镶、人工智能與區(qū)塊鏈

人工智能將越來越多地搞些鬼把戲

o1系統(tǒng)卡并非關(guān)于o1

快訊

OpenAI稱目前暫無推出索拉應(yīng)用程序編程接口的計(jì)劃

特斯拉最終廣泛發(fā)布v13“自動駕駛”系統(tǒng)

比亞迪正式進(jìn)軍人形機(jī)器人領(lǐng)域萍倡，全球人才招募同步啟動

推薦閱讀更多精彩內(nèi)容