2024-12-25 簡訊 : 谷歌最新的人工智能創(chuàng)新成果

頭條

谷歌最新的人工智能創(chuàng)新成果

https://blog.google/technology/ai/google-ai-updates-december-2024/
谷歌強(qiáng)調(diào)了人工智能領(lǐng)域的最新進(jìn)展，包括對話式人工智能的強(qiáng)化模型苏揣、負(fù)責(zé)任人工智能實(shí)踐的更新黄鳍，以及面向開發(fā)者的新工具。

OpenAI的O3

https://www.youtube.com/watch
在OpenAI發(fā)布消息的最后一天平匈，OpenAI宣布了O3框沟，這是其最強(qiáng)大的推理模型。

OpenAI的新對齊方法

https://openai.com/index/deliberative-alignment/
OpenAI開發(fā)了一種針對推理模型的新對齊技術(shù)增炭，能讓模型思考基于實(shí)際行為目標(biāo)（比如安全指南里的那些目標(biāo)）并做出相應(yīng)回應(yīng)忍燥。這是在對齊方面的一個進(jìn)步，避免了同時(shí)內(nèi)置對齊和偏好隙姿。

研究

醫(yī)療思維鏈

https://arxiv.org/abs/2412.13736v1
一種新的推理框架梅垄，能提高醫(yī)學(xué)視覺問答的準(zhǔn)確性和可解釋性。

多語句標(biāo)注數(shù)據(jù)集

https://zzzbbbzzz.github.io/MulSen_AD/index.html
一個新數(shù)據(jù)集孟辑，用于在多句理解和標(biāo)注任務(wù)上訓(xùn)練和評估人工智能模型哎甲，強(qiáng)調(diào)基于語境的分析。

行動規(guī)劃框架

https://kakituken.github.io/affordance-any.github.io/
這個框架能讓機(jī)器人根據(jù)物體的可供性來規(guī)劃行動饲嗽，提高在動態(tài)環(huán)境中的泛化能力和效率。

工程

多模態(tài)人工智能工具包（GitHub倉庫）

https://github.com/taco-group/openemma
一個用于開發(fā)多模態(tài)人工智能應(yīng)用的綜合工具包奈嘿，帶有用于視覺貌虾、語言和音頻集成的預(yù)制模塊。

利用Levitor實(shí)現(xiàn)無人機(jī)導(dǎo)航

https://ppetrichor.github.io/levitor.github.io/
Levitor是一個用于無人機(jī)自主導(dǎo)航的平臺裙犹，配有先進(jìn)的避障和高效尋路算法尽狠。

微軟的大型語言模型基準(zhǔn)測試（GitHub倉庫）

https://github.com/microsoft/mmlu-cf
微軟的MMLU-CF是一個評估語言模型在多種任務(wù)上表現(xiàn)的基準(zhǔn)，重點(diǎn)關(guān)注事實(shí)一致性和多語言能力叶圃。

其他

https://every.to/thesis/how-to-build-a-truly-useful-ai-product
打造人工智能初創(chuàng)公司袄膏，需要快速適應(yīng)大型語言模型（LLMs）的快速發(fā)展，避免那些即將推出的模型就能解決的問題掺冠，還要利用尖端技術(shù)的高成本來獲得競爭優(yōu)勢沉馆。要專注于特定用例，與通用人工智能競爭德崭，同時(shí)強(qiáng)調(diào)產(chǎn)品體驗(yàn)的無縫性斥黑。盡管生成式人工智能發(fā)展迅速，但打造受歡迎產(chǎn)品的核心原則并未改變眉厨。

有用和沒用的特定任務(wù)大語言模型評估

https://eugeneyan.com/writing/evals/
現(xiàn)成的評估方法往往無法有效衡量大型語言模型（LLM）在特定任務(wù)中的表現(xiàn)锌奴。用于分類的有用指標(biāo)包括召回率、精確率憾股、ROC - AUC鹿蜀，而總結(jié)和翻譯任務(wù)則可分別采用基于自然語言推理（NLI）的一致性檢查以及chrF或BLEURT指標(biāo)箕慧。要考慮模型中可能存在的缺陷，比如版權(quán)抄襲和有害內(nèi)容等茴恰，可使用RealToxicityPrompts這類測試進(jìn)行全面評估颠焦。

o1 轉(zhuǎn)為專業(yè)版

https://thezvi.substack.com/p/o1-turns-pro
OpenAI的o1和o1 Pro進(jìn)行了更新，在編碼琐簇、數(shù)學(xué)和復(fù)雜問題解決能力方面有顯著提升蒸健，在深度推理和事實(shí)回憶方面表現(xiàn)尤為突出。每月200美元的o1 Pro服務(wù)通過增加計(jì)算能力進(jìn)一步強(qiáng)化了這些功能婉商，對處理專業(yè)或挑戰(zhàn)性任務(wù)的人來說特別有用似忧。總體反應(yīng)積極丈秩，多數(shù)用戶若沒有高級需求盯捌，每月20美元的服務(wù)就夠了。

人面猴
序言：七十年代末肥印，一起剝皮案震驚了整個濱河市识椰，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌深碱，老刑警劉巖腹鹉，帶你破解...
沈念sama閱讀 218,122評論 6贊 505
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異敷硅，居然都是意外死亡功咒，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,070評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門竞膳，熙熙樓的掌柜王于貴愁眉苦臉地迎上來航瞭，“玉大人，你說我怎么就攤上這事坦辟】睿” “怎么了？”我有些...
開封第一講書人閱讀 164,491評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵锉走，是天一觀的道長滨彻。經(jīng)常有香客問我藕届，道長，這世上最難降的妖魔是什么亭饵？我笑而不...
開封第一講書人閱讀 58,636評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任休偶，我火速辦了婚禮，結(jié)果婚禮上辜羊，老公的妹妹穿的比我還像新娘踏兜。我一直安慰自己，他們只是感情好八秃，可當(dāng)我...
茶點(diǎn)故事閱讀 67,676評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布碱妆。她就那樣靜靜地躺著，像睡著了一般昔驱。火紅的嫁衣襯著肌膚如雪疹尾。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,541評論 1贊 305
城市分裂傳說
那天骤肛，我揣著相機(jī)與錄音纳本，去河邊找鬼。笑死腋颠，一個胖子當(dāng)著我的面吹牛繁成，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播淑玫，決...
沈念sama閱讀 40,292評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼朴艰，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了混移？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,211評論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤侮穿，失蹤者是張志新（化名）和其女友劉穎歌径，沒想到半個月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體亲茅，經(jīng)...
沈念sama閱讀 45,655評論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡回铛，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,846評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了克锣。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片茵肃。...
茶點(diǎn)故事閱讀 39,965評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖袭祟，靈堂內(nèi)的尸體忽然破棺而出验残，到底是詐尸還是另有隱情，我是刑警寧澤巾乳，帶...
沈念sama閱讀 35,684評論 5贊 347
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布您没，位于F島的核電站鸟召，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏氨鹏。R本人自食惡果不足惜欧募，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,295評論 3贊 329
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望仆抵。院中可真熱鬧跟继，春花似錦、人聲如沸镣丑。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,894評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽传轰。三九已至剩盒，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間慨蛙，已是汗流浹背辽聊。一陣腳步聲響...
開封第一講書人閱讀 33,012評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留期贫，地道東北人跟匆。一個月前我還...
沈念sama閱讀 48,126評論 3贊 370
代替公主和親
正文我出身青樓，卻偏偏與公主長得像通砍，于是被迫代替她去往敵國和親玛臂。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,914評論 2贊 355

2024-12-25 簡訊 : 谷歌最新的人工智能創(chuàng)新成果

2024-12-25 簡訊 : 谷歌最新的人工智能創(chuàng)新成果

頭條

谷歌最新的人工智能創(chuàng)新成果

OpenAI的O3

OpenAI的新對齊方法

研究

醫(yī)療思維鏈

多語句標(biāo)注數(shù)據(jù)集

行動規(guī)劃框架

工程

多模態(tài)人工智能工具包（GitHub倉庫）

利用Levitor實(shí)現(xiàn)無人機(jī)導(dǎo)航

微軟的大型語言模型基準(zhǔn)測試（GitHub倉庫）

其他

如何打造一款真正有用的人工智能產(chǎn)品

有用和沒用的特定任務(wù)大語言模型評估

o1 轉(zhuǎn)為專業(yè)版

快訊

一次性Python工具

谷歌推出“水手計(jì)劃”：人工智能助手可為你使用網(wǎng)絡(luò)

谷歌正在測試能在視頻游戲中幫到你的雙子座（Gemini）人工智能智能體

推薦閱讀更多精彩內(nèi)容