2024-12-25 簡訊 : 谷歌最新的人工智能創(chuàng)新成果


頭條


谷歌最新的人工智能創(chuàng)新成果

https://blog.google/technology/ai/google-ai-updates-december-2024/
谷歌強(qiáng)調(diào)了人工智能領(lǐng)域的最新進(jìn)展,包括對話式人工智能的強(qiáng)化模型苏揣、負(fù)責(zé)任人工智能實(shí)踐的更新黄鳍,以及面向開發(fā)者的新工具。

OpenAI的O3

https://www.youtube.com/watch
在OpenAI發(fā)布消息的最后一天平匈,OpenAI宣布了O3框沟,這是其最強(qiáng)大的推理模型。

OpenAI的新對齊方法

https://openai.com/index/deliberative-alignment/
OpenAI開發(fā)了一種針對推理模型的新對齊技術(shù)增炭,能讓模型思考基于實(shí)際行為目標(biāo)(比如安全指南里的那些目標(biāo))并做出相應(yīng)回應(yīng)忍燥。這是在對齊方面的一個進(jìn)步,避免了同時(shí)內(nèi)置對齊和偏好隙姿。


研究


醫(yī)療思維鏈

https://arxiv.org/abs/2412.13736v1
一種新的推理框架梅垄,能提高醫(yī)學(xué)視覺問答的準(zhǔn)確性和可解釋性。

多語句標(biāo)注數(shù)據(jù)集

https://zzzbbbzzz.github.io/MulSen_AD/index.html
一個新數(shù)據(jù)集孟辑,用于在多句理解和標(biāo)注任務(wù)上訓(xùn)練和評估人工智能模型哎甲,強(qiáng)調(diào)基于語境的分析。

行動規(guī)劃框架

https://kakituken.github.io/affordance-any.github.io/
這個框架能讓機(jī)器人根據(jù)物體的可供性來規(guī)劃行動饲嗽,提高在動態(tài)環(huán)境中的泛化能力和效率。


工程


多模態(tài)人工智能工具包(GitHub倉庫)

https://github.com/taco-group/openemma
一個用于開發(fā)多模態(tài)人工智能應(yīng)用的綜合工具包奈嘿,帶有用于視覺貌虾、語言和音頻集成的預(yù)制模塊。

利用Levitor實(shí)現(xiàn)無人機(jī)導(dǎo)航

https://ppetrichor.github.io/levitor.github.io/
Levitor是一個用于無人機(jī)自主導(dǎo)航的平臺裙犹,配有先進(jìn)的避障和高效尋路算法尽狠。

微軟的大型語言模型基準(zhǔn)測試(GitHub倉庫)

https://github.com/microsoft/mmlu-cf
微軟的MMLU-CF是一個評估語言模型在多種任務(wù)上表現(xiàn)的基準(zhǔn),重點(diǎn)關(guān)注事實(shí)一致性和多語言能力叶圃。


其他


如何打造一款真正有用的人工智能產(chǎn)品

https://every.to/thesis/how-to-build-a-truly-useful-ai-product
打造人工智能初創(chuàng)公司袄膏,需要快速適應(yīng)大型語言模型(LLMs)的快速發(fā)展,避免那些即將推出的模型就能解決的問題掺冠,還要利用尖端技術(shù)的高成本來獲得競爭優(yōu)勢沉馆。要專注于特定用例,與通用人工智能競爭德崭,同時(shí)強(qiáng)調(diào)產(chǎn)品體驗(yàn)的無縫性斥黑。盡管生成式人工智能發(fā)展迅速,但打造受歡迎產(chǎn)品的核心原則并未改變眉厨。

有用和沒用的特定任務(wù)大語言模型評估

https://eugeneyan.com/writing/evals/
現(xiàn)成的評估方法往往無法有效衡量大型語言模型(LLM)在特定任務(wù)中的表現(xiàn)锌奴。用于分類的有用指標(biāo)包括召回率、精確率憾股、ROC - AUC鹿蜀,而總結(jié)和翻譯任務(wù)則可分別采用基于自然語言推理(NLI)的一致性檢查以及chrF或BLEURT指標(biāo)箕慧。要考慮模型中可能存在的缺陷,比如版權(quán)抄襲和有害內(nèi)容等茴恰,可使用RealToxicityPrompts這類測試進(jìn)行全面評估颠焦。

o1 轉(zhuǎn)為專業(yè)版

https://thezvi.substack.com/p/o1-turns-pro
OpenAI的o1和o1 Pro進(jìn)行了更新,在編碼琐簇、數(shù)學(xué)和復(fù)雜問題解決能力方面有顯著提升蒸健,在深度推理和事實(shí)回憶方面表現(xiàn)尤為突出。每月200美元的o1 Pro服務(wù)通過增加計(jì)算能力進(jìn)一步強(qiáng)化了這些功能婉商,對處理專業(yè)或挑戰(zhàn)性任務(wù)的人來說特別有用似忧。總體反應(yīng)積極丈秩,多數(shù)用戶若沒有高級需求盯捌,每月20美元的服務(wù)就夠了。


快訊


一次性Python工具

https://simonwillison.net/2024/Dec/19/one-shot-python-tools/
一篇不錯的博客蘑秽,介紹了一種提示策略饺著,用于通過Claude制作自包含、兼容UV的Python腳本肠牲。

谷歌推出“水手計(jì)劃”:人工智能助手可為你使用網(wǎng)絡(luò)

https://techcrunch.com/2024/12/11/google-unveils-project-mariner-ai-agents-to-use-the-web-for-you/
谷歌的DeepMind推出了“水手計(jì)劃”幼衰,這是一個能通過Chrome瀏覽器自主瀏覽網(wǎng)站并與之互動的人工智能代理。

谷歌正在測試能在視頻游戲中幫到你的雙子座(Gemini)人工智能智能體

https://www.theverge.com/2024/12/11/24318530/google-gemini-2-0-understand-rules-video-games-genie
谷歌發(fā)布了Gemini 2.0缀雳,展示了能理解游戲規(guī)則并提供實(shí)時(shí)建議的人工智能代理渡嚣,這些代理專門在《部落沖突》等游戲上進(jìn)行了測試。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末肥印,一起剝皮案震驚了整個濱河市识椰,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌深碱,老刑警劉巖腹鹉,帶你破解...
    沈念sama閱讀 218,122評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異敷硅,居然都是意外死亡功咒,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,070評論 3 395
  • 文/潘曉璐 我一進(jìn)店門竞膳,熙熙樓的掌柜王于貴愁眉苦臉地迎上來航瞭,“玉大人,你說我怎么就攤上這事坦辟】睿” “怎么了?”我有些...
    開封第一講書人閱讀 164,491評論 0 354
  • 文/不壞的土叔 我叫張陵锉走,是天一觀的道長滨彻。 經(jīng)常有香客問我藕届,道長,這世上最難降的妖魔是什么亭饵? 我笑而不...
    開封第一講書人閱讀 58,636評論 1 293
  • 正文 為了忘掉前任休偶,我火速辦了婚禮,結(jié)果婚禮上辜羊,老公的妹妹穿的比我還像新娘踏兜。我一直安慰自己,他們只是感情好八秃,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,676評論 6 392
  • 文/花漫 我一把揭開白布碱妆。 她就那樣靜靜地躺著,像睡著了一般昔驱。 火紅的嫁衣襯著肌膚如雪疹尾。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,541評論 1 305
  • 那天骤肛,我揣著相機(jī)與錄音纳本,去河邊找鬼。 笑死腋颠,一個胖子當(dāng)著我的面吹牛繁成,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播淑玫,決...
    沈念sama閱讀 40,292評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼朴艰,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了混移?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,211評論 0 276
  • 序言:老撾萬榮一對情侶失蹤侮穿,失蹤者是張志新(化名)和其女友劉穎歌径,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體亲茅,經(jīng)...
    沈念sama閱讀 45,655評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡回铛,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,846評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了克锣。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片茵肃。...
    茶點(diǎn)故事閱讀 39,965評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖袭祟,靈堂內(nèi)的尸體忽然破棺而出验残,到底是詐尸還是另有隱情,我是刑警寧澤巾乳,帶...
    沈念sama閱讀 35,684評論 5 347
  • 正文 年R本政府宣布您没,位于F島的核電站鸟召,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏氨鹏。R本人自食惡果不足惜欧募,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,295評論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望仆抵。 院中可真熱鬧跟继,春花似錦、人聲如沸镣丑。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,894評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽传轰。三九已至剩盒,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間慨蛙,已是汗流浹背辽聊。 一陣腳步聲響...
    開封第一講書人閱讀 33,012評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留期贫,地道東北人跟匆。 一個月前我還...
    沈念sama閱讀 48,126評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像通砍,于是被迫代替她去往敵國和親玛臂。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,914評論 2 355

推薦閱讀更多精彩內(nèi)容