2024-10-30 簡訊 : 麻省理工學院的通用機器人訓練


頭條


麻省理工學院的通用機器人訓練

https://news.mit.edu/2024/training-general-purpose-robots-faster-better-1028

麻省理工學院的研究人員引入了異構(gòu)預訓練 Transformers (HPT)聚谁,這是一種受大型語言模型啟發(fā)的新模型架構(gòu)母剥,可使用來自不同領(lǐng)域和模式的數(shù)據(jù)來訓練多功能機器人。

Google 將語音技術(shù)支持擴展到另外 15 種非洲語言

https://blog.google/around-the-globe/google-africa/africas-digital-decade/

Google 已在其平臺上為另外 15 種非洲語言引入語音識別功能形导,包括語音搜索环疼、Gboard 語音輸入和翻譯聽寫。此次更新使大約 3 億非洲人能夠以自己的母語與數(shù)字內(nèi)容互動朵耕。


研究


具有最小 3D 歸納偏差的視圖合成

https://haian-jin.github.io/projects/LVSM/

長期以來炫隶,人們一直認為新穎的視圖合成需要強大的 3D 歸納偏差。這項工作表明阎曹,通過規(guī)模和一些弱歸納偏差伪阶,大大超越以前認為的限制。

使用每個標記潛在擴散的連續(xù)語音合成

https://arxiv.org/abs/2410.16048

自回歸模型在許多情況下仍然占主導地位处嫌。然而栅贴,最近對圖像擴散頭的研究啟發(fā)了連續(xù) AR 擴散。這項工作將每個標記擴散思想擴展到可變長度輸出熏迹。

遙感中的變化檢測

https://arxiv.org/abs/2409.16261v1

本文引入了變化描述指令數(shù)據(jù)集來微調(diào) LMM檐薯,以實現(xiàn)更好的遙感變化檢測。


工程


Flux IC light

https://github.com/lllyasviel/IC-Light/discussions/98

IC Light 是目前將圖像與預訓練的文本到圖像主干關(guān)聯(lián)起來的最佳方式注暗。本次討論是將該功能擴展到強大的 Flux 模型的開始坛缕。

用于 3D 場景生成的場景語言

https://github.com/zzyunzhi/scene-language

從頭開始生成 3D 場景具有挑戰(zhàn)性墓猎,原因有很多,例如數(shù)據(jù)限制祷膳。這項工作引入了一種類似編程語言來描述 3D 場景陶衅,并表明 Claude Sonnet 可以生成極具吸引力的場景,盡管他沒有接受過這項任務的明確訓練直晨。

3D 語義分割

https://arxiv.org/abs/2410.19446v1

FtD++ 是一種跨模態(tài)學習方法搀军,可改善 3D 語義分割的無監(jiān)督域自適應。


雜七雜八


Gemma 2B 上交叉編碼器的開源復制

https://www.lesswrong.com/posts/srt6JXsRMtmqAJavD/open-source-replication-of-anthropic-s-crosscoder-paper-for

Anthropic 最近發(fā)布了兩篇作品勇皇,重點介紹了其新的可解釋性方法罩句。這篇文章是 Gemma 2B 上交叉編碼器的開源復制。

分布外圖學習方法集

https://github.com/kaize0409/awesome-graph-ood

此存儲庫列出了有關(guān)分布外圖學習的論文敛摘,涵蓋三個主要場景:圖 OOD 泛化门烂、訓練時圖 OOD 適應和測試時圖 OOD 適應。

像 AI 一樣思考

https://www.oneusefulthing.org/p/thinking-like-an-ai

LLM 充當復雜的自動完成系統(tǒng)兄淫,根據(jù)訓練數(shù)據(jù)和當前輸入預測下一個標記屯远。輸入的微小變化會影響預測,即使是同一個問題也會導致不同的輸出捕虽。了解標記預測慨丐、訓練數(shù)據(jù)上下文和內(nèi)存限制可以幫助改進 AI 的使用。

多模態(tài) Web 代理

https://github.com/minorjerry/openwebvoyager

OpenWebVoyager 提供工具泄私、數(shù)據(jù)和模型房揭,用于開發(fā)能夠通過真實世界的 Web 交互進行導航和學習的多模態(tài) Web 代理。

動畫自動著色

https://ykdai.github.io/projects/InclusionMatching

研究人員推出了一種新穎的包含匹配方法晌端,解決了自動著色的挑戰(zhàn)捅暴,尤其是在動畫中,遮擋和皺紋可能會破壞傳統(tǒng)的片段匹配咧纠。

Lofi 音樂數(shù)據(jù)集

https://huggingface.co/datasets/vikhyatk/lofi

由音樂生成模型生成的音樂片段和詳細文本描述的數(shù)據(jù)集蓬痒。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市漆羔,隨后出現(xiàn)的幾起案子乳幸,更是在濱河造成了極大的恐慌,老刑警劉巖钧椰,帶你破解...
    沈念sama閱讀 206,013評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件粹断,死亡現(xiàn)場離奇詭異,居然都是意外死亡嫡霞,警方通過查閱死者的電腦和手機瓶埋,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人养筒,你說我怎么就攤上這事曾撤。” “怎么了晕粪?”我有些...
    開封第一講書人閱讀 152,370評論 0 342
  • 文/不壞的土叔 我叫張陵挤悉,是天一觀的道長。 經(jīng)常有香客問我巫湘,道長装悲,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,168評論 1 278
  • 正文 為了忘掉前任尚氛,我火速辦了婚禮诀诊,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘阅嘶。我一直安慰自己属瓣,他們只是感情好,可當我...
    茶點故事閱讀 64,153評論 5 371
  • 文/花漫 我一把揭開白布讯柔。 她就那樣靜靜地躺著抡蛙,像睡著了一般。 火紅的嫁衣襯著肌膚如雪魂迄。 梳的紋絲不亂的頭發(fā)上粗截,一...
    開封第一講書人閱讀 48,954評論 1 283
  • 那天,我揣著相機與錄音极祸,去河邊找鬼。 笑死怠晴,一個胖子當著我的面吹牛遥金,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播蒜田,決...
    沈念sama閱讀 38,271評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼稿械,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了冲粤?” 一聲冷哼從身側(cè)響起美莫,我...
    開封第一講書人閱讀 36,916評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎梯捕,沒想到半個月后厢呵,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,382評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡傀顾,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,877評論 2 323
  • 正文 我和宋清朗相戀三年襟铭,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 37,989評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡寒砖,死狀恐怖赐劣,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情哩都,我是刑警寧澤魁兼,帶...
    沈念sama閱讀 33,624評論 4 322
  • 正文 年R本政府宣布,位于F島的核電站漠嵌,受9級特大地震影響咐汞,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜献雅,卻給世界環(huán)境...
    茶點故事閱讀 39,209評論 3 307
  • 文/蒙蒙 一碉考、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧挺身,春花似錦侯谁、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至贱傀,卻和暖如春惨撇,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背府寒。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評論 1 260
  • 我被黑心中介騙來泰國打工魁衙, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人株搔。 一個月前我還...
    沈念sama閱讀 45,401評論 2 352
  • 正文 我出身青樓剖淀,卻偏偏與公主長得像,于是被迫代替她去往敵國和親纤房。 傳聞我的和親對象是個殘疾皇子纵隔,可洞房花燭夜當晚...
    茶點故事閱讀 42,700評論 2 345

推薦閱讀更多精彩內(nèi)容