2024-11-06 簡(jiǎn)訊 : AMD 的新語(yǔ)言模型


頭條


AMD 的新語(yǔ)言模型

https://www.amd.com/en/developer/resources/technical-articles/introducing-the-first-amd-1b-language-model.html?utm_source=tldrai

AMD 使用 OLMO 代碼庫(kù)來(lái)訓(xùn)練和發(fā)布在其加速器上訓(xùn)練的語(yǔ)言模型。

Etched & Decart 的 Oasis

https://www.etched.com/blog-posts/oasis

Etched 和 Decart 的 Oasis 是一種 AI 模型温亲,可根據(jù)用戶輸入逐幀生成開放世界游戲,展現(xiàn)出先進(jìn)的物理理解和實(shí)時(shí)交互能力。Oasis 采用針對(duì)即將推出的搜狐芯片優(yōu)化的 Diffusion Transformer 架構(gòu),可實(shí)現(xiàn)大規(guī)模秩铆、低延遲的 4K 視頻模型。該模型集成了定制硬件灯变,可大規(guī)模提高性能,代表著向交互式 AI 生成內(nèi)容的轉(zhuǎn)變添祸。

OpenAI 將開始使用 AMD 芯片,并可能在 2026 年制造自己的 AI 硬件

https://www.theverge.com/2024/10/29/24282843/openai-custom-hardware-amd-nvidia-ai-chips

OpenAI 正在與 Broadcom 和 TSMC 合作開發(fā)定制 AI 芯片刃泌,預(yù)計(jì)將于 2026 年開始生產(chǎn)凡壤。與此同時(shí),OpenAI 正在將 AMD 的 MI300 芯片集成到其 Microsoft Azure 基礎(chǔ)設(shè)施中耙替。盡管在定制芯片戰(zhàn)略上與其他科技巨頭保持一致亚侠,但 OpenAI 在硬件開發(fā)方面仍落后于谷歌俗扇、微軟和亞馬遜。


研究


無(wú)相機(jī)姿勢(shì)的 3D 場(chǎng)景重建

https://noposplat.github.io/

NoPoSplat 是一種前饋模型铜幽,可以從稀疏的多視圖圖像重建 3D 場(chǎng)景,而無(wú)需精確的相機(jī)姿勢(shì)爹凹。

改進(jìn)語(yǔ)言模型的推理

https://arxiv.org/abs/2410.23856v1

這項(xiàng)研究解決了 LLM 中的一個(gè)獨(dú)特挑戰(zhàn):它們?nèi)绾翁幚戆幌嚓P(guān)或不正確的理由片段的推理提示镶殷。

語(yǔ)言模型中的長(zhǎng)上下文評(píng)估

https://arxiv.org/abs/2410.23771v1

這項(xiàng)研究確定了使用困惑度 (PPL) 評(píng)估 LLM 的長(zhǎng)上下文能力的一個(gè)關(guān)鍵缺陷 - PPL 對(duì)所有標(biāo)記進(jìn)行平均,并忽略了理解擴(kuò)展輸入所需的關(guān)鍵標(biāo)記绘趋。為了改進(jìn)這一點(diǎn)颗管,作者引入了 LongPPL陷遮,這是一種突出顯示這些基本標(biāo)記的指標(biāo)垦江,可以更清楚地衡量長(zhǎng)上下文性能。


工程


語(yǔ)言模型中的快速思維與慢速思維

https://github.com/mingliiii/layer_gradient

該項(xiàng)目探索了不同的“思維”方法——快速(簡(jiǎn)潔)與慢速(詳細(xì)绽族,如思維鏈推理)——如何影響 LLM 中的分層梯度和穩(wěn)定性姨涡。

僅使用 2D 圖像進(jìn)行 3D 物體檢測(cè)

https://github.com/yangtiming/imov3d

ImOV3D 是一個(gè)框架吧慢,它利用 2D 圖像來(lái)克服 3D 注釋的稀缺性,從而推進(jìn)開放詞匯 3D 物體檢測(cè) (OV-3Det)匈仗。

文本到視頻生成中的真實(shí)運(yùn)動(dòng)

https://pr-ryan.github.io/DEMO-project/

DEMO 是一個(gè)將文本和條件分為內(nèi)容和運(yùn)動(dòng)組件的框架逢慌。通過(guò)對(duì)靜態(tài)內(nèi)容和動(dòng)態(tài)運(yùn)動(dòng)使用不同的編碼器和條件,DEMO 可以更好地從文本提示中解釋和生成運(yùn)動(dòng)攻泼。


雜七雜八


Project Sid

https://threadreaderapp.com/thread/1852397383939960926.html

Project Sid 展示了文明進(jìn)步、專業(yè)化坠韩、治理以及模因和宗教的發(fā)明和傳播。這些都得益于 Altera 的新認(rèn)知架構(gòu):PIANO只搁。

我們正在分叉 Flutter, 原因如下

https://flutterfoundation.dev/blog/posts/we-are-forking-flutter-this-is-why/

Google 將公司重點(diǎn)轉(zhuǎn)向人工智能,降低了 Flutter 桌面平臺(tái)的優(yōu)先級(jí)洞翩,導(dǎo)致這個(gè)曾經(jīng)迅速擴(kuò)張的 UI 工具包出現(xiàn)勞動(dòng)力短缺焰望。作為回應(yīng)骚亿,一個(gè)名為 Flock 的分支正在開發(fā)中,其中包含 Flutter 團(tuán)隊(duì)無(wú)法解決的重要錯(cuò)誤修復(fù)和功能来屠,旨在通過(guò)社區(qū)參與加速 Flutter 的發(fā)展震鹉。Flock 計(jì)劃改進(jìn)貢獻(xiàn)流程并簡(jiǎn)化 PR 審核,彌補(bǔ) Flutter 主團(tuán)隊(duì)在支持和開發(fā)速度方面留下的差距传趾。

使用強(qiáng)化學(xué)習(xí)和 4.80 美元的 GPU 時(shí)間找到有史以來(lái)最好的 HN 帖子

https://openpipe.ai/blog/hacker-news-rlhf-part-1

本文討論了使用強(qiáng)化學(xué)習(xí)從人類反饋 (RLHF) 開發(fā)一個(gè)獎(jiǎng)勵(lì)模型,該模型可以預(yù)測(cè) Hacker News 故事的點(diǎn)贊數(shù)浆兰。利用全面的數(shù)據(jù)集和 4.80 美元的 GPU 時(shí)間珊豹,對(duì)獎(jiǎng)勵(lì)模型進(jìn)行了標(biāo)題、作者和內(nèi)容等特征的訓(xùn)練平夜,以優(yōu)化帖子質(zhì)量卸亮,最終目標(biāo)是利用 RLHF 技術(shù)來(lái)增強(qiáng)高價(jià)值內(nèi)容的創(chuàng)作。由此產(chǎn)生的模型雖然并不完美兼贸,但可以成功識(shí)別未被重視的故事并預(yù)測(cè)潛在的頭版點(diǎn)擊量。

Google 的 AI 搜索摘要正在推廣到 100 多個(gè)國(guó)家

https://www.theverge.com/2024/10/28/24281860/google-ai-search-summaries-expand-more-countries

Google 的 AI 概覽正在擴(kuò)展到 100 多個(gè)國(guó)家溶诞,提供多種語(yǔ)言的 AI 生成的搜索摘要。

埃隆·馬斯克終于承認(rèn)特斯拉的 HW3 可能不支持完全自動(dòng)駕駛

https://electrek.co/2024/10/23/elon-musk-finally-admits-teslas-hw3-might-not-support-full-self-driving/

埃隆·馬斯克承認(rèn)特斯拉的 HW3 可能不支持完全自動(dòng)駕駛螺垢,而 HW4 的功能要強(qiáng)大得多。

NVIDIA 以太網(wǎng)網(wǎng)絡(luò)加速由 xAI 打造的全球最大 AI 超級(jí)計(jì)算機(jī)

https://nvidianews.nvidia.com/news/spectrum-x-ethernet-networking-xai-colossus

xAI 的 Colossus 由 NVIDIA 的 Spectrum-X 以太網(wǎng)網(wǎng)絡(luò)平臺(tái)提供支持功茴。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末孽亲,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子返劲,更是在濱河造成了極大的恐慌,老刑警劉巖孵延,帶你破解...
    沈念sama閱讀 206,013評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件亲配,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡弃榨,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)官辈,“玉大人箱舞,你說(shuō)我怎么就攤上這事拳亿。” “怎么了电湘?”我有些...
    開封第一講書人閱讀 152,370評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵鹅经,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我瘾晃,道長(zhǎng),這世上最難降的妖魔是什么劫拢? 我笑而不...
    開封第一講書人閱讀 55,168評(píng)論 1 278
  • 正文 為了忘掉前任强胰,我火速辦了婚禮,結(jié)果婚禮上偶洋,老公的妹妹穿的比我還像新娘。我一直安慰自己涡真,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評(píng)論 5 371
  • 文/花漫 我一把揭開白布缸剪。 她就那樣靜靜地躺著东亦,像睡著了一般。 火紅的嫁衣襯著肌膚如雪典阵。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 48,954評(píng)論 1 283
  • 那天嫉鲸,我揣著相機(jī)與錄音歹啼,去河邊找鬼座菠。 笑死藤树,一個(gè)胖子當(dāng)著我的面吹牛浴滴,可吹牛的內(nèi)容都是我干的岁钓。 我是一名探鬼主播,決...
    沈念sama閱讀 38,271評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼品嚣,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼囚霸!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起拓型,我...
    開封第一講書人閱讀 36,916評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤劣挫,失蹤者是張志新(化名)和其女友劉穎册养,沒想到半個(gè)月后压固,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,382評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡坎炼,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評(píng)論 2 323
  • 正文 我和宋清朗相戀三年拦键,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片芬为。...
    茶點(diǎn)故事閱讀 37,989評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡媚朦,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出询张,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 33,624評(píng)論 4 322
  • 正文 年R本政府宣布鼓拧,位于F島的核電站越妈,受9級(jí)特大地震影響钮糖,放射性物質(zhì)發(fā)生泄漏梅掠。R本人自食惡果不足惜店归,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評(píng)論 3 307
  • 文/蒙蒙 一消痛、第九天 我趴在偏房一處隱蔽的房頂上張望且叁。 院中可真熱鬧秩伞,春花似錦、人聲如沸纱新。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)簿废。三九已至,卻和暖如春族檬,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背导梆。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評(píng)論 1 260
  • 我被黑心中介騙來(lái)泰國(guó)打工看尼, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人藏斩。 一個(gè)月前我還...
    沈念sama閱讀 45,401評(píng)論 2 352
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像媳拴,于是被迫代替她去往敵國(guó)和親黄橘。 傳聞我的和親對(duì)象是個(gè)殘疾皇子屈溉,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容