頭條
馬斯克的起訴曝光了 OpenAI 的早期 drama 內(nèi)幕
埃隆·馬斯克 (Elon Musk) 對(duì) OpenAI 提起的訴訟導(dǎo)致該初創(chuàng)公司早期的電子郵件被曝光蒿讥,揭示了內(nèi)部緊張局勢(shì)械巡。
Spotify CEO Gustav 透露其計(jì)劃開發(fā) AI 生成的音樂蹬跃、播客和推薦
https://www.bigtechnology.com/p/spotifys-plans-for-ai-generated-music
Spotify 正在擁抱 AI 驅(qū)動(dòng)的內(nèi)容創(chuàng)作琼掠,使用 Suno 和 NotebookLM 等生成 AI 工具制作音樂和播客,同時(shí)利用 LLM 來增強(qiáng)用戶推薦府喳。聯(lián)席總裁 Gustav S?derstr?m 表示落塑,AI 是一種增強(qiáng)創(chuàng)造力的工具蛤克,而不是替代創(chuàng)造力,并且 AI 有潛力促進(jìn)更深入的用戶參與和個(gè)性化體驗(yàn)闷祥。Spotify 仍致力于支持其平臺(tái)上的創(chuàng)作者娱颊,確保法律合規(guī),同時(shí)探索動(dòng)態(tài) AI 驅(qū)動(dòng)的創(chuàng)新凯砍。
Anthropic 聘請(qǐng)首位“AI 福利”研究員
https://arstechnica.com/ai/2024/11/anthropic-hires-its-first-ai-welfare-researcher/
Anthropic 聘請(qǐng) Kyle Fish 作為首位“AI 福利”研究員箱硕,探索圍繞潛在 AI 意識(shí)和道德權(quán)利的道德考量。這標(biāo)志著 AI 公司在解決與 AI 系統(tǒng)意識(shí)和代理相關(guān)的道德問題方面的潛在轉(zhuǎn)變悟衩。Fish 最近的論文討論了如何提高對(duì) AI 福利的理解剧罩,以避免在 AI 道德考量方面做出錯(cuò)誤決策。
研究
Llama Mesh
https://research.nvidia.com/labs/toronto-ai/LLaMA-Mesh/
Nvidia 基于 LlaMA 的微調(diào)模型座泳,可以根據(jù)文本輸入為 3D 模型生成頂點(diǎn)惠昔。
語義感知水印
https://arxiv.org/abs/2411.09359v1
研究人員引入了語義擾動(dòng)攻擊來對(duì)抗現(xiàn)有的水印方案攻擊幕与。
解決旅行商問題
https://arxiv.org/abs/2411.09238v1
這項(xiàng)研究揭示了“熱圖 + 蒙特卡洛樹搜索 (MCTS)”方法被忽視的重要性,表明仔細(xì)調(diào)整和簡單的熱圖可以勝過復(fù)雜模型镇防。
工程
視頻轉(zhuǎn)換器的運(yùn)行長度標(biāo)記化
https://github.com/rccchoudhury/rlt
通過自適應(yīng)地緩存未隨幀發(fā)生變化的視頻標(biāo)記啦鸣,您可以大幅加快運(yùn)行時(shí)間,且性能不會(huì)降低来氧,無需額外訓(xùn)練诫给。
區(qū)域感知文本到圖像生成
https://github.com/NJU-PCALab/RAG-Diffusion
一種基于選定區(qū)域生成具有改進(jìn)控制的圖像的改進(jìn)技術(shù)。
精確圖像匹配
MOP+MiHo+NCC 是一種非深度模塊化方法饲漾,通過結(jié)合三種技術(shù)來細(xì)化圖像匹配蝙搔。多重重疊平面 (MOP) 聚類內(nèi)點(diǎn)匹配并使用 RANSAC 過濾異常值。中間單應(yīng)性 (MiHo) 減少平面重投影中的失真考传。歸一化互相關(guān) (NCC) 在變換后細(xì)化關(guān)鍵點(diǎn)位置吃型。
雜七雜八
基于圖形的人工智能模型描繪創(chuàng)新的未來
https://news.mit.edu/2024/graph-based-ai-model-maps-future-innovation-1112
麻省理工學(xué)院的研究人員開發(fā)了一種人工智能模型,利用生成知識(shí)提取和圖形推理來揭示連接生物學(xué)和音樂等不同領(lǐng)域的復(fù)雜模式僚楞。該模型有效地從科學(xué)論文中創(chuàng)建知識(shí)圖譜勤晚,識(shí)別聯(lián)系并提出受藝術(shù)啟發(fā)的創(chuàng)新材料。這種方法增強(qiáng)了跨學(xué)科研究泉褐,揭示了材料設(shè)計(jì)的隱藏見解和新概念赐写。
視覺提示注入初學(xué)者指南
https://www.lakera.ai/blog/visual-prompt-injections
視覺提示注入通過在圖像中嵌入惡意指令,導(dǎo)致意外的模型行為膜赃,對(duì) GPT-4V 等 LLM 構(gòu)成安全風(fēng)險(xiǎn)挺邀。這些漏洞可以操縱輸出,例如忽略圖像中的個(gè)人或更改描述的上下文跳座。隨著 GenAI 的采用率不斷提高端铛,公司需要采取強(qiáng)大的安全措施來緩解這些威脅。
如果人工智能不能永遠(yuǎn)變得更好怎么辦疲眷?
https://arstechnica.com/ai/2024/11/what-if-ai-doesnt-just-keep-getting-better-forever/
報(bào)告顯示禾蚕,傳統(tǒng)的 LLM 培訓(xùn)可能正在遭遇收益遞減,因?yàn)橄?OpenAI 的 Orion 這樣的新模型并沒有顯著優(yōu)于前輩狂丝。專家們擔(dān)心 LLM 培訓(xùn)的優(yōu)質(zhì)文本數(shù)據(jù)會(huì)耗盡换淆,從而促使人們轉(zhuǎn)向合成數(shù)據(jù)和專門的 AI 模型。未來的進(jìn)步可能會(huì)側(cè)重于推理改進(jìn)和特定于任務(wù)的模型几颜,而不是一般的擴(kuò)展倍试。
自動(dòng)創(chuàng)建 Python 包
https://github.com/GitsSaikat/Pygen
Pygen 將想法轉(zhuǎn)化為 Python 包。
UltraVox 音頻語言模型
一套開放權(quán)重模型菠剩,可以將文本和音頻作為輸入模式易猫。
AI 使技術(shù)債務(wù)更加昂貴
https://www.gauge.sh/blog/ai-makes-tech-debt-more-expensive
AI 通過擴(kuò)大低債務(wù)和高債務(wù)代碼庫之間的速度差距來增加技術(shù)債務(wù)的成本。