頭條
蘋果的機(jī)器人技術(shù)旨在解決用戶的第一世界問題
https://appleinsider.com/articles/24/08/25/first-world-problems-drives-apples-robotics-development
蘋果可能正在向機(jī)器人領(lǐng)域擴(kuò)張,可能會(huì)推出可移動(dòng)的設(shè)備,例如安裝在機(jī)械臂上的 iPad屡立。在技術(shù)副總裁 Kevin Lynch 的領(lǐng)導(dǎo)下,蘋果的機(jī)器人技術(shù)工作在以色列理工學(xué)院等公司專家的幫助下取得了進(jìn)展兼搏,并提議在 Siri 之外加入 AI 界面。雖然仍處于概念階段沙郭,但蘋果正在考慮在 2026 年或 2027 年發(fā)布這些新的機(jī)器人產(chǎn)品佛呻。
Cohere Command R 更新
https://cohere.com/blog/command-series-0824
Command R 和 Command R+ 在所有任務(wù)上都得到了升級(jí)。它們現(xiàn)在在回憶病线、速度吓著、數(shù)學(xué)和推理方面都表現(xiàn)得更好鲤嫡。
Google DeepMind 員工敦促公司放棄軍事合同
https://time.com/7013685/google-ai-deepmind-military-contracts-israel/
近 200 名 Google DeepMind 員工簽署了一封信,敦促 Google 終止軍事合同绑莺,聲稱這違反了該公司自己的 AI 道德原則暖眼。DeepMind 技術(shù)已被捆綁到 Google Cloud 中并出售給軍方,引發(fā)了與重視道德標(biāo)準(zhǔn)的 AI 員工的內(nèi)部沖突纺裁。Google 的回應(yīng)表明了對(duì) AI 原則的遵守诫肠,但員工仍然不滿意,尋求加強(qiáng)對(duì)其 AI 的軍事用途的治理欺缘。
研究
MoE 的無(wú)輔助損失負(fù)載平衡
https://arxiv.org/abs/2408.15664
將Token路由到 MoE 中的專家有助于稀疏計(jì)算栋豫。但是,學(xué)習(xí)路由可能具有挑戰(zhàn)性谚殊。通常存在復(fù)雜的損失結(jié)構(gòu)丧鸯。本文展示了一種克服此問題并顯著提高專家平衡和訓(xùn)練穩(wěn)定性的新方法。
提高低光視頻質(zhì)量
https://arxiv.org/abs/2408.14916v1
這個(gè)端到端框架同時(shí)解決了使用事件攝像機(jī)的視頻中的低光增強(qiáng)和運(yùn)動(dòng)去模糊問題络凿。
聲源定位
https://arxiv.org/abs/2408.16448v1
研究人員提出了一種新的視聽學(xué)習(xí)框架來(lái)增強(qiáng)聲源定位骡送,解決了傳統(tǒng)方法中的假陰性問題昂羡。該框架包括兩種方案:自監(jiān)督預(yù)測(cè)學(xué)習(xí) (SSPL) 和語(yǔ)義感知對(duì)比學(xué)習(xí) (SACL)絮记。SSPL 通過(guò)專注于正向?qū)W習(xí)來(lái)消除假陰性,而 SACL 則改進(jìn)對(duì)比學(xué)習(xí)過(guò)程以改善音頻和視覺特征之間的一致性虐先。
工程
TRL 發(fā)布
https://github.com/huggingface/trl/releases/tag/v0.10.1
這可能是 Transformer 強(qiáng)化學(xué)習(xí)庫(kù)的重大改進(jìn)之一怨愤。它包括 onlineDPO、Liger Kernels蛹批、WinRate Callbacks 等撰洗。
CPU 上 Schnell 的快速 SD 支持
流行的推理庫(kù)現(xiàn)在支持在 CPU 上運(yùn)行的 Flux Schnell。
用于圖像生成的脈沖擴(kuò)散模型
https://github.com/andycao1125/sdm
脈沖擴(kuò)散模型 (SDM) 是專為圖像生成而設(shè)計(jì)的脈沖神經(jīng)網(wǎng)絡(luò) (SNN) 的新系列腐芍,可顯著節(jié)省能源并具有很高的生物合理性差导。
雜七雜八
Laion 5B 安全發(fā)布
https://laion.ai/blog/relaion-5b/
Laion 5B 是互聯(lián)網(wǎng)上最大的開放圖像數(shù)據(jù)集。由于擔(dān)心圖像不當(dāng)和有害猪勇,它被關(guān)閉设褐。該組織已做出重大努力來(lái)緩解這些問題,現(xiàn)在正在重新發(fā)布數(shù)據(jù)集泣刹。
下一代皮克斯:人工智能將如何融合電影和游戲
https://a16z.com/the-next-generation-pixar/
生成式人工智能有望徹底改變講故事的方式助析,將敘事深度與視頻游戲的動(dòng)態(tài)互動(dòng)性融合在一起。OpenAI 的 Sora 和 Luma AI 的 Dream Machine 等生成模型的最新進(jìn)展正在加速這一轉(zhuǎn)變椅您,實(shí)現(xiàn)實(shí)時(shí)交互式視頻創(chuàng)作外冀。這一演變有可能在交互式媒體中產(chǎn)生下一個(gè)“皮克斯”,將電影掀泳、游戲和人工智能融合在一起雪隧。
中國(guó)機(jī)器人制造商追趕特斯拉西轩,提供人形機(jī)器人工人
在北京舉行的世界機(jī)器人大會(huì)上,超過(guò) 25 家中國(guó)公司展示了旨在實(shí)現(xiàn)工廠自動(dòng)化的人形機(jī)器人脑沿,這些機(jī)器人得到了政府的大量投資支持遭商,并利用了中國(guó)深厚的供應(yīng)鏈。預(yù)計(jì)到 2035 年捅伤,全球人形機(jī)器人市場(chǎng)將達(dá)到 380 億美元劫流。中國(guó)希望在 2025 年前大規(guī)模生產(chǎn)這些機(jī)器人,從而加劇與特斯拉即將推出的 Optimus 機(jī)器人的競(jìng)爭(zhēng)丛忆。特斯拉預(yù)計(jì)明年將在其工廠部署 1,000 臺(tái) Optimus 機(jī)器人祠汇,而中國(guó)公司預(yù)計(jì)其模型的成本將大幅降低。
Vybe 籌集 475 萬(wàn)美元熄诡,為 AI 照片帶來(lái)樂趣可很,并提供與朋友聯(lián)系的新方式
Vybe AI 相機(jī)應(yīng)用程序使用尖端 AI 將您的自拍照轉(zhuǎn)換為生動(dòng)、美麗的照片凰浮。
蘋果和 Nvidia 可能會(huì)投資 OpenAI
https://www.theverge.com/2024/8/29/24231626/apple-nvidia-openai-invest-microsoft
據(jù)報(bào)道我抠,OpenAI 正在準(zhǔn)備進(jìn)行一輪重大融資,該公司的估值可能超過(guò) 1000 億美元袜茧,可能涉及蘋果菜拓、Nvidia 和微軟的投資。
波士頓動(dòng)力公司的新型電動(dòng) Atlas 可以做俯臥撐
https://techcrunch.com/2024/08/22/boston-dynamics-new-electric-atlas-can-do-push-ups/
波士頓動(dòng)力公司在一段新視頻中展示了其電動(dòng)雙足機(jī)器人 Atlas 做俯臥撐的動(dòng)作笛厦,該視頻強(qiáng)調(diào)了其在工廠車間應(yīng)用的早期商業(yè)化階段中強(qiáng)大的執(zhí)行器纳鼎。