頭條
AI21 發(fā)布 Jamba 語言模型
曼巴是一種模型風格辈赋,應(yīng)該在效率上擊敗Transformer竞穷,同時匹配性能。 Jamba 是一種包含 MoE 層的新穎變體。 它可以每秒 1.6k 個令牌運行,上下文長度為 128k 個令牌砰左。 它在 MMLU 基準測試中達到了 67%。 重量是可用的场航。
Hume 推出移情語音界面
Hume 發(fā)布了移情語音界面(EVI)缠导,這是第一個具有情商的對話式人工智能。
谷歌開始在谷歌主搜索界面中測試 SGE 的AI
谷歌正在向部分美國用戶試行人工智能在搜索結(jié)果中生成復(fù)雜查詢的概述旗闽,而無需選擇加入其搜索生成體驗酬核。 這種反饋驅(qū)動的測試旨在增強用戶體驗,并可能由于廣告展示位置和自然搜索可見性的變化而影響網(wǎng)站流量動態(tài)适室。
研究
1 Bit, Post Training, Quantization
1 Bit language 模型令人興奮嫡意。 這項工作展示了如何在不犧牲性能的情況下量化語言模型的線性層。 這可能會導(dǎo)致在消費級 GPU 上運行 70B 模型捣辆。
大型語言模型中的長形式事實性
人們可以使用語言模型來生成事實信息蔬螟。 谷歌發(fā)布了一個數(shù)據(jù)集和基準測試來顯示每個模型的表現(xiàn)如何。 該報告深入探討了如何提高模型的真實性汽畴,并展示了語言模型在大多數(shù)情況下戰(zhàn)勝了人類注釋者旧巾。
改進模型適應(yīng)性
CoDA 是一種新的無監(jiān)督域適應(yīng) (UDA) 方法。 它通過學習場景和圖像級別的差異忍些,幫助人工智能模型更好地適應(yīng)未標記的鲁猩、具有挑戰(zhàn)性的環(huán)境。
工程
使用 AI 識別內(nèi)容中的混亂來源 (GitHub Repo)
這種方法可以精確定位觸發(fā)用戶在線問題的確切內(nèi)容罢坝,從講座到新聞文章廓握。 這種方法稱為回溯,旨在通過識別和理解困惑嘁酿、好奇或情緒反應(yīng)的原因來幫助內(nèi)容創(chuàng)建者改進他們的工作隙券。
高分辨率大型語言視覺助手 (GitHub Repo)
研究人員開發(fā)了一種新方法,即分辨率混合適應(yīng)(MRA)闹司,可以提高人工智能識別圖像細節(jié)的能力娱仔。
3D 醫(yī)學成像數(shù)據(jù)集 (GitHub Repo)
CT-RATE 是一個將 3D 醫(yī)學成像與文本報告結(jié)合在一起的數(shù)據(jù)集游桩。 CT-CLIP 是針對這些圖像進行優(yōu)化的多功能人工智能框架。
雜七雜八
指數(shù)增長和人工智能逃逸速度
人工智能未來學家雷·庫茲韋爾(Ray Kurzweil)發(fā)明了加速回報定律众弓,該定律指出恩溅,隨著時間的推移谓娃,進步的速度呈指數(shù)級增長。 在最近的一次討論中滨达,庫茲韋爾探討了各種主題,包括只會變得更好的前景捡遍、人工智能經(jīng)濟的發(fā)展方向锌订、人類與人工智能的關(guān)系画株、長壽逃逸速度等等啦辐。
人工智能時代大量高薪工作
人工智能專家正在探索自動化人類任務(wù),這引發(fā)了人們對失業(yè)和工資下降的擔憂芹关。 然而,認為人工智能進步將不可避免地導(dǎo)致人類工作被淘汰的觀點可能并不正確紧卒。 由于計算能力和機會成本等限制侥衬,人類可能會在人工智能主導(dǎo)的未來保留就業(yè),盡管這種情況并不能得到保證跑芳。
Meta 正在為其 Ray-Ban 智能眼鏡添加人工智能功能
Meta 正在為其雷朋智能眼鏡引入人工智能功能轴总,包括翻譯以及通過語音命令激活的物體、動物和紀念碑的識別博个。
谷歌將 Gemini Nano 引入 Pixel 8
Pixel 8 將在開發(fā)者預(yù)覽版中配備 Gemini Nano怀樟,以增強錄音機中的匯總和 Gboard 智能回復(fù)等功能。