頭條
DBRX MoE
Databrix 和 Mosaic 訓練了一個 132B 參數(shù) MoE 模型萨螺,性能令人印象深刻饿幅。 他們在 3,000 臺 H100 上訓練了模型并發(fā)布了權重妈橄。 該模型也可在 Databricks API 上使用。
亞馬遜又向 Anthropic 投資 $2.75B
亞馬遜最終向 Anthropic 投資 40 億美元荠耽,這是其迄今為止最大的風險投資。
為什么人工智能搜索引擎真的無法殺死谷歌
新興的人工智能驅動的搜索工具通過提供直接和探索性的答案來挑戰(zhàn)谷歌,但難以匹配其速度鞍恢、多樣化的功能和高效的數(shù)據(jù)呈現(xiàn)房维,這凸顯了用人工智能取代傳統(tǒng)搜索的復雜性沼瘫。
研究
二分搜索向量
搜索嵌入向量是 RAG 管道的關鍵。 如果將 fp32 數(shù)字替換為單個 0 或 1咙俩,然后使用 KNN 聚類器和重新排序器耿戚,則可以在保持性能的同時將內(nèi)存需求減少 30 倍。
Deepfake技術及檢測方法
這項全面的調查深入探討了 Deepfake 技術及其檢測的進步和挑戰(zhàn)阿趁,突出了 Deepfake 創(chuàng)造者與開發(fā)技術來發(fā)現(xiàn)它們之間的軍備競賽膜蛔。
音頻驅動動畫
AniPortrait 是一個旨在從單個參考圖像和音頻輸入創(chuàng)建逼真的動畫肖像的框架。 通過將音頻轉換為 3D 表示脖阵,然后將其映射到 2D 面部標志皂股,該方法生成的動畫在自然面部表情、各種姿勢和高視覺質量方面表現(xiàn)出色命黔。
工程
通過玩《街頭霸王》來衡量LLM的基準 (GitHub Repo)
LLM非常有用呜呐,因為它們快速、準確且遵循指示纷铣。 這種組合使得帶有文本輸入的街頭霸王模擬器成為找出哪些模型擅長這三個標準的絕佳方法卵史。
具有文本和姿勢條件的圖像生成
AID 及其變體 PAID 是兩種旨在通過合并文本和姿勢等條件來改進圖像插值的技術。 這些方法可確保生成的圖像具有增強的一致性搜立、平滑度和保真度以躯,而無需額外的培訓。
無需額外訓練即可提高模型效率
OPTIN 框架引入了一種新穎的方法來提高跨各個領域的基于 Transformer 的 AI 模型的效率,而無需重新訓練忧设。 通過使用一種稱為中間特征蒸餾的技術刁标,OPTIN 可以在特定約束下壓縮網(wǎng)絡,同時幾乎不影響準確性址晕。
雜七雜八
控制人工智能的陰暗全球戰(zhàn)爭的內(nèi)部
世界正在努力應對監(jiān)管人工智能的挑戰(zhàn)膀懈。 全球領導人、技術高管和政策制定者參加的一系列備受矚目的會議和大會暴露了在如何控制這一變革性技術方面存在分歧和缺乏共識谨垃。
根據(jù)您自己的數(shù)據(jù)構建評估管道
定期發(fā)布的新模型聲稱在標準基準上是最先進的启搂。 根據(jù)您自己的任務和數(shù)據(jù)來衡量這些模型非常重要。 Superpipe 是一種幫助根據(jù)您的數(shù)據(jù)構建這些評估管道的工具刘陶。
黑客可以讀取人工智能助手的私人聊天記錄胳赌,即使它們是加密的
研究人員發(fā)現(xiàn)了一種側信道攻擊,可以通過利用加密中的令牌傳輸來高精度破譯特定主題的加密人工智能助手聊天匙隔。 該攻擊利用大型語言模型將令牌序列重建為可讀文本疑苫,可能會暴露敏感的用戶對話。 除 Google Gemini 之外的主要人工智能助手都容易受到這種方法的影響纷责,促使提供商尋求緩解策略捍掺。
OpenAI開始測試GPT收益分享
OpenAI 正在與一小部分美國建筑商合作,測試基于使用情況的 GPT 收入再膳。
Nvidia 在 MLPerf 推理測試中名列前茅
Nvidia 的 GPU挺勿,尤其是 H200,在 MLPerf 的推理基準測試中處于領先地位饵史。