頭條
Phi 2 在 Azure 模型工作室中可用
https://www.microsoft.com/en-us/research/blog/phi-2-the-surprising-power-of-small-language-models/
Phi 2 是 Azure 系列中的下一代微型語言模型程拭,主要基于合成數(shù)據(jù)進(jìn)行訓(xùn)練恰聘。這個具有 27 億參數(shù)的模型達(dá)到了 130 億參數(shù)模型的性能愿吹。這里的挑戰(zhàn)是檢測和減輕“測試集改寫”蔚润,但無論如何抗碰,這個模型都相當(dāng)強大咏瑟。
OpenAI 領(lǐng)導(dǎo)層在 Sam Altman 被解雇前警告過濫用行為
https://www.msn.com/en-us/money/companies/warning-from-openai-leaders-helped-trigger-sam-altman-s-ouster/ar-AA1ldAfV
OpenAI 的一群高級領(lǐng)導(dǎo)向董事會提出對 Sam Altman 據(jù)稱心理虐待行為的擔(dān)憂饱溢,這包括制造混亂和挑撥員工對立,以及對 Altman 在董事會溝通中的不誠實行為的指控窟她,這導(dǎo)致了他的短暫解雇。Altman 的復(fù)職是在員工的壓倒性支持和大規(guī)模辭職威脅后進(jìn)行的眯娱,但這一事件給公司內(nèi)部留下了不確定性礁苗,也對其未來的方向提出了疑問。
Mistral 平臺
https://mistral.ai/news/la-plateforme/
Mistral 現(xiàn)在擁有一個帶有新模型徙缴、嵌入式和指令調(diào)優(yōu)模型的 API试伙。它有一個未發(fā)布的中等大小模型,性能超過 GPT-3.5于样。
研究
使用減少的 GPU 使用量的視覺語言建模
https://arxiv.org/abs/2312.06401v1
研究人員引入了一種新方法疏叨,Compound Text-Guided Prompt Tuning (TGP-T),用于視覺語言模型穿剖,如 CLIP锐墙。TGP-T 在顯著降低 GPU 內(nèi)存使用的同時提高了性能钝域。它通過使用文本監(jiān)督來優(yōu)化提示,提高了在處理多種類別時的靈活性和效率。
使用圖像對應(yīng)先驗增強 NeRF 訓(xùn)練
https://yxlao.github.io/corres-nerf/
CorresNeRF 引入了一種改進(jìn)神經(jīng)輻射場 (NeRFs) 性能的新方法渔隶,特別是在輸入視圖有限的情況下。通過利用圖像對應(yīng)先驗進(jìn)行監(jiān)督来庭,這種方法改進(jìn)了 NeRF 訓(xùn)練调缨,從而提高了光度和幾何精度。
使用擴(kuò)散模型進(jìn)行異常檢測
https://arxiv.org/abs/2312.06607v1
DiAD 利用擴(kuò)散模型的力量來檢測異常蘸劈。它獨特地結(jié)合了像素空間自動編碼器昏苏、語義引導(dǎo) (SG) 網(wǎng)絡(luò)和特征空間提取器,以準(zhǔn)確地檢測和定位多類設(shè)置中的異常威沫。
工程
通過 2D 圖像處理簡化 3D 編輯
https://felixcheng97.github.io/AGAP/
AGAP 是一種簡化 3D 編輯的新方法贤惯。通過使用稱為規(guī)范圖像的 2D 圖像,AGAP 允許用戶輕松編輯 3D 場景棒掠,而無需為每個更改重新優(yōu)化孵构。
增強基于文本提示的 3D 內(nèi)容創(chuàng)建
https://liuff19.github.io/Sherpa3D/
Sherpa3D 是一個開創(chuàng)性的框架,它改進(jìn)了從文本提示創(chuàng)建 3D 內(nèi)容的過程烟很。它結(jié)合了 2D 和 3D 擴(kuò)散模型的優(yōu)勢颈墅,使用粗略的 3D 知識指導(dǎo)創(chuàng)建過程棒假。這導(dǎo)致了高質(zhì)量、多樣性和幾何上一致的 3D 資產(chǎn)的生成精盅,克服了現(xiàn)有方法的限制帽哑。
加速神經(jīng)體積視頻研究 (GitHub 倉庫)
https://github.com/zju3dv/easyvolcap
EasyVolcap 是一個用于加速神經(jīng)體積視頻研究的 PyTorch 庫,特別是在體積視頻捕獲叹俏、重建和渲染方面妻枕。
雜七雜八
可互操作的認(rèn)證協(xié)議
https://www.artifact.io/iap
鑒于模型能力的快速發(fā)展,協(xié)調(diào)語言模型與用戶之間的溝通至關(guān)重要粘驰÷判常可互操作授權(quán)協(xié)議 (IAP) 旨在通過建立安全、適應(yīng)性強的通信渠道和同意管理系統(tǒng)來解決這一問題蝌数。這種開源方法鼓勵 AI 社區(qū)合作愕掏,以使 AI 操作與多樣化的人類價值和目標(biāo)保持一致。
MIT 小組發(fā)布關(guān)于 AI 治理的白皮書
https://news.mit.edu/2023/mit-group-releases-white-papers-governance-ai-1211
MIT 的領(lǐng)導(dǎo)人和學(xué)者組成的委員會發(fā)布了政策簡報顶伞,為美國 AI 治理提供了框架饵撑,倡導(dǎo)將現(xiàn)有的監(jiān)管和責(zé)任方法擴(kuò)展到有效監(jiān)管 AI。他們的提議旨在加強美國在 AI 領(lǐng)域的領(lǐng)導(dǎo)地位唆貌,最小化潛在的危害滑潘,并鼓勵有益的 AI 應(yīng)用,強調(diào)在 AI 工具中明確定義目的和意圖的需要锨咙,并建議可能的新監(jiān)督結(jié)構(gòu)语卤。
關(guān)于平臺轉(zhuǎn)變和 AI
https://caseyaccidental.com/on-platform-shifts-and-ai/
在 2022 年 TCV Engage 峰會上的討論強調(diào),盡管 AI 代表著技術(shù)轉(zhuǎn)變酪刀,但它缺乏新的分銷渠道粹舵,這對于創(chuàng)造重大的消費者機會至關(guān)重要。當(dāng)前的 AI 創(chuàng)新必須依賴傳統(tǒng)的分銷方法骂倘,有利于已經(jīng)建立的公司或創(chuàng)新型初創(chuàng)企業(yè)眼滤,但新分銷平臺的潛力仍不確定。
谷歌考慮 Gemini AI 項目稠茂,使用手機數(shù)據(jù)柠偶、照片講述人們的生活故事
https://www.cnbc.com/2023/12/08/google-weighing-project-ellmann-uses-gemini-ai-to-tell-life-stories.html
谷歌的“Project Ellmann”提出使用 AI 分析移動數(shù)據(jù)情妖,如照片和搜索睬关,創(chuàng)建用戶生活的詳細(xì)“鳥瞰”敘述,盡管其是否整合到現(xiàn)有產(chǎn)品如 Google Photos 中仍然不確定毡证。
Ollama 多模態(tài)預(yù)發(fā)布 (GitHub 發(fā)布)
https://github.com/jmorganca/ollama/releases/tag/v0.1.15
Ollama 是使用現(xiàn)代語言模型的一種驚人的簡單方式电爹。它正在增加多模態(tài)支持,帶有像 Llava 這樣的模型料睛。
Respell (產(chǎn)品)
https://www.respell.ai/
使用 AI 工作流程和代理自動化知識工作丐箩。