頭條
DeepSeek如何改進(jìn)了Transformer架構(gòu)
https://epoch.ai/gradient-updates/how-has-deepseek-improved-the-transformer-architecture
DeepSeek是僅有的在生成模型底層架構(gòu)上穩(wěn)健創(chuàng)新的開源模型供應(yīng)商之一采转。具體而言,其研究進(jìn)展并非靠蠻力取得,而是源自那些清楚了解Transformer原理并基于此開展工作的團(tuán)隊(duì) 兼贡。
Mistral 的首次公開募股計(jì)劃
https://finance.yahoo.com/news/buzzy-french-ai-startup-mistral-133915078.html
法國(guó)人工智能初創(chuàng)公司米斯特拉爾(Mistral)計(jì)劃進(jìn)行首次公開募股,而非被收購(gòu)。它已籌集大量資金衣洁,完全有能力繼續(xù)在全球提供服務(wù)虱肄,尤其是面向歐洲公司致板。
英偉達(dá)的 STEREO
https://nvlabs.github.io/FoundationStereo/
英偉達(dá)提出一種新方法,將基礎(chǔ)模型與立體匹配技術(shù)相結(jié)合咏窿,以增強(qiáng)機(jī)器人和自動(dòng)駕駛汽車的3D感知能力斟或。
研究
地標(biāo)定位工具包
https://arxiv.org/abs/2501.10098v1
這篇論文介紹了“l(fā)andmarker”,它是一個(gè)基于PyTorch構(gòu)建的Python軟件包集嵌,為開發(fā)和評(píng)估地標(biāo)定位算法提供了靈活的工具集萝挤。
具身基礎(chǔ)模型
https://2toinf.github.io/UniAct/
UniAct是一種全新的具身基礎(chǔ)建模框架根欧,可在通用動(dòng)作空間中運(yùn)行平斩。
海豚3.0(Hugging Face平臺(tái))
https://huggingface.co/cognitivecomputations/Dolphin3.0-Llama3.1-8B
基于Llama 3.1 8B構(gòu)建的新Dolphin模型,經(jīng)過訓(xùn)練可通過系統(tǒng)提示接收指令咽块。這意味著它在各種角色塑造和角色扮演方面表現(xiàn)出色,同時(shí)還保留了基礎(chǔ)Llama模型本身的諸多能力欺税。
工程
外科基礎(chǔ)模型(GitHub 倉(cāng)庫(kù))
https://github.com/timjaspers0801/surgenet
SurgeNet是一種新型手術(shù)基礎(chǔ)模型侈沪,為手術(shù)計(jì)算機(jī)視覺設(shè)定了新標(biāo)桿。
個(gè)人人工智能訓(xùn)練師(GitHub代碼庫(kù))
這個(gè)項(xiàng)目提供直觀的網(wǎng)頁(yè)界面晚凿,讓鍛煉記錄更輕松亭罪、更有效。
參數(shù)高效微調(diào)框架(GitHub 倉(cāng)庫(kù))
https://github.com/jiaqihuang01/DETRIS
DETRIS在采用密集互連和文本適配器的多模態(tài)任務(wù)中歼秽,為未對(duì)齊的編碼器增強(qiáng)視覺特征傳播应役。
其他
企業(yè)為何需要人工智能查詢引擎來推動(dòng)智能代理式人工智能
https://blogs.nvidia.com/blog/ai-query-engines-agentic-ai/
人工智能查詢引擎能讓企業(yè)有效利用大量結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),彌合原始數(shù)據(jù)與人工智能應(yīng)用之間的差距燥筷。它們具備多種數(shù)據(jù)處理箩祥、可擴(kuò)展性、精準(zhǔn)檢索和持續(xù)學(xué)習(xí)等先進(jìn)特性肆氓,提升了人工智能智能體的能力袍祖。像DataStax這樣的公司已在借助這些引擎,為客戶服務(wù)谢揪、視頻搜索和軟件分析等領(lǐng)域的應(yīng)用提供支持 蕉陋。
OpenAI #10:思考
https://thezvi.substack.com/p/openai-10-reflections
山姆·奧特曼談及他意外被OpenAI董事會(huì)解雇一事,并反思其對(duì)公司治理和自身領(lǐng)導(dǎo)的影響拨扶。他回應(yīng)了對(duì)OpenAI戰(zhàn)略的批評(píng)凳鬓,強(qiáng)調(diào)公司目標(biāo)是安全地逐步實(shí)現(xiàn)通用人工智能(AGI),同時(shí)承認(rèn)有高層離職患民。奧特曼分享了對(duì)AGI潛在風(fēng)險(xiǎn)的看法缩举,并暗示到2025年實(shí)現(xiàn)人工智能與勞動(dòng)力的融合,堅(jiān)稱OpenAI仍專注于打造超級(jí)智能系統(tǒng)以推動(dòng)未來繁榮。
谷歌研究人員僅通過兩小時(shí)訪談就能打造出思維與你極為相似的人工智能
斯坦福大學(xué)的研究人員創(chuàng)建了人工智能代理蚁孔,通過專門設(shè)計(jì)的界面采訪1052人奶赔,能以85%的準(zhǔn)確率復(fù)制人類行為。這項(xiàng)與谷歌DeepMind合作的研究表明杠氢,這些代理可以通過模擬對(duì)政策和產(chǎn)品發(fā)布的反應(yīng)站刑,幫助決策者了解公眾意見。雖然人工智能代理在性格測(cè)試中表現(xiàn)出色鼻百,但在經(jīng)濟(jì)游戲中復(fù)制人類決策時(shí)卻遇到了困難绞旅。
準(zhǔn)備好迎接能與Twitch主播聊天并控制其直播的虛擬人工智能搭檔吧
Inworld AI、Streamlabs和英偉達(dá)將為直播主播推出一款人工智能助手温艇,提供實(shí)時(shí)技術(shù)支持因悲,并擔(dān)任懂游戲的聯(lián)合主持人。
微軟在Hugging Face上把強(qiáng)大的Phi-4模型完全開源了
https://links.tldrnewsletter.com/V3b9dN
微軟已在Hugging Face上開源其Phi-4模型勺爱,該模型因在推理任務(wù)中的高效性和高性能而受到稱贊晃琳。
人工智能利用喉嚨振動(dòng)來弄清楚人們想說什么
人工智能可通過解讀喉部振動(dòng),幫助中風(fēng)和帕金森病患者進(jìn)行交流琐鲁。