頭條
獨立應(yīng)用Grok在美國iOS系統(tǒng)上發(fā)布
https://www.tomsguide.com/ai/xais-standalone-grok-ios-app-launches-in-the-us-heres-how-to-find-it
xAI的獨立應(yīng)用Grok現(xiàn)已在美國iOS系統(tǒng)上架儒拂。它具備先進(jìn)的對話式人工智能功能。
Meta的Llama模型受版權(quán)保護(hù)的訓(xùn)練
最近一份文件稱敢靡,Meta的Llama團(tuán)隊經(jīng)馬克·扎克伯格批準(zhǔn)品腹,使用受版權(quán)保護(hù)的材料進(jìn)行訓(xùn)練,這引發(fā)了人們對人工智能訓(xùn)練中知識產(chǎn)權(quán)使用問題的擔(dān)憂给梅。
谷歌Lens 小貼士
https://blog.google/products/search/google-lens-tips-2025/
谷歌重點介紹了2025年谷歌Lens 的新技巧和功能假丧,展示了其在視覺搜索方面的擴(kuò)展能力以及與日常任務(wù)的整合。
研究
透明視頻生成
https://wileewang.github.io/TransPixar/
透明生成算法包含 alpha 通道动羽,這提高了該模型在視覺特效應(yīng)用中的實用性包帚。
3D鳥類生成
https://kamwoh.github.io/chirpy3d/
這種算法能利用部件和習(xí)得的組合算法生成新奇的鳥類。由于底層生成網(wǎng)格的質(zhì)量不錯运吓,結(jié)果令人驚艷且很有用渴邦。
用多模態(tài)模型實現(xiàn)圖形用戶界面自動化
https://arxiv.org/abs/2501.04575v1
InfiGUIAgent是一款GUI自動化工具,它利用多模態(tài)大語言模型和兩階段訓(xùn)練過程來增強(qiáng)推理和交互能力拘哨。
工程
神經(jīng)SVG生成
https://sagipolaczek.github.io/NeuralSVG/
很多作品旨在生成SVG圖像谋梭。這個作品特意按順序生成物體的各個部分,這樣生成的圖像干凈倦青、可編輯且簡潔瓮床。其輸出效果也相當(dāng)不錯。
DiffSensei:連接多模態(tài)大語言模型(LLMs)與擴(kuò)散模型以實現(xiàn)定制漫畫生成(GitHub倉庫)
https://github.com/jianzongwu/DiffSensei
用于漫畫故事創(chuàng)作的可控产镐、連貫的角色和對話框生成隘庄。它的運作方式幾乎就像一個確保角色一致性的Control Net。
一種新的適配方法(GitHub 倉庫)
https://github.com/cfuchs2023/oga
OGA是一種在線適配方法癣亚,它能在數(shù)據(jù)流中建立一個零樣本熵較低的樣本緩存丑掺。
其他
增長營銷中的人工智能與量化實驗
https://every.to/thesis/the-new-science-of-growth-marketing
人工智能正迅速改變營銷行業(yè)。本文介紹當(dāng)下有效的增長營銷戰(zhàn)略述雾,包括助力網(wǎng)站自我提升的智能體以及大規(guī)模的個性化內(nèi)容街州。這些戰(zhàn)略被稱作 “量化實驗”兼丰,這一說法借鑒了量化交易。量化交易在20世紀(jì)80年代給金融界帶來變革唆缴,而如今增長營銷領(lǐng)域的轉(zhuǎn)變與之有相似之處 鳍征。
不,大語言模型(LLMs)不會“耍心機(jī)”
https://www.strangeloopcanon.com/p/no-llms-are-not-scheming
2024年琐谤,我們借助OpenAI的o1等人工智能輕松超越了圖靈測試蟆技。人工智能展現(xiàn)出令人贊嘆的對話能力,但缺乏類似人類的情境意識——關(guān)于大語言模型(LLMs)只是模式學(xué)習(xí)者還是具備推理能力的實體斗忌,存在諸多爭論质礼。這些模型在復(fù)制方面表現(xiàn)出色,但由于缺乏上下文理解织阳,難以對模式進(jìn)行優(yōu)先級排序眶蕉。重點應(yīng)繼續(xù)放在完善模型訓(xùn)練和評估方法上,而不是賦予人工智能系統(tǒng)類似人類的特征或意圖唧躲。
剛剛發(fā)生了什么
https://www.oneusefulthing.org/p/what-just-happened
人工智能進(jìn)展加快造挽,出現(xiàn)了幾款新的GPT-4級別和Gen3模型,帶來了革命性和漸進(jìn)式的改進(jìn)弄痹。o1模型展現(xiàn)出先進(jìn)的推理能力饭入,能找出學(xué)術(shù)論文中的錯誤,還能輔助研究肛真,凸顯出人工智能在傳統(tǒng)任務(wù)之外的作用不斷擴(kuò)大谐丢。如今人工智能的能力包括實時視頻交互以及更出色的文本到視頻生成,這預(yù)示著未來意義深遠(yuǎn)蚓让,跨領(lǐng)域整合的機(jī)會眾多 乾忱。
快訊
字節(jié)跳動(Hugging Face Hub)的Sa2Va模型
https://huggingface.co/collections/ByteDance/sa2va-model-zoo-677e3084d71b5f108d00e093
字節(jié)跳動發(fā)布了三種尺寸的新模型,該模型將強(qiáng)大的視覺語言模型(VLM)性能與SAM2中的開放詞匯分割功能相結(jié)合历极。
極其簡單的技巧就能破解哪怕最先進(jìn)的人工智能聊天機(jī)器人
https://futurism.com/the-byte/easy-hack-jailbreak-ai-chatbot
Anthropic的一項新研究發(fā)現(xiàn)窄瘟,通過改變大小寫或拼寫,大語言模型(LLMs)很容易被“越獄”趟卸。
字節(jié)跳動似乎在規(guī)避美國限制購買英偉達(dá)芯片蹄葱。
字節(jié)跳動計劃2025年斥資70億美元購買英偉達(dá)芯片,將芯片存儲在中國境外以規(guī)避美國限制锄列。