2023-12-19 簡訊 : Meta發(fā)布龐大的第一人稱視頻數(shù)據(jù)集


頭條


Meta發(fā)布龐大的第一人稱視頻數(shù)據(jù)集

https://ai.meta.com/blog/ego-exo4d-video-learning-perception/
視頻理解是一個(gè)古老的領(lǐng)域登失,現(xiàn)在才開始取得成功儒洛。成功的主要驅(qū)動(dòng)力是高質(zhì)量的數(shù)據(jù)集迅涮。Meta的這項(xiàng)工作包括許多傳感器數(shù)據(jù)源和手勢姿態(tài)笛质。它為現(xiàn)有方法提供了基準(zhǔn)性能。

Snapchat+ 訂閱者現(xiàn)在可以創(chuàng)建并發(fā)送AI生成的圖片

https://techcrunch.com/2023/12/12/snapchat-subscribers-can-now-create-and-send-ai-generated-images/
Snapchat為其Snapchat+訂閱者引入了新的AI驅(qū)動(dòng)功能虫啥,包括一個(gè)AI圖像生成器悴晰,它可以根據(jù)文本提示創(chuàng)建圖像,以及一個(gè)夢幻自拍特性疲恢,可以與朋友一起創(chuàng)建奇幻圖像。一個(gè)新的AI擴(kuò)展工具允許用戶自動(dòng)擴(kuò)展和填充照片的背景瓷胧。這些功能正在向超過700萬Snapchat+訂閱者逐步推出显拳。

Google將Gemini Pro引入Vertex AI

https://techcrunch.com/2023/12/13/google-brings-gemini-pro-to-vertex-ai/
Google推出了Gemini Pro,這是其先進(jìn)AI模型Gemini Ultra的輕量級(jí)版本搓萧,用于Vertex AI的公共預(yù)覽杂数,提供文本和圖像處理能力,以及可定制的上下文瘸洛,適用于各種用例揍移。


研究


通過防止熵崩潰的穩(wěn)定訓(xùn)練

https://github.com/apple/ml-sigma-reparam
Transformer 雖然令人驚嘆,但經(jīng)常難以訓(xùn)練反肋,存在許多不穩(wěn)定性那伐。其中一個(gè)主要問題是注意力矩陣的熵崩潰。這項(xiàng)工作是一種通過簡單的重參數(shù)化來防止這種情況的方法石蔗。

使用擴(kuò)散模型估計(jì)圖像中的光照

https://diffusionlight.github.io/
該項(xiàng)目引入了一種估計(jì)圖像中光照的新技術(shù)罕邀,克服了當(dāng)前依賴HDR全景數(shù)據(jù)集的方法的局限性。通過使用擴(kuò)散模型將鉻球渲染到標(biāo)準(zhǔn)圖像中抓督,該技術(shù)揭示了鉻球和擴(kuò)散噪聲之間獨(dú)特的關(guān)系燃少。

自動(dòng)駕駛的語言模型

https://arxiv.org/abs/2312.09245v1
DriveMLM是一個(gè)新框架,使用大型語言模型增強(qiáng)自動(dòng)駕駛铃在。這個(gè)系統(tǒng)不僅可以與現(xiàn)有的自動(dòng)駕駛系統(tǒng)集成阵具,而且在模擬中表現(xiàn)更好,它將語言決策與車輛控制相結(jié)合定铜。


工程


Coframe Coffee (GitHub Repo)

https://github.com/Coframe/coffee
上周發(fā)布的Coffee幫助通過AI簡化前端開發(fā)阳液,可以插入現(xiàn)有代碼庫。該項(xiàng)目特別專注于基于Coframe團(tuán)隊(duì)從使用AI生成80%以上的前端的經(jīng)驗(yàn)中學(xué)到的第一類DX揣炕。

LLM應(yīng)用評(píng)估框架 (GitHub Repo)

https://github.com/confident-ai/deepeval
DeepEval是一個(gè)一體化的LLM應(yīng)用評(píng)估框架帘皿,允許用戶輕松識(shí)別并迭代不滿意的LLM輸出。它目前提供14種以上的評(píng)估指標(biāo)畸陡,如幻覺鹰溜、總結(jié)、G-Eval丁恭、RAGAS等曹动,讓用戶以類似Pytest或基于組件的方式評(píng)估整個(gè)數(shù)據(jù)集。

解決Pytorch內(nèi)存問題

https://pytorch.org/blog/understanding-gpu-memory-1/
對(duì)于使用Pytorch的實(shí)踐者來說牲览,最大的挑戰(zhàn)之一是弄清楚為什么會(huì)出現(xiàn)內(nèi)存不足墓陈。Pytorch 2.1中的一些新工具可以深入了解內(nèi)存使用情況。。


雜七雜八


AMD社區(qū)性能基準(zhǔn)測試

https://community.amd.com/t5/instinct-accelerators/competitive-performance-claims-and-industry-leading-inference/ba-p/652304
MI300X是AMD的旗艦AI加速器贡必,現(xiàn)在在ROCm 6的支持下兔港,其推理性能接近NVIDIA。這對(duì)社區(qū)來說是個(gè)好消息仔拟,因?yàn)樗鼮樾屡d的AI公司提供了替代芯片衫樊。

在Magic The Gathering草稿上微調(diào)Mistral 7B

https://generallyintelligent.substack.com/p/fine-tuning-mistral-7b-on-magic-the
使用Magic: The Gathering草稿作為測試案例的微調(diào)實(shí)驗(yàn),使GPT-4的能力得到了增強(qiáng)理逊,產(chǎn)生了一個(gè)與人類性能密切匹配的微調(diào)7B參數(shù)模型橡伞。

AI的何時(shí)、何地以及如何

https://www.saastr.com/the-where-when-and-how-of-ai-with-theory-ventures-open-ai-motherduck-and-lamini/
領(lǐng)先的創(chuàng)始人和風(fēng)險(xiǎn)投資者討論了AI的最新動(dòng)態(tài)晋被,從LLM在企業(yè)創(chuàng)新中的應(yīng)用到其他領(lǐng)域兑徘。如果你對(duì)“關(guān)于AI你應(yīng)該知道的事情”的步伐感到有些不知所措,這是一個(gè)很好的快速回顧羡洛。

MMLU提示模板

https://github.com/microsoft/promptbase/blob/main/src/promptbase/mmlu/prompt_templates.py
Microsoft的Medprompt+目前是MMLU的最佳提示方法挂脑。微軟已經(jīng)發(fā)布了這個(gè)模板,以及許多其他在評(píng)估社區(qū)標(biāo)準(zhǔn)的思路鏈?zhǔn)綐邮侥0濉?/p>

Agility使用LLM與其人形機(jī)器人溝通

https://techcrunch.com/2023/12/14/agility-is-using-large-language-models-to-communicate-with-its-humanoid-robots/
生成式AI和大型語言模型正在改變機(jī)器人技術(shù)欲侮。Agility 的雙足機(jī)器人Digit現(xiàn)在可以根據(jù)自然語言命令執(zhí)行復(fù)雜任務(wù)崭闲,標(biāo)志著向更人性化、直觀的機(jī)器人交互的轉(zhuǎn)變威蕉。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末刁俭,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子韧涨,更是在濱河造成了極大的恐慌牍戚,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,542評(píng)論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件虑粥,死亡現(xiàn)場離奇詭異如孝,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)娩贷,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,822評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門第晰,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人彬祖,你說我怎么就攤上這事茁瘦。” “怎么了储笑?”我有些...
    開封第一講書人閱讀 163,912評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵甜熔,是天一觀的道長。 經(jīng)常有香客問我南蓬,道長纺非,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,449評(píng)論 1 293
  • 正文 為了忘掉前任赘方,我火速辦了婚禮烧颖,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘窄陡。我一直安慰自己炕淮,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,500評(píng)論 6 392
  • 文/花漫 我一把揭開白布跳夭。 她就那樣靜靜地躺著涂圆,像睡著了一般。 火紅的嫁衣襯著肌膚如雪币叹。 梳的紋絲不亂的頭發(fā)上润歉,一...
    開封第一講書人閱讀 51,370評(píng)論 1 302
  • 那天,我揣著相機(jī)與錄音颈抚,去河邊找鬼踩衩。 笑死,一個(gè)胖子當(dāng)著我的面吹牛贩汉,可吹牛的內(nèi)容都是我干的驱富。 我是一名探鬼主播,決...
    沈念sama閱讀 40,193評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼匹舞,長吁一口氣:“原來是場噩夢啊……” “哼褐鸥!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起赐稽,我...
    開封第一講書人閱讀 39,074評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤叫榕,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后又憨,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體翠霍,經(jīng)...
    沈念sama閱讀 45,505評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,722評(píng)論 3 335
  • 正文 我和宋清朗相戀三年蠢莺,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了寒匙。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,841評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡躏将,死狀恐怖锄弱,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情祸憋,我是刑警寧澤会宪,帶...
    沈念sama閱讀 35,569評(píng)論 5 345
  • 正文 年R本政府宣布,位于F島的核電站蚯窥,受9級(jí)特大地震影響掸鹅,放射性物質(zhì)發(fā)生泄漏塞帐。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,168評(píng)論 3 328
  • 文/蒙蒙 一巍沙、第九天 我趴在偏房一處隱蔽的房頂上張望葵姥。 院中可真熱鬧,春花似錦句携、人聲如沸榔幸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,783評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽削咆。三九已至,卻和暖如春蠢笋,著一層夾襖步出監(jiān)牢的瞬間拨齐,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,918評(píng)論 1 269
  • 我被黑心中介騙來泰國打工昨寞, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留奏黑,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,962評(píng)論 2 370
  • 正文 我出身青樓编矾,卻偏偏與公主長得像熟史,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子窄俏,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,781評(píng)論 2 354