數(shù)據(jù)科學(xué)簡訊 2023-03-29


頭條


谷歌與 AI 初創(chuàng)公司 Replit 合作褐奥,挑戰(zhàn)微軟的 GitHub

谷歌正在與 Replit 合作,將其 AI 語言模型與 Replit 的 Ghostwriter 軟件相結(jié)合,后者可幫助程序員編寫代碼邻吞。此次合作旨在與微軟的 GitHub Copilot 競爭,后者使用 OpenAI 的語言生成 AI仆救。 Ghostwriter 將使用谷歌的 AI 來改進代碼建議、程序完成和回答開發(fā)人員的問題矫渔。 Replit 計劃通過為代碼編寫彤蔽、測試、部署庙洼、應(yīng)用審查和協(xié)作提供端到端支持來增強其軟件顿痪。通過此次合作,Replit 還將擴大其對谷歌云服務(wù)的使用及其軟件的分發(fā)油够。

OpenFlamingo

去年 Deepmind 發(fā)表了關(guān)于他們的 Flamingo 模型的研究蚁袭,這是一個強大的多模態(tài)文本和視覺模型。該模型可以回答有關(guān)圖像的問題石咬,同時仍然是一個強大的文本模型揩悄。 Laion 現(xiàn)在發(fā)布了一個用于訓(xùn)練 Flamingo 模型的框架和一個 9B 參數(shù)檢查點,該檢查點在 Multimodal C4 數(shù)據(jù)集的 5M 樣本和來自 LAION-2B 圖像數(shù)據(jù)集的 10M 樣本上訓(xùn)練碌补。該模型不可用于商業(yè)應(yīng)用虏束,因為它使用 Meta 的 7B Llama 檢查點。它在基準性能方面也無法與 Deepmind 的 Flamingo 相提并論厦章。

Perplexity AI series A

人工智能搜索領(lǐng)域的初創(chuàng)領(lǐng)導(dǎo)者之一推出了 iPhone 應(yīng)用程序并籌集了額外資金镇匀。他們的目標是成為知識發(fā)現(xiàn)的領(lǐng)導(dǎo)者。我們將看看這些服務(wù)中有哪些會有所不同袜啃,但短短幾個月內(nèi) 200 萬用戶的增長令人印象深刻汗侵。


研究


ChatGPT 是新的 MTurk

NLP 需要數(shù)據(jù),這些數(shù)據(jù)通常由各種平臺上的眾包工作者標記群发。事實證明晰韵,gpt-3.5-turbo 非常擅長遵循標簽說明,并且在相關(guān)性熟妓、立場雪猪、主題和其他重要指標方面往往優(yōu)于人類注釋者,這也許并不令人意外起愈。更重要的是只恨,它的成本也比雇用人工注釋者低得多(大約 20 倍)。

EVA-CLIP:大規(guī)模改進 CLIP 訓(xùn)練技術(shù)

該論文介紹了 EVA-CLIP抬虽,這是一組顯著提高 CLIP 訓(xùn)練效率和有效性的模型官觅。 EVA-CLIP 與之前的模型相比,在參數(shù)數(shù)量相同但訓(xùn)練成本更低的情況下實現(xiàn)了更優(yōu)的性能阐污,并發(fā)布了完整的套件用于開放研究休涤。

揭開 Imagen 的面紗:Classification Showdown

Imagen 是一種文本到圖像擴散模型,在零樣本分類方面與 CLIP 相媲美笛辟,在形狀/紋理偏差測試中表現(xiàn)出色功氨,并建議生成預(yù)訓(xùn)練作為視覺語言任務(wù)中的一種有價值的方法序苏。


工程


Anti-DreamBooth:保護用戶免受個性化文本到圖像合成的影響 (GitHub Repo)

本文討論了文本到圖像擴散模型(如 DreamBooth)如何從簡單的文本輸入生成逼真的圖像,但也可能被濫用來產(chǎn)生針對個人的虛假新聞或令人不安的內(nèi)容疑故。該論文提出了一種稱為 Anti-DreamBooth 的防御系統(tǒng)杠览,該系統(tǒng)會向用戶圖像添加細微的噪聲擾動弯菊,以破壞在其上訓(xùn)練的任何 DreamBooth 模型的生成質(zhì)量纵势,并評估其針對各種文本到圖像模型版本的各種算法的有效性.

Text2Video-Zero,文本到視頻的生成

本文通過修改現(xiàn)有的文本到圖像合成方法管钳,介紹了一種低成本的零鏡頭文本到視頻生成方法钦铁。該方法通過運動動力學(xué)豐富了潛在代碼,并對幀級自注意力進行了重新編程才漆,以保留前景對象的上下文牛曹、外觀和身份,從而無需額外的視頻數(shù)據(jù)即可生成高質(zhì)量且一致的視頻醇滥。該方法還適用于其他任務(wù)黎比,例如條件和內(nèi)容專用視頻生成以及指令引導(dǎo)視頻編輯。

AIx (GitHub Repo)

AIx 是一個與 LLM API 交互的 CLI 工具鸳玩。


雜七雜八


另一個LLM微調(diào)框架

在你自己的數(shù)據(jù)上微調(diào)大型語言模型變得越來越容易阅虫,但這仍然是一個有點挑戰(zhàn)性的系統(tǒng)問題。 xTuring 是另一種為有興趣在自定義數(shù)據(jù)上使用某些“開放”模型的人簡化流程的方法不跟。

ChatGPT 獲得了一臺電腦

在文章中颓帝,作者討論了 ChatGPT 和 Anthropic 的 Claude 等人工智能助手的發(fā)展和能力,以及它們與傳統(tǒng)確定性計算機的區(qū)別窝革。 AI 助手在思考和交流方面更像人類购城,隨著 Wolfram|Alpha 等插件的加入而不斷發(fā)展,以提供更準確和實時的信息虐译。作者承認人工智能的潛在好處和風險瘪板,強調(diào)使用人工智能的人的意圖將最終決定結(jié)果,并認為我們應(yīng)該推動人工智能顯著改善生活的積極成果漆诽。

Roblox 正在整合生成式人工智能

本文探討了生成式 AI 在游戲創(chuàng)作平臺 Roblox 中的使用侮攀,并討論了它如何塑造游戲開發(fā)和元宇宙的未來。

員工向 ChatGPT 提供敏感數(shù)據(jù)

員工現(xiàn)在不小心將敏感的公司數(shù)據(jù)放入 ChatGPT拴泌,引發(fā)了對專有信息安全性的擔憂魏身。

生成式人工智能可能影響 3 億個工作崗位

高盛報告稱,生成式人工智能可能影響多達 3 億個工作崗位蚪腐。

Taxy AI (GitHub Repo)

Taxy 使用 GPT-4 來控制瀏覽器并執(zhí)行重復(fù)操作箭昵。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市回季,隨后出現(xiàn)的幾起案子家制,更是在濱河造成了極大的恐慌正林,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,273評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件颤殴,死亡現(xiàn)場離奇詭異觅廓,居然都是意外死亡,警方通過查閱死者的電腦和手機涵但,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,349評論 3 398
  • 文/潘曉璐 我一進店門杈绸,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人矮瘟,你說我怎么就攤上這事瞳脓。” “怎么了澈侠?”我有些...
    開封第一講書人閱讀 167,709評論 0 360
  • 文/不壞的土叔 我叫張陵劫侧,是天一觀的道長。 經(jīng)常有香客問我哨啃,道長烧栋,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,520評論 1 296
  • 正文 為了忘掉前任拳球,我火速辦了婚禮审姓,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘醇坝。我一直安慰自己邑跪,他們只是感情好,可當我...
    茶點故事閱讀 68,515評論 6 397
  • 文/花漫 我一把揭開白布呼猪。 她就那樣靜靜地躺著画畅,像睡著了一般。 火紅的嫁衣襯著肌膚如雪宋距。 梳的紋絲不亂的頭發(fā)上轴踱,一...
    開封第一講書人閱讀 52,158評論 1 308
  • 那天,我揣著相機與錄音谚赎,去河邊找鬼淫僻。 笑死,一個胖子當著我的面吹牛壶唤,可吹牛的內(nèi)容都是我干的雳灵。 我是一名探鬼主播,決...
    沈念sama閱讀 40,755評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼闸盔,長吁一口氣:“原來是場噩夢啊……” “哼悯辙!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,660評論 0 276
  • 序言:老撾萬榮一對情侶失蹤躲撰,失蹤者是張志新(化名)和其女友劉穎针贬,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體拢蛋,經(jīng)...
    沈念sama閱讀 46,203評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡桦他,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,287評論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了谆棱。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片快压。...
    茶點故事閱讀 40,427評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖础锐,靈堂內(nèi)的尸體忽然破棺而出嗓节,到底是詐尸還是另有隱情荧缘,我是刑警寧澤皆警,帶...
    沈念sama閱讀 36,122評論 5 349
  • 正文 年R本政府宣布,位于F島的核電站截粗,受9級特大地震影響信姓,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜绸罗,卻給世界環(huán)境...
    茶點故事閱讀 41,801評論 3 333
  • 文/蒙蒙 一意推、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧珊蟀,春花似錦菊值、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,272評論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至磅崭,卻和暖如春儿子,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背砸喻。 一陣腳步聲響...
    開封第一講書人閱讀 33,393評論 1 272
  • 我被黑心中介騙來泰國打工柔逼, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人割岛。 一個月前我還...
    沈念sama閱讀 48,808評論 3 376
  • 正文 我出身青樓愉适,卻偏偏與公主長得像,于是被迫代替她去往敵國和親癣漆。 傳聞我的和親對象是個殘疾皇子维咸,可洞房花燭夜當晚...
    茶點故事閱讀 45,440評論 2 359

推薦閱讀更多精彩內(nèi)容