數(shù)據(jù)科學簡訊 2023-03-14


頭條


Discord 正在測試基于 ChatGPT 的 Clyde 聊天機器人和其他人工智能功能

Discord 現(xiàn)在正在使用 OpenAI 的 ChatGPT 技術將其現(xiàn)有的 Clyde 機器人轉變?yōu)榻≌劦牧奶鞕C器人璧诵。 Clyde 將在下周進行升級路捧,以回答問題并與用戶進行對話痛倚,就像 OpenAI 的 ChatGPT 或微軟的 Bing 聊天功能一樣台猴。這是在 Discord 中更廣泛推動 AI 的一部分褂删,其中還包括 AI 生成的對話摘要以及 Discord 管理員利用 AI 技術調節(jié)服務器的能力泞莉。

開源 ChatGPT 復制訓練有 4300 萬條指令

chatGPT 如此強大的原因之一是指令調整過程牧氮。通過提供格式化為指令的模型數(shù)據(jù)去团,它變得更有可能遵循用戶給出的指令文搂。 Openchatkit 是一個 200 億參數(shù)指令調整的 Transformer 和其他有用的工具适刀,用于對功能強大且流行的聊天機器人進行開源復制。

微軟德國稱 GPT-4 將于下周推出

微軟德國首席技術官 Andreas Braun 表示:“我們將在下周推出 GPT-4煤蹭,在那里我們將擁有多模式模型笔喉,將提供完全不同的可能性——例如視頻,”Braun 說硝皂。 CTO 稱 LLM 為“游戲規(guī)則改變者”常挚,因為他們教機器理解自然語言,然后機器以統(tǒng)計方式理解以前只能由人類閱讀和理解的內容稽物。


研究


僅有30分鐘交互數(shù)據(jù)的櫻桃采摘機器人

數(shù)據(jù)效率是許多強化學習算法面臨的挑戰(zhàn)之一奄毡。在代理開始學習之前,通常需要數(shù)百萬次環(huán)境交互贝或。這對于現(xiàn)實世界的機器人系統(tǒng)來說通常是不可行的吼过。這項工作是數(shù)據(jù)效率更高的系統(tǒng)的一個例子。

PixMIM:一種簡單有效的蒙版圖像建模方法

該論文提出了 PixMIM咪奖,這是一種簡單有效的蒙版圖像建模 (MIM) 方法盗忱,解決了兩個以前被忽視的瓶頸。 PixMIM 從重建目標中過濾掉高頻成分羊赵,并采用保守的數(shù)據(jù)變換策略來緩解 MIM 訓練中丟失前景的問題趟佃。該方法可以輕松集成到大多數(shù)現(xiàn)有的基于像素的 MIM 方法中,無需額外計算即可在各種下游任務中一致地改進三種 MIM 方法。 PixMIM 可以作為自我監(jiān)督學習的強大基線闲昭,并為 MIM 框架的未來改進提供見解罐寨。


工程


在筆記本電腦上運行最先進的語言模型 (GitHub Repo)

通過利用新的 Apple 神經計算系統(tǒng),您可以在 m1 和 m2 計算機上運行 llama 模型汤纸。對于最小的模型,您甚至可以每秒獲得許多令牌芹血。這指向了在消費級硬件上運行的個性化 AI 的激動人心的未來贮泞。

運行語言模型的簡單方法

在上述代碼的支持下,這個項目很好地打包了東西幔烛,并允許您使用熟悉的網(wǎng)絡工具(如 npx)安裝和運行 llama 模型啃擦。

Text-Generation-Webui (GitHub Repo)

這個 GitHub Repo 是一個 gradio web UI,用于運行 GPT-J 6B饿悬、OPT令蛉、GALACTICA、LLaMA 和 Pygmalion 等大型語言模型狡恬。


雜七雜八


將 PEFT 與 RLHF 相結合

參數(shù)有效微調 (PEFT) 是一種僅更新模型權重的一小部分的方法珠叔。從人類反饋中強化學習 (RLHF) 是與指令調整類似的步驟,可提高模型生成質量和模型對齊弟劲。通過結合兩者祷安,您可以在具有 24GB 片上內存的相對較小的 GPU 上調整多達 200 億個參數(shù)的大型模型。此過程通常需要多個 A100兔乞。

ChatGPT 的 API 使大多數(shù)文本生成 AI 過時

ChatGPT 的 API 非常好汇鞭,而且非常便宜,以至于它讓大多數(shù)其他文本生成 AI 模型都過時了庸追。 3 月 1 日霍骄,OpenAI 將 ChatGPT API 的價格設置為 GPT-3 API 的 1/10,即 0.002 美元/1,000 個代幣淡溯。將此與模型的可定制性與及時工程相結合读整,您將擁有一項將顛覆許多行業(yè)的技術。

ChatGPT 現(xiàn)在可在 Azure OpenAI 服務中使用

隨著微軟將 ChatGPT API 服務集成到微軟的云計算平臺 Azure咱娶,OpenAI 與微軟的合作關系不斷加深绘沉。

大型語言模型正處于穩(wěn)定的擴散時刻

本文深入探討了大型語言模型如何在創(chuàng)新和流行方面呈爆炸式增長,類似于 2022 年 8 月發(fā)布穩(wěn)定擴散后生成式人工智能的爆炸式增長豺总。

Toolbox (GitHub Repo)

這個 GitHub Repo 是機器學習指南和工具的組合车伞。

用 ML 開發(fā)的 Pan-Variant COVID 疫苗

在機器學習的幫助下,已經開發(fā)出一種新的全變體 COVID 疫苗喻喳,可以結束對加強劑和季節(jié)性變體疫苗的需求另玖。

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子谦去,更是在濱河造成了極大的恐慌慷丽,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,682評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件鳄哭,死亡現(xiàn)場離奇詭異要糊,居然都是意外死亡,警方通過查閱死者的電腦和手機妆丘,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評論 3 395
  • 文/潘曉璐 我一進店門锄俄,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人勺拣,你說我怎么就攤上這事奶赠。” “怎么了药有?”我有些...
    開封第一講書人閱讀 165,083評論 0 355
  • 文/不壞的土叔 我叫張陵毅戈,是天一觀的道長。 經常有香客問我愤惰,道長苇经,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,763評論 1 295
  • 正文 為了忘掉前任宦言,我火速辦了婚禮塑陵,結果婚禮上,老公的妹妹穿的比我還像新娘蜡励。我一直安慰自己令花,他們只是感情好,可當我...
    茶點故事閱讀 67,785評論 6 392
  • 文/花漫 我一把揭開白布凉倚。 她就那樣靜靜地躺著兼都,像睡著了一般。 火紅的嫁衣襯著肌膚如雪稽寒。 梳的紋絲不亂的頭發(fā)上扮碧,一...
    開封第一講書人閱讀 51,624評論 1 305
  • 那天,我揣著相機與錄音杏糙,去河邊找鬼慎王。 笑死,一個胖子當著我的面吹牛宏侍,可吹牛的內容都是我干的赖淤。 我是一名探鬼主播,決...
    沈念sama閱讀 40,358評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼谅河,長吁一口氣:“原來是場噩夢啊……” “哼咱旱!你這毒婦竟也來了确丢?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 39,261評論 0 276
  • 序言:老撾萬榮一對情侶失蹤吐限,失蹤者是張志新(化名)和其女友劉穎鲜侥,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體诸典,經...
    沈念sama閱讀 45,722評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡描函,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了狐粱。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片舀寓。...
    茶點故事閱讀 40,030評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖脑奠,靈堂內的尸體忽然破棺而出基公,到底是詐尸還是另有隱情幅慌,我是刑警寧澤宋欺,帶...
    沈念sama閱讀 35,737評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站胰伍,受9級特大地震影響齿诞,放射性物質發(fā)生泄漏。R本人自食惡果不足惜骂租,卻給世界環(huán)境...
    茶點故事閱讀 41,360評論 3 330
  • 文/蒙蒙 一祷杈、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧渗饮,春花似錦但汞、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,941評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至胡桃,卻和暖如春踩叭,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背翠胰。 一陣腳步聲響...
    開封第一講書人閱讀 33,057評論 1 270
  • 我被黑心中介騙來泰國打工容贝, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人之景。 一個月前我還...
    沈念sama閱讀 48,237評論 3 371
  • 正文 我出身青樓斤富,卻偏偏與公主長得像,于是被迫代替她去往敵國和親锻狗。 傳聞我的和親對象是個殘疾皇子茂缚,可洞房花燭夜當晚...
    茶點故事閱讀 44,976評論 2 355

推薦閱讀更多精彩內容