數(shù)據(jù)科學(xué)簡訊 2023-03-21


頭條


訓(xùn)練一個價值85,000美元的ChatGPT競爭者象泵,并在瀏覽器上運(yùn)行

根據(jù) Llama 論文的計算跪妥,您可能會在 A100 GPU 上用 82,000 GPU 小時在純公共數(shù)據(jù)集上訓(xùn)練你自己的 70 億參數(shù)語言模型亡鼠。然后通過使用自我指導(dǎo)進(jìn)一步調(diào)整模型爪瓜,您可以擁有一個與最先進(jìn)模型競爭的開放語言模型瞧栗。

Zapier 推出自然語言 Action

Zapier 推出了一個通用的尝蠕、人工智能驅(qū)動的 API列肢,稱為自然語言動作 (NLA),以將 Zapier 動作集成到任何應(yīng)用程序中官册。 NLA 針對基于自然語言的產(chǎn)品進(jìn)行了優(yōu)化生兆,例如聊天機(jī)器人或使用 LLM 構(gòu)建的產(chǎn)品,但任何開發(fā)人員都可以使用攀隔。將 Zapier 的 5K+ 應(yīng)用程序和 20K+ 操作放入您的產(chǎn)品中皂贩,并使用簡單的自然語言在應(yīng)用程序之間移動信息。

Midjourney v5 !

Midjourney 宣布了其商業(yè) AI 圖像合成服務(wù)的第 5 版昆汹,該服務(wù)可以生成逼真的圖像明刷,其質(zhì)量水平被一些 AI 藝術(shù)愛好者稱為令人毛骨悚然且“過于完美”。 Midjourney v5 提供了更廣泛的風(fēng)格范圍满粗、更高的靈敏度辈末、更少的不需要的文本以及 2 倍的圖像分辨率增強(qiáng)。 Midjourney v5 現(xiàn)在作為 alpha 測試提供給訂閱 Midjourney 服務(wù)的客戶,該服務(wù)可通過 Discord 獲得挤聘。


研究


綜合prompt工程

提示工程是引導(dǎo)語言模型執(zhí)行任務(wù)的過程轰枝。有許多不同的方法可以做到這一點(diǎn),從零鏡頭到少數(shù)鏡頭和思維鏈组去。這篇博文包含極其全面的引用和對未來工作的有趣想法鞍陨。

Transformer 中的殘差連接有特權(quán)基礎(chǔ)

Transformer 架構(gòu)中的 skip connection 提高了穩(wěn)定性和可訓(xùn)練性。我們的理論理解表明从隆,殘差連接中的任何維度都不應(yīng)包含比其他維度更多的信息诚撵。然而,在實(shí)踐中键闺,事實(shí)證明寿烟,對于具有顯著更大的激活值的某些維度,情況并非如此辛燥。這篇文章探討了潛在的原因筛武,并得出結(jié)論,Adam 中的每個參數(shù)內(nèi)存可能會導(dǎo)致此問題挎塌。

COLT5:具有條件計算的長輸入Transformer 模型

文章介紹了 COLT5徘六,這是一種新的長輸入 Transformer 模型,它使用條件計算將更多資源分配給重要的標(biāo)記榴都,在長輸入 SCROLLS 基準(zhǔn)測試中以更快的訓(xùn)練和推理以及有效處理極長的輸入硕噩。


工程


Alpaca Lora (GitHub Repo)

Low Rank Adaptation 是一種通過僅更新一小部分參數(shù)來微調(diào)語言模型的方法。由于 Lora 的計算要求降低缭贡,此 repo 包含的代碼可通過消費(fèi)類硬件上的指令調(diào)整來幫助調(diào)整流行的 Llama 模型。

ML Commands

來自 HuggingFace 研究科學(xué)家的 ML 研究的極其有用的命令列表辉懒。它包括分布式訓(xùn)練阳惹、環(huán)境設(shè)置和配置任務(wù)等內(nèi)容。對任何從業(yè)者都有用的參考眶俩。

GlueGen:使用 GlueNet 高效升級文本到圖像模型

本文提出了 GlueGen莹汤,一種使用 GlueNet 模型和新訓(xùn)練目標(biāo)將來自不同編碼器的特征與現(xiàn)有文本到圖像 (T2I) 模型的潛在空間對齊的方法。這允許將新功能(例如多語言語言模型和多模態(tài)編碼器)有效地集成到現(xiàn)有的 T2I 模型中颠印,從而實(shí)現(xiàn)聲音到圖像的生成并升級當(dāng)前的文本編碼器以應(yīng)對具有挑戰(zhàn)性的案例生成纲岭。


雜七雜八


可汗學(xué)院和 OpenAI

可汗學(xué)院是一家非營利組織,為所有年齡段的學(xué)生提供數(shù)以千計的數(shù)學(xué)线罕、科學(xué)和人文課程止潮。可汗學(xué)院宣布將使用 GPT-4 為 Khanmigo 提供支持钞楼,Khanmigo 是一種人工智能助手喇闸,既可以作為學(xué)生的虛擬導(dǎo)師,也可以作為教師的課堂助手。這家非營利組織于 2022 年開始測試最新版本的 OpenAI 語言模型燃乍,最初將向有限數(shù)量的參與者開放 Khanmigo 試點(diǎn)項(xiàng)目唆樊,但仍邀請公眾加入候補(bǔ)名單。

試用最先進(jìn)的 ASR 系統(tǒng) (HuggingFace Space)

Assembly AI 最新的 Conformer ASR 系統(tǒng)是一個強(qiáng)大的模型刻蟹,適用于各種任務(wù)逗旁,例如轉(zhuǎn)錄、摘要舆瘪、情感分析和主題檢測——全部來自原始音頻片效。該模型只能通過 API 訪問。

Sam Altman 有點(diǎn)害怕 AI

OpenAI 首席執(zhí)行官 Sam Altman 警告說介陶,人工智能可用于廣泛傳播虛假信息和網(wǎng)絡(luò)攻擊堤舒。

語音克隆 AI 讓你說多種語言

VALL-E X 是微軟的一種新的 AI 模型,可以從 4-10 秒的短樣本中克隆語音哺呜,然后用它來合成不同語言的語音舌缤。

通用汽車希望為司機(jī)帶來類似 ChatGPT 的助手

長期以來,為司機(jī)提供聲控界面一直是汽車公司和科技公司的目標(biāo)某残,但這個想法從未發(fā)揮其潛力国撵。由于與微軟在自動駕駛汽車領(lǐng)域建立了兩年的合作伙伴關(guān)系,通用汽車在將新的 ChatGPT 技術(shù)應(yīng)用于其車輛方面處于領(lǐng)先地位玻墅。

Ggml (GitHub Repo)

Ggml 是一個用于機(jī)器學(xué)習(xí)的張量庫介牙。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市澳厢,隨后出現(xiàn)的幾起案子环础,更是在濱河造成了極大的恐慌,老刑警劉巖剩拢,帶你破解...
    沈念sama閱讀 212,029評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件线得,死亡現(xiàn)場離奇詭異,居然都是意外死亡徐伐,警方通過查閱死者的電腦和手機(jī)贯钩,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,395評論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來办素,“玉大人角雷,你說我怎么就攤上這事⌒源” “怎么了勺三?”我有些...
    開封第一講書人閱讀 157,570評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長季二。 經(jīng)常有香客問我檩咱,道長揭措,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,535評論 1 284
  • 正文 為了忘掉前任刻蚯,我火速辦了婚禮绊含,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘炊汹。我一直安慰自己躬充,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,650評論 6 386
  • 文/花漫 我一把揭開白布讨便。 她就那樣靜靜地躺著充甚,像睡著了一般。 火紅的嫁衣襯著肌膚如雪霸褒。 梳的紋絲不亂的頭發(fā)上伴找,一...
    開封第一講書人閱讀 49,850評論 1 290
  • 那天,我揣著相機(jī)與錄音废菱,去河邊找鬼技矮。 笑死,一個胖子當(dāng)著我的面吹牛殊轴,可吹牛的內(nèi)容都是我干的衰倦。 我是一名探鬼主播,決...
    沈念sama閱讀 39,006評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼旁理,長吁一口氣:“原來是場噩夢啊……” “哼樊零!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起孽文,我...
    開封第一講書人閱讀 37,747評論 0 268
  • 序言:老撾萬榮一對情侶失蹤驻襟,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后芋哭,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體塑悼,經(jīng)...
    沈念sama閱讀 44,207評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,536評論 2 327
  • 正文 我和宋清朗相戀三年楷掉,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片霞势。...
    茶點(diǎn)故事閱讀 38,683評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡烹植,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出愕贡,到底是詐尸還是另有隱情草雕,我是刑警寧澤,帶...
    沈念sama閱讀 34,342評論 4 330
  • 正文 年R本政府宣布固以,位于F島的核電站墩虹,受9級特大地震影響嘱巾,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜诫钓,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,964評論 3 315
  • 文/蒙蒙 一旬昭、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧菌湃,春花似錦问拘、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,772評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至下愈,卻和暖如春纽绍,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背势似。 一陣腳步聲響...
    開封第一講書人閱讀 32,004評論 1 266
  • 我被黑心中介騙來泰國打工拌夏, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人叫编。 一個月前我還...
    沈念sama閱讀 46,401評論 2 360
  • 正文 我出身青樓辖佣,卻偏偏與公主長得像,于是被迫代替她去往敵國和親搓逾。 傳聞我的和親對象是個殘疾皇子卷谈,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,566評論 2 349