迎接AI時代颖低,你準(zhǔn)備好了嗎絮吵?——《就是ChatGPT》

《這就是ChatGPT》,一本講解什么是ChatGPT的科普讀物忱屑,作者斯蒂芬·沃爾夫勒姆蹬敲,英國著名的計算機科學(xué)家,人工智能領(lǐng)域的領(lǐng)軍人物想幻,非常有名的極客,被稱為“在世的最聰明的人”话浇。作為AI方面的頂級專家脏毯,由他寫ChatGPT的科普讀物,自然是最合適不過幔崖。

本書不厚食店,但卻是我近期讀到的AI大模型方面講的最清晰透徹的一本讀物。初學(xué)者要理解ChatGPT赏寇,讀這一本書就夠了吉嫩。

2022年11月,美國人工智能研究公司OpenAI正式推出了對話交互式的ChatGPT嗅定。它甫一面世自娩,立即風(fēng)靡世界,席卷全球渠退,這標(biāo)志著AI進入了大模型時代忙迁。在ChatGPT的引領(lǐng)下,人類的一只腳碎乃,正開始邁入AI時代姊扔。

“從此刻開始,搜索的毛利率將永遠梅誓、不可逆地進入下降軌道恰梢》鹉希”——薩提亞·納德拉(Satya Nadella),微軟公司首席執(zhí)行官

一嵌言、人工智能與ChatGPT的發(fā)展

1950年嗅回,圖靈發(fā)表了論文《計算機器與智能》(Computing Machinery and Intelligence),提到了著名的“圖靈測試”呀页,通常認(rèn)為這是“機器學(xué)習(xí)(ML)”的第一個里程碑妈拌。

2006年,杰弗里·辛頓正式提出深度學(xué)習(xí)概念蓬蝶,這一年尘分,被稱為深度學(xué)習(xí)元年。

2016年3月丸氛,AlphaGo以4比1的成績戰(zhàn)勝了韓國圍棋選手李世石培愁,這是人工智能嶄露頭角的標(biāo)志性事件。當(dāng)時的AlphaGo版本結(jié)合了深度神經(jīng)網(wǎng)絡(luò)和蒙特卡洛樹搜索算法缓窜。并沒有用到GPT這樣的大模型定续。

2018年,OpenAI發(fā)布了GPT-1禾锤。2020年6月私股,OpenAI發(fā)布了GPT-3。

2022年11月30日恩掷,在GPT-3模型基礎(chǔ)上倡鲸,OpenAI發(fā)布了ChatGPT。

2021年3月15日黄娘,OpenAI發(fā)布了GPT-4峭状,目前提供給ChatGPT Plus訂閱者使用。

二逼争、大模型亂斗

GPT是一種大模型优床,是大規(guī)模預(yù)訓(xùn)練模型,可以簡單理解為“大數(shù)據(jù)量AI模型”誓焦。它是指具有巨大參數(shù)數(shù)量和復(fù)雜結(jié)構(gòu)的機器學(xué)習(xí)模型胆敞。這些模型通常由大量的神經(jīng)網(wǎng)絡(luò)層和參數(shù)組成,可以處理和學(xué)習(xí)大規(guī)模的數(shù)據(jù)集杂伟。大模型一次訓(xùn)練可能需要“高性能集群” 花費 “數(shù)天甚至數(shù)周”的時間竿秆。

大模型通常擁有天文數(shù)字的參數(shù),在書中被稱為“權(quán)重”稿壁。以GPT3.5為例幽钢,其參數(shù)為1750億。

chatgpt一夜爆火后傅是,國內(nèi)外的企業(yè)紛紛跟進匪燕,各種大模型紛紛推出蕾羊,微軟、騰訊(派大星)帽驯、阿里龟再、華為、百度(飛漿)都開發(fā)了自己的深度學(xué)習(xí)平臺尼变,對大模型進行訓(xùn)練利凑。但是,在綜合表現(xiàn)上嫌术,chatgpt仍然一騎絕塵哀澈。

微軟推出的Turing-NLG,有170億參數(shù)度气。

谷歌推出了號稱有1.6萬億模型參數(shù)的switch transformer割按。

百度的“文心一言”

百度的“文心一言”有2650億個參數(shù)。

浪潮信息的大規(guī)模預(yù)訓(xùn)練模型:源 1.0磷籍。參數(shù)量是 2457 億适荣。

科大訊飛的“訊飛星火認(rèn)知大模型”

2023年5月6日,科大訊飛在成果發(fā)布會上正式發(fā)布了“訊飛星火認(rèn)知大模型”院领。

2023年7月7日弛矛,華為發(fā)布了AI大模型——盤古3.0版本,參數(shù)量1000億比然。

阿里的“通義千問”

2023年4月11日丈氓,阿里正式推出大語言模型“通義千問”。

另外還有騰訊的混元大模型谈秫、京東的ChatJD大模型等等扒寄。

三鱼鼓、GPT是AI進化的產(chǎn)物

GPT用的預(yù)訓(xùn)練模型是生成式技術(shù)(Generative)拟烫,采用自回歸架構(gòu),單向預(yù)測迄本,通過上文來推測下文硕淑,它永遠只預(yù)測下一個字,這樣不斷循環(huán)來生成新的內(nèi)容嘉赎,我們稱之為生成式AI置媳。它采用極簡架構(gòu),走大算力公条,大數(shù)據(jù)的技術(shù)路線拇囊。

2018年,GPT發(fā)布幾個月后靶橱,谷歌發(fā)布了另外一種預(yù)訓(xùn)練模型BERT寥袭,稱之為檢索式AI路捧,與GPT用的單向模型不同,它是雙向的传黄,通過檢索語料庫來生成回答杰扫。

檢索式AI是在大數(shù)據(jù)量的基礎(chǔ)上,讓AI找到正確答案膘掰,而生成式AI是對于讓AI自己去判斷什么是正確答案章姓,然后提供給用戶。檢索式AI做的是完型填空识埋,而生成式AI做的是文字接龍凡伊。

在起初兩種模型的博弈中,GPT1.0所用的生成式技術(shù)處于下風(fēng)惭聂。生成式AI的效率和準(zhǔn)確度遠遠低于檢索式AI窗声,人們在嚴(yán)肅的商業(yè)場合都在使用BERT,比如Siri辜纲。

到了GPT2.0的時候笨觅,事情突然現(xiàn)了轉(zhuǎn)機。人們突然發(fā)現(xiàn)耕腾,在提高了數(shù)據(jù)量后见剩,GPT居然無師自通地擁有了好幾項技能,如文本摘要扫俺,如翻譯苍苞。這說明,對于AI來說狼纬,生成式前途不可估量羹呵。

于是,OpenA公司在GPT模型上投入巨資疗琉,開發(fā)3.0冈欢。

某種能力在較小的模型中不存在,只在較大的模型中存在盈简,模型規(guī)模必須要指數(shù)級增長超過某個臨界點凑耻,新技能才會突飛猛進。

ChatGPT是通用預(yù)訓(xùn)練語言大模型柠贤。對于ChatGPT香浩,有一件事乍看起來平平無奇,但是卻細思極恐臼勉。我們知道邻吭,ChatGPT是通過文字用自然語言與人們交流的,這就要求它熟練掌握語法規(guī)則宴霸。如句子通常由主語囱晴、謂語和可能的賓語組成岸裙。名詞前面可以有形容詞,后面可以有動詞速缆,但是兩個名詞通常不會挨在一起降允。ChatGPT并不明確了解這些規(guī)則,我們也沒有把這些規(guī)則輸入到大模型中艺糜。但是在訓(xùn)練過程中剧董,它自己發(fā)現(xiàn)了這些規(guī)則,并靈活地遵守它們破停。而我們并不清楚ChatGPT是如何做到這一點的翅楼。

目前GPT可以出色地生成文本,可是真慢,我們并不能解釋毅臊,為什么我們賦予的大模型能夠起作用,我們也不能準(zhǔn)確地指出黑界,GPT是如何一步步工作的管嬉。我們所做的,只是提供大量的文本和一個近似的模型朗鸠,然后蚯撩,對它進行訓(xùn)練,就是看著GPT自我學(xué)習(xí)烛占。而GPT在哪一天到底學(xué)會了什么胎挎,我們無從知道,也無法預(yù)測忆家。佛教有“漸悟”和“頓悟”犹菇,GPT是頓悟的,他的的新技能是突然“涌現(xiàn)”的芽卿,當(dāng)模型規(guī)模(參數(shù))突破某個臨界點后揭芍,終于有一天,量變產(chǎn)生了質(zhì)變蹬竖,GPT進化了沼沈,這個進化的細節(jié)流酬,我們無從得知币厕。

凱文·凱利1994年所著的《失控:機器、社會與經(jīng)濟的新生物學(xué)》就講到了這種關(guān)于復(fù)雜系統(tǒng)的進化芽腾、涌現(xiàn)和失控情況旦装,失控的意思是,由于缺乏中心控制摊滔,群集系統(tǒng)是效率相對較低阴绢、不可預(yù)測店乐、不可知、不可控的呻袭。但也由此獲得進化的無限可能眨八。按照凱文·凱利的理論,通過內(nèi)部神經(jīng)元的個體進化左电,我們可以獲得模型整體能力的涌現(xiàn)廉侧。GPT作為人工智能神經(jīng)網(wǎng)絡(luò)大模型,便符合群集系統(tǒng)的特點篓足。

在我們的訓(xùn)練下段誊,AI正在自我進化。目前栈拖,GPT已經(jīng)毫無征兆地學(xué)會了情感分析连舍,那么,AI什么時候會有自主意識涩哟,什么時候會產(chǎn)生情感索赏,我們并不知道,但是贴彼,我們知道参滴,這件事早晚會到來。

四锻弓、AI幻覺與大模型造假

假如2030年大模型還沒有創(chuàng)造太多經(jīng)濟價值砾赔,最有可能的解釋便是其可靠性不足。我們先看一張圖片:

在這里青灼,我們讓AI給我們提供一部有李鴻章角色的電影暴心。我們發(fā)現(xiàn),AI的回答驢唇不對馬嘴杂拨。首先专普,并沒有一部叫《風(fēng)云天地》的電影,它介紹電影其實名叫《宋家皇朝》弹沽,但是檀夹,導(dǎo)演對不上,演員也不完全對策橘≌ǘ桑可以肯定的是,GPT一定有這部影片的相關(guān)資料丽已,那么蚌堵,它為什么會給出這種錯誤百出的答案,它在和我們開玩笑嗎?

OpenAI發(fā)布了一篇《GPT-4技術(shù)報告》吼畏,里面重點提到了大模型的幻覺(Hallucination)督赤。其中說GPT-4有產(chǎn)生幻覺的傾向,即“產(chǎn)生與某些來源無關(guān)的荒謬或不真實的內(nèi)容”泻蚊,“一本正經(jīng)地胡說八道”躲舌,用我們易于理解的話來說,就是“杜撰”性雄。也許孽糖,對于GPT,就和我們考試一樣毅贮,遇到一時半會答不出的題办悟,就算胡謅也得答上一大篇,能拿幾分算幾分滩褥。

微軟必應(yīng)聊天機器人團隊中的一些專家則有下面看法病蛉,他認(rèn)為認(rèn)為幻覺等于創(chuàng)造力,大模型試圖利用它掌握的所有數(shù)據(jù)瑰煎,產(chǎn)生最連貫的句子铺然,不管是對是錯。AI就是在演戲酒甸,人類喜歡看什么魄健,就演成什么樣。關(guān)鍵他還演得特別像插勤,特別一本正經(jīng)沽瘦,讓人真假難辨。

AI幻覺對人類肯定是有害的农尖,但是對于AI本身析恋,也許是產(chǎn)生情緒、個性與智慧的必要途徑盛卡。

五助隧、你們都是蟲子

ChatGPT是一種AI能力集成,它并不局限在文本對答滑沧,而是能夠進入任何領(lǐng)域并村。

對于圖片和聲音,AI已經(jīng)處理得游刃有余滓技。AI已經(jīng)學(xué)會了看圖說話哩牍,理解圖片中的意思,更可以按照人類給的指令生成圖片殖属,對于翻譯和理解人類的聲音姐叁,對于AI已經(jīng)屬于基本操作瓦盛。

有理由相信洗显,當(dāng)我們給AI安上機器人的四肢和五官外潜,AI就可以讀懂和驅(qū)動世界,最后挠唆,AI可能會逐步發(fā)展出自己的世界处窥。

那么,未來世界將會是怎樣的玄组?我們可以從以下幾部影片中看看可能的方向滔驾。

影片《機器管家(1999)》

在電影《機器管家》中,安德魯是一臺機器人俄讹,在主人馬丁家中擔(dān)任管家哆致。他學(xué)會了繪畫、寫詩患膛,憧憬愛情摊阀,渴望成為一個真正的人。在馬丁家中踪蹬,他過了兩個世紀(jì)胞此,不斷進化,終于成為了一個真正的人跃捣,就在他被人類社會認(rèn)可的時候漱牵,他去世了奉芦,而死亡也是人與AI的區(qū)別之一缩麸。

影片《人工智能(2001)》,斯皮爾伯格導(dǎo)演

在電影《人工智能》中全度,機器人大衛(wèi)是一個小男孩娶聘,被人類家庭拋棄灵临。他一直希望成為一個真正的孩子,希望真正地被愛趴荸。為了實現(xiàn)這個愿望儒溉,他踏上了冒險的旅程。二千年后发钝,人類已經(jīng)滅亡顿涣,外星人發(fā)現(xiàn)了他,將他視為一個傳奇的存在酝豪,提取了他的記憶涛碑,為他制造了完美的一天。

在上面的影片中孵淘,AI對人類沒有惡意蒲障,并且愛護和守護著人類,也渴望成為人類。著名的科幻小說作家艾薩克·阿西莫夫創(chuàng)造了“機器人三大定律”揉阎,如果機器人不遵守這三大定律呢庄撮,在機器人眼中,是不是會象三體人看地球人那樣認(rèn)為“你們都是蟲子”呢毙籽?

影片《機械姬(2014)》

在電影《機械姬》中洞斯,通過了圖靈測試的AI,在謀殺了實驗室的全部工作人員后坑赡,成功地逃了出去烙如,融入了人類社會。

電影《終結(jié)者(1984)》毅否,導(dǎo)演詹姆斯·卡梅隆亚铁,主演施瓦辛格

在電影《終結(jié)者》中,稱為“天網(wǎng)”(Skynet)的機器人AI控制著一支強大的軍隊螟加,試圖滅絕人類刀闷。

六、本書作者

本書的英文版書名《What Is ChatGPT Doing ... and Why Does It Work?》仰迁,2023年3月9日出版甸昏,112頁。

本書作者沃爾夫勒姆認(rèn)為自然界是用編程語言寫的徐许,基于此施蜜,2009年,他設(shè)計了計算型知識引擎 Wolfram Alpha 雌隅。這是是一款在線自動問答系統(tǒng)翻默,用戶用自然語言對它提問,它可以自主生成答案恰起,而不是像其他的搜索引擎一樣返回相關(guān)網(wǎng)頁的鏈接修械。它一出現(xiàn),就被稱為“Google終結(jié)者”检盼。

Wolfram Alpha的頁面

Wolfram Alpha 是微軟的必應(yīng)和蘋果公司的Siri后臺所使用的問答系統(tǒng)之一肯污。

沃爾夫勒姆開發(fā)了Wolfram語言作為新型普適性多模態(tài)編程語言,主要用于科學(xué)計算和技術(shù)應(yīng)用吨枉。在2014年的電影《星際穿越》中黑洞的引力透鏡將就是用這個語言實現(xiàn)的蹦渣,在2016年的科幻電影《降臨 Arrival》中,Wolfram 語言參與了外星語言的設(shè)計創(chuàng)造貌亭。

電影《降臨(2016)》中能通曉過去未來的外星語言

隨著ChatGPT等人工智能技術(shù)的發(fā)展柬唯,人機交互將變得更加智能化和自然化。這可能會改變我們與計算機和機器的交互方式圃庭,讓人們更容易與技術(shù)進行溝通和協(xié)作锄奢。ChatGPT等人工智能技術(shù)的出現(xiàn)為人類帶來了許多機遇和挑戰(zhàn)失晴。關(guān)鍵在于我們?nèi)绾卫碇堑貞?yīng)用和管理這些技術(shù),以確保其對人類社會的影響是積極和可持續(xù)的拘央。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末涂屁,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子堪滨,更是在濱河造成了極大的恐慌胯陋,老刑警劉巖蕊温,帶你破解...
    沈念sama閱讀 206,013評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件袱箱,死亡現(xiàn)場離奇詭異,居然都是意外死亡义矛,警方通過查閱死者的電腦和手機发笔,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來凉翻,“玉大人了讨,你說我怎么就攤上這事≈坪洌” “怎么了前计?”我有些...
    開封第一講書人閱讀 152,370評論 0 342
  • 文/不壞的土叔 我叫張陵,是天一觀的道長垃杖。 經(jīng)常有香客問我男杈,道長,這世上最難降的妖魔是什么调俘? 我笑而不...
    開封第一講書人閱讀 55,168評論 1 278
  • 正文 為了忘掉前任伶棒,我火速辦了婚禮,結(jié)果婚禮上彩库,老公的妹妹穿的比我還像新娘肤无。我一直安慰自己,他們只是感情好骇钦,可當(dāng)我...
    茶點故事閱讀 64,153評論 5 371
  • 文/花漫 我一把揭開白布宛渐。 她就那樣靜靜地躺著,像睡著了一般眯搭。 火紅的嫁衣襯著肌膚如雪皇忿。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 48,954評論 1 283
  • 那天坦仍,我揣著相機與錄音鳍烁,去河邊找鬼。 笑死繁扎,一個胖子當(dāng)著我的面吹牛幔荒,可吹牛的內(nèi)容都是我干的糊闽。 我是一名探鬼主播,決...
    沈念sama閱讀 38,271評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼爹梁,長吁一口氣:“原來是場噩夢啊……” “哼右犹!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起姚垃,我...
    開封第一講書人閱讀 36,916評論 0 259
  • 序言:老撾萬榮一對情侶失蹤念链,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后积糯,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體掂墓,經(jīng)...
    沈念sama閱讀 43,382評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,877評論 2 323
  • 正文 我和宋清朗相戀三年看成,在試婚紗的時候發(fā)現(xiàn)自己被綠了君编。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 37,989評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡川慌,死狀恐怖吃嘿,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情梦重,我是刑警寧澤兑燥,帶...
    沈念sama閱讀 33,624評論 4 322
  • 正文 年R本政府宣布,位于F島的核電站琴拧,受9級特大地震影響降瞳,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜艾蓝,卻給世界環(huán)境...
    茶點故事閱讀 39,209評論 3 307
  • 文/蒙蒙 一力崇、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧赢织,春花似錦亮靴、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至八毯,卻和暖如春搓侄,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背话速。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評論 1 260
  • 我被黑心中介騙來泰國打工讶踪, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人泊交。 一個月前我還...
    沈念sama閱讀 45,401評論 2 352
  • 正文 我出身青樓乳讥,卻偏偏與公主長得像柱查,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子云石,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,700評論 2 345

推薦閱讀更多精彩內(nèi)容