ChatGPT是美國(guó)研究人工智能的OpenAI公司于2022年11月30日發(fā)布的通用聊天機(jī)器人程序美浦。ChatGPT推出之后季希,在2個(gè)月內(nèi)達(dá)到1億活躍用戶,是歷史上增長(zhǎng)最快的消費(fèi)者應(yīng)用程序谚中,受到全世界的廣泛關(guān)注沐寺,掀起了人工智能領(lǐng)域的技術(shù)巨浪林艘。分析ChatGPT的相關(guān)技術(shù)特點(diǎn),研究在市場(chǎng)監(jiān)管領(lǐng)域應(yīng)用的優(yōu)勢(shì)和存在的問(wèn)題混坞,對(duì)于做好新時(shí)期的智慧監(jiān)管工作具有重要的意義狐援。
一、ChatGPT概述
ChatGPT作為由人工智能技術(shù)驅(qū)動(dòng)的自然語(yǔ)言處理工具究孕,能夠通過(guò)理解和學(xué)習(xí)人類(lèi)的語(yǔ)言來(lái)進(jìn)行對(duì)話啥酱,根據(jù)用戶的文本輸入和聊天的上下文內(nèi)容,產(chǎn)生相應(yīng)的智能回答厨诸,像人類(lèi)一樣來(lái)聊天交流镶殷,還可以完成編寫(xiě)代碼、設(shè)計(jì)文案微酬、撰寫(xiě)論文绘趋、機(jī)器翻譯、回復(fù)郵件等多種任務(wù)得封。
ChatGPT具有令人驚艷的語(yǔ)言理解埋心、生成和知識(shí)推理能力,能夠很好地理解用戶意圖忙上,真正做到多輪溝通拷呆,并且回答內(nèi)容完整、重點(diǎn)清晰、有概括茬斧、有邏輯腰懂、有條理。ChatGPT是繼數(shù)據(jù)庫(kù)和搜索引擎之后全新一代的知識(shí)表示和調(diào)用方式项秉。
ChatGPT在推出之后迅速形成了一種現(xiàn)象級(jí)的應(yīng)用绣溜,表現(xiàn)出很高的人機(jī)交互水平,已經(jīng)具備面向通用人工智能的特征娄蔼,在眾多行業(yè)領(lǐng)域具有廣泛的應(yīng)用潛力怖喻。
二、ChatGPT相關(guān)技術(shù)與發(fā)展
(一)ChatGPT的相關(guān)技術(shù)岁诉。
Chat GPT的模型架構(gòu)锚沸。ChatGPT 采用基于 Transformer 模型架構(gòu)實(shí)現(xiàn)的,Transformer是一個(gè)利用注意力機(jī)制來(lái)提高模型訓(xùn)練速度的大語(yǔ)言模型涕癣。ChatGPT包括了多層自注意力機(jī)制和前向神經(jīng)網(wǎng)絡(luò)哗蜈,能夠捕捉長(zhǎng)距離的依賴關(guān)系,具有較強(qiáng)的語(yǔ)言理解能力坠韩。
ChatGPT的學(xué)習(xí)機(jī)制距潘。ChatGPT通過(guò)大規(guī)模語(yǔ)料庫(kù)的有監(jiān)督學(xué)習(xí)來(lái)訓(xùn)練的,利用互聯(lián)網(wǎng)上的海量文本數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練只搁,從而學(xué)習(xí)到豐富的語(yǔ)言知識(shí)和規(guī)律音比。大規(guī)模語(yǔ)料庫(kù)訓(xùn)練的優(yōu)勢(shì)在于可以利用大量的文本數(shù)據(jù),從而提高模型的泛化能力须蜗、準(zhǔn)確率和覆蓋率硅确。此外,大規(guī)模語(yǔ)料庫(kù)訓(xùn)練還可以提高模型的魯棒性明肮,使得模型能夠更好地應(yīng)對(duì)各種復(fù)雜的自然語(yǔ)言處理任務(wù)菱农。
ChatGPT的訓(xùn)練方法。ChatGPT在訓(xùn)練的過(guò)程中使用了“人類(lèi)反饋強(qiáng)化學(xué)習(xí)”的訓(xùn)練方法柿估,這種方法在AI訓(xùn)練的過(guò)程中使用人類(lèi)反饋循未,以最大限度地減少無(wú)意義的、失真的或者存在偏見(jiàn)的輸出秫舌。得益于這種訓(xùn)練方法的妖,ChatGPT能夠在對(duì)話過(guò)程中記憶先前使用者的對(duì)話訊息,即上下文理解足陨,以回答某些假設(shè)性的問(wèn)題嫂粟。ChatGPT可實(shí)現(xiàn)連續(xù)對(duì)話,極大地提升了對(duì)話交互模式下的用戶體驗(yàn)墨缘。
(二)ChatGPT的技術(shù)發(fā)展星虹。
ChatGPT采用的大語(yǔ)言模型規(guī)模龐大零抬,包含數(shù)十億的參數(shù),來(lái)學(xué)習(xí)語(yǔ)言數(shù)據(jù)中的復(fù)雜模式宽涌。2018年OpenAI推出的第一代GPT-1模型具有1.17億個(gè)參數(shù)平夜,2019年推出第二代GPT-2模型已經(jīng)具有15億個(gè)參數(shù),2020年推出的GPT-3模型具有1750億個(gè)參數(shù)卸亮,在GPT-3模型面前忽妒,用戶提供小樣本的提示語(yǔ)或直接詢問(wèn),就能獲得符合要求的高質(zhì)量答案兼贸。2022年3月段直,OpenAI推出了InstructGPT模型,該模型為GPT-3的微調(diào)版溶诞。2022年11月30日坷牛,OpenAI推出全新的對(duì)話式通用人工智能工具——ChatGPT。ChatGPT表現(xiàn)出了非常驚艷的語(yǔ)言理解很澄、生成、知識(shí)推理能力颜及,可以很好地理解用戶意圖甩苛,做到有效的多輪溝通,并且回答內(nèi)容完整俏站、重點(diǎn)清晰讯蒲、有概括、有邏輯肄扎、有條理墨林。
2023年3月15日,OpenAI發(fā)布了最新的人工智能語(yǔ)言模型GPT-4犯祠,這是一項(xiàng)具有里程碑意義的技術(shù)進(jìn)步旭等。GPT-4不僅可以生成類(lèi)似于人類(lèi)語(yǔ)言的文本,還可以接受圖像和文本作為輸入衡载,并輸出文本搔耕。GPT-4可以處理多種類(lèi)型的信息,并以更自然和流暢的方式與人類(lèi)交流痰娱。與GPT-3.5相比弃榨,GPT-4擁有更大的模型規(guī)模和更多的訓(xùn)練數(shù)據(jù),從而提高了其生成文本的質(zhì)量和多樣性梨睁。GPT4在語(yǔ)言理解鲸睛、邏輯推理、數(shù)學(xué)計(jì)算等方面都有很強(qiáng)的能力坡贺。除文本輸入外官辈,GPT-4還具有處理圖像輸入的能力箱舞,用戶可以指定任何視覺(jué)或者語(yǔ)言任務(wù)。據(jù)OpenAI稱(chēng)钧萍,GPT-4在各種專(zhuān)業(yè)和學(xué)術(shù)領(lǐng)域的基準(zhǔn)測(cè)試中表現(xiàn)出了“人類(lèi)水平”的性能褐缠。3月17日,微軟發(fā)布Microsoft 365 Copilot风瘦,使用了最新發(fā)布的 GPT-4 队魏,并將其引入到 Microsoft 365 應(yīng)用程序,包括 Word万搔、Excel胡桨、PowerPoint、Outlook等瞬雹,標(biāo)志著GPT已帶來(lái)人們與電腦辦公軟件交互方式的新階段昧谊。
(三)國(guó)內(nèi)類(lèi)ChatGPT的大模型產(chǎn)品。
隨著OpenAI的GPT系列產(chǎn)品在全球的關(guān)注度不斷提升酗捌,國(guó)內(nèi)致力于人工智能技術(shù)研發(fā)的機(jī)構(gòu)也先后推出自己的類(lèi)ChatGPT的大模型技術(shù)產(chǎn)品呢诬。2023年3月16日,百度正式推出國(guó)內(nèi)首款生成式AI產(chǎn)品“文心一言”胖缤,可支持文學(xué)創(chuàng)作尚镰、文案創(chuàng)作、數(shù)理推算哪廓、多模態(tài)生成等功能狗唉。4月10日,商湯科技發(fā)布“日日新SenseNova”大模型體系涡真,推出自然語(yǔ)言處理分俯、內(nèi)容生成、自動(dòng)化數(shù)據(jù)標(biāo)注哆料、自定義模型訓(xùn)練等多種大模型及能力缸剪。4月11日的阿里云峰會(huì)上,阿里巴巴推出大語(yǔ)言模型“通義千問(wèn)”东亦,具備多輪對(duì)話橄登、文案創(chuàng)作、邏輯推理讥此、多模態(tài)理解拢锹、多語(yǔ)言支持等功能。4月25日萄喳,華為云發(fā)布盤(pán)古系列超大規(guī)模預(yù)訓(xùn)練模型卒稳,包括30億參數(shù)的全球最大視覺(jué)(CV)預(yù)訓(xùn)練模型,以及與循環(huán)智能他巨、鵬城實(shí)驗(yàn)室聯(lián)合開(kāi)發(fā)的千億參數(shù)充坑、40TB訓(xùn)練數(shù)據(jù)的全球最大中文語(yǔ)言(NLP)預(yù)訓(xùn)練模型减江。2023年5月6日,科大訊飛正式發(fā)布訊飛星火認(rèn)知智能大模型捻爷,擁有跨領(lǐng)域的知識(shí)和語(yǔ)言理解能力辈灼,能夠基于自然對(duì)話方式理解與執(zhí)行任務(wù)。從海量數(shù)據(jù)和大規(guī)模知識(shí)中持續(xù)進(jìn)化也榄,實(shí)現(xiàn)從提出巡莹、規(guī)劃到解決問(wèn)題的全流程閉環(huán)√鹱希科大訊飛將大模型落地應(yīng)用降宅,推出了面向教育、辦公囚霸、車(chē)載等行業(yè)的解決方案腰根。后續(xù)國(guó)內(nèi)將會(huì)有更多類(lèi)ChatGPT的大模型產(chǎn)品發(fā)布,把國(guó)內(nèi)人工智能技術(shù)發(fā)展和應(yīng)用推向新的階段拓型。
三额嘿、ChatGPT技術(shù)應(yīng)用中面臨的問(wèn)題
ChatGPT是人工智能技術(shù)領(lǐng)域的一項(xiàng)新的突破,作為新的技術(shù)在市場(chǎng)監(jiān)管領(lǐng)域獲得應(yīng)用劣挫,還面臨數(shù)據(jù)安全岩睁、技術(shù)成熟度和資源投入等一些問(wèn)題。
(一)數(shù)據(jù)安全問(wèn)題揣云。
運(yùn)用ChatGPT技術(shù)的應(yīng)用需要大量數(shù)據(jù)進(jìn)行訓(xùn)練,具有收集冰啃、儲(chǔ)存和使用海量數(shù)據(jù)的功能邓夕。用戶在輸入端口提出問(wèn)題后,用戶與其對(duì)話的數(shù)據(jù)將會(huì)被存儲(chǔ)在應(yīng)用程序運(yùn)行的云計(jì)算平臺(tái)阎毅。人機(jī)交互問(wèn)答中焚刚,提問(wèn)者與ChatGPT分享的數(shù)據(jù)被用于未來(lái)模型的迭代訓(xùn)練,這些數(shù)據(jù)中可能涉及隱私信息扇调、敏感數(shù)據(jù)矿咕,存在數(shù)據(jù)泄露的安全風(fēng)險(xiǎn)。ChatGPT就運(yùn)行在OpenAI公司的云平臺(tái)狼钮,如果直接使用OpenAI的ChatGPT碳柱,存在數(shù)據(jù)跨境流動(dòng)的安全風(fēng)險(xiǎn)。因此熬芜,不建議在市場(chǎng)監(jiān)管應(yīng)用中直接使用或者調(diào)用ChatGPT莲镣,在保證數(shù)據(jù)安全的前提下,可以應(yīng)用ChatGPT相關(guān)的技術(shù)涎拉。
(二)人機(jī)協(xié)調(diào)問(wèn)題瑞侮。
在ChatGPT出現(xiàn)之前的圆,人工智能應(yīng)用以專(zhuān)用型為主,ChatGPT的出現(xiàn)是通用型人工智能應(yīng)用的重要里程碑半火。但是越妈,ChatGPT不能完全代替人,不能過(guò)于迷信運(yùn)用ChatGPT技術(shù)由機(jī)器給出的結(jié)果钮糖,ChatGPT也會(huì)出現(xiàn)誤判梅掠,影響市場(chǎng)監(jiān)管工作的準(zhǔn)確性和效果。市場(chǎng)監(jiān)管應(yīng)用藐鹤,必須充分考慮市場(chǎng)監(jiān)管工作人員的基于自身知識(shí)瓤檐、經(jīng)驗(yàn)的判斷,妥善處理人機(jī)協(xié)調(diào)問(wèn)題娱节。
(三)技術(shù)壁壘與成熟度問(wèn)題挠蛉。
OpenAI并沒(méi)有向中國(guó)大陸用戶開(kāi)放ChatGPT應(yīng)用,目前國(guó)內(nèi)用戶只能通過(guò)ChatGPT的鏡像網(wǎng)站進(jìn)行有限的使用體驗(yàn)肄满。ChatGPT之后谴古,國(guó)內(nèi)相關(guān)機(jī)構(gòu)先后推出了類(lèi)似ChatGPT的應(yīng)用,如百度的“文心一言”稠歉、阿里的“通義千問(wèn)”掰担,科大訊飛的“訊飛星火認(rèn)知大模型”,商湯科技的“日日新SenseNova”大模型體系等等怒炸,關(guān)于ChatGPT技術(shù)的成熟度還有待進(jìn)一步檢驗(yàn)带饱。目前的ChatGPT應(yīng)用主要集中在問(wèn)答式的應(yīng)用,由用戶提問(wèn)阅羹,計(jì)算機(jī)給出問(wèn)題的回答結(jié)果勺疼。ChatGPT推出以來(lái),還沒(méi)有看到與政府部門(mén)業(yè)務(wù)相關(guān)的成功案例捏鱼,ChatGPT的應(yīng)用領(lǐng)域還有待讀者去進(jìn)一步觀察和關(guān)注执庐。
(四)資源與成本問(wèn)題。
ChatGPT需要非常大量的算力來(lái)支持其訓(xùn)練和部署导梆。目前ChatGPT應(yīng)用時(shí)需要大算力的服務(wù)器支持轨淌,而這些服務(wù)器的成本普通用戶是無(wú)法承受的,即便數(shù)十億個(gè)參數(shù)的模型在搜索引擎的部署也需要驚人數(shù)量的計(jì)算資源才能運(yùn)行和訓(xùn)練看尼。因此递鹉,大多數(shù)企業(yè)都難以承受這高昂的成本。對(duì)于普通大眾來(lái)說(shuō)藏斩,還需等待更輕量型的模型或更高性價(jià)比的算力平臺(tái)梳虽。
四、注冊(cè)國(guó)內(nèi)同類(lèi)產(chǎn)品(審核ing)