一、深度學(xué)習(xí)基本概念
1. 認(rèn)識機(jī)器學(xué)習(xí)
- 人工智能:是一個專業(yè)領(lǐng)域蕉毯。
- 機(jī)器學(xué)習(xí):是人工智能的一個分支蚓挤。
- 深度學(xué)習(xí):是機(jī)器學(xué)習(xí)的一個分支,差異是深度學(xué)習(xí)引入了人工神經(jīng)網(wǎng)絡(luò)车份。
- LM大模型:是深度學(xué)習(xí)的一個分支谋减,分為:LLM大語言模型(支持文本),LMM多模態(tài)大模型(支持文本扫沼、圖片出爹、視頻)。
所謂模型缎除,就是一個包含了大量未知參數(shù)的函數(shù)严就,所謂訓(xùn)練,就是通過大量的數(shù)據(jù)去迭代逼近這些未知參數(shù)的最優(yōu)解器罐。
機(jī)器學(xué)習(xí)中的典型任務(wù)類型:分為分類任務(wù)(Classification)和回歸任務(wù)(Regression)
分類任務(wù):是對離散值進(jìn)行預(yù)測梢为,根據(jù)每個樣本的值/特征預(yù)測該樣本屬于類型A、類型B還是類型C技矮,例如情感分類抖誉、內(nèi)容審核殊轴,相當(dāng)于學(xué)習(xí)了一個分類邊界(決策邊界)衰倦,用分類邊界把不同類別的數(shù)據(jù)區(qū)分開來。
回歸任務(wù):是對連續(xù)值進(jìn)行預(yù)測旁理,根據(jù)每個樣本的值/特征預(yù)測該樣本的具體數(shù)值樊零,例如房價(jià)預(yù)測,股票預(yù)測等孽文,相當(dāng)于學(xué)習(xí)到了這一組數(shù)據(jù)背后的分布驻襟,能夠根據(jù)數(shù)據(jù)的輸入預(yù)測該數(shù)據(jù)的取值。
實(shí)際上芋哭,分類與回歸的根本區(qū)別在于輸出空間是否為一個度量空間沉衣。
對于分類問題,目的是尋找決策邊界减牺,其輸出空間B不是度量空間豌习,即“定性”。也就是說拔疚,在分類問題中肥隆,只有分類“正確”與“錯誤”之分,至于分類到了類別A還是類別B稚失,沒有分別栋艳,都是錯誤數(shù)量+1。
對于回歸問題句各,目的是尋找最優(yōu)擬合吸占,其輸出空間B是一個度量空間晴叨,即“定量”,通過度量空間衡量預(yù)測值與真實(shí)值之間的〝誤差大小”矾屯。當(dāng)真實(shí)值為10篙螟,預(yù)測值為5時(shí),誤差為5问拘,預(yù)測值為8時(shí)遍略,誤差為2。
【總結(jié)】:
分類問題:定性骤坐,判斷對與錯绪杏。
回歸問題:定量,判斷與正確答案差多少纽绍。
2.機(jī)器學(xué)習(xí)分類:
有監(jiān)督學(xué)習(xí):監(jiān)督學(xué)習(xí)利用大量的標(biāo)注數(shù)據(jù)來訓(xùn)練模型蕾久,對模型的預(yù)測值和數(shù)據(jù)的真實(shí)標(biāo)簽計(jì)算損失,然后將誤差進(jìn)行反向傳播(計(jì)算梯度拌夏、更新參數(shù))僧著,通過不斷的學(xué)習(xí),最終可以獲得識別新樣本的能力障簿。(這里也可以調(diào)用外部大模型的接口盹愚,來進(jìn)行預(yù)標(biāo)注數(shù)據(jù),可以大大減少人工標(biāo)注的成本)
每條數(shù)據(jù)都有正確答案(需要人工標(biāo)注)站故,通過模型預(yù)測結(jié)果與正確答案的誤差不斷優(yōu)化模型參數(shù)皆怕。
無監(jiān)督學(xué)習(xí):無監(jiān)督學(xué)習(xí)不依賴任何標(biāo)簽值,通過對數(shù)據(jù)內(nèi)在特征的挖掘西篓,找到樣本間的關(guān)系愈腾,比如聚類相關(guān)的任務(wù)。有監(jiān)督和無監(jiān)督最主要的區(qū)別在于模型在訓(xùn)練時(shí)是否需要人工標(biāo)注的標(biāo)簽信息岂津。
只有數(shù)據(jù)沒有答案(不需要人工標(biāo)注)虱黄,常見的是聚類算法,通過衡量樣本之間的距離來劃分類別吮成。
半監(jiān)督學(xué)習(xí):利用有標(biāo)簽數(shù)據(jù)和無標(biāo)簽數(shù)據(jù)來訓(xùn)練模型橱乱。一般假設(shè)無標(biāo)簽數(shù)據(jù)遠(yuǎn)多于有標(biāo)簽數(shù)據(jù)。例如使用有標(biāo)簽數(shù)據(jù)訓(xùn)練模型赁豆,然后對無標(biāo)簽數(shù)據(jù)進(jìn)行分類仅醇,再使用正確分類的無標(biāo)簽數(shù)據(jù)訓(xùn)練模型;
利用大量的無標(biāo)注數(shù)據(jù)和少量有標(biāo)注數(shù)據(jù)進(jìn)行模型訓(xùn)練
自監(jiān)督學(xué)習(xí):機(jī)器學(xué)習(xí)的標(biāo)注數(shù)據(jù)源于數(shù)據(jù)本身魔种,而不是由人工標(biāo)注析二。目前主流大模型的預(yù)訓(xùn)練過程都是采用自監(jiān)督學(xué)習(xí),將數(shù)據(jù)構(gòu)建成完型填空形式,讓模型預(yù)測對應(yīng)內(nèi)容叶摄,實(shí)現(xiàn)自監(jiān)督學(xué)習(xí)属韧。
通過對數(shù)據(jù)進(jìn)行處理,讓數(shù)據(jù)的一部分成為標(biāo)簽蛤吓,由此構(gòu)成大規(guī)模數(shù)據(jù)進(jìn)行模型訓(xùn)練
遠(yuǎn)程監(jiān)督學(xué)習(xí):主要用于關(guān)系抽取任務(wù)宵喂,采用bootstrap的思想通過已知三元組在文本中尋找共現(xiàn)句,自動構(gòu)成有標(biāo)簽數(shù)據(jù)会傲,進(jìn)行有監(jiān)督學(xué)習(xí)锅棕。
基于現(xiàn)有的三元組收集訓(xùn)練數(shù)據(jù),進(jìn)行有監(jiān)督學(xué)習(xí)
強(qiáng)化學(xué)習(xí):強(qiáng)化學(xué)習(xí)是智能體根據(jù)已有的經(jīng)驗(yàn)淌山,采取系統(tǒng)或隨機(jī)的方式裸燎,去嘗試各種可能答案的方式進(jìn)行學(xué)習(xí),并且智能體會通過環(huán)境反饋的獎賞來決定下一步的行為泼疑,并為了獲得更好的獎賞來進(jìn)一步強(qiáng)化學(xué)習(xí)德绿。
以獲取更高的環(huán)境獎勵為目標(biāo)優(yōu)化模型
企業(yè)現(xiàn)狀說明:
- 中小型公司的技術(shù)壁壘是數(shù)據(jù)不是技術(shù),一般不會直接調(diào)用外部大模型接口進(jìn)行訓(xùn)練和標(biāo)注數(shù)據(jù)退渗,這樣會有公司數(shù)據(jù)泄漏的風(fēng)險(xiǎn)移稳。
- 很多中小型公司招大模型的人,而不是直接去調(diào)用大廠的接口会油,原因就是擔(dān)心數(shù)據(jù)會泄漏个粱。 都是自己私有化部署模型自己進(jìn)行模型的參數(shù)微調(diào)和訓(xùn)練以滿足自己的業(yè)務(wù)需求。
- 非公司機(jī)密數(shù)據(jù)是可以直接使用外部大模型的接口钞啸,來進(jìn)行預(yù)標(biāo)注數(shù)據(jù)几蜻,可以大大減少人工標(biāo)注的成本;企業(yè)核心數(shù)據(jù)/非開放的數(shù)據(jù)可以采用私有化部署模型進(jìn)行訓(xùn)練和標(biāo)注体斩,以防止數(shù)據(jù)泄露。
二颖低、模型訓(xùn)練基本概念
1.基礎(chǔ)名詞解釋
樣本:一條數(shù)據(jù);
特征:被觀測對象的可測量特性絮吵,例如:如何評估一個西瓜是否是好西瓜?可以從西瓜的顏色忱屑、瓜蒂蹬敲、紋路、敲擊聲等莺戒;
特征向量:用一個 d維向量表征一個樣本的所有或部分特征伴嗡;
標(biāo)簽(label)/真實(shí)值:樣本特征對應(yīng)的真實(shí)類型或者真實(shí)取值,即正確答案;
數(shù)據(jù)集(dataset):多條樣本組成的集合;
訓(xùn)練集(train):用于訓(xùn)練模型的數(shù)據(jù)集合
評估集(eval):用于在訓(xùn)練過程中周期性評估模型效果的數(shù)據(jù)集合;
測試集(test):用于在訓(xùn)練完成后評估最終模型效果的數(shù)據(jù)集合从铲;
模型:可以以數(shù)據(jù)中學(xué)習(xí)到的瘪校,可以實(shí)現(xiàn)特定功能/映射的函數(shù);
誤差/損失:樣本真實(shí)值與預(yù)測值之問的誤差;
預(yù)測值:樣本輸入模型后輸出的結(jié)果阱扬;
模型訓(xùn)練:使用訓(xùn)練數(shù)據(jù)集對模型參數(shù)進(jìn)行迭代更新的過程泣懊;
模型收斂:任意輸入樣本對應(yīng)的預(yù)測結(jié)果與真實(shí)標(biāo)簽之間的誤差穩(wěn)定;
模型評估:使用測試數(shù)據(jù)和評估指標(biāo)對訓(xùn)練完成的模型的效果進(jìn)行評估的過程
模型推理/預(yù)測:使用訓(xùn)練好的模型對數(shù)據(jù)進(jìn)行預(yù)測的過程麻惶;
模型部署:使用服務(wù)加載訓(xùn)練好的模型馍刮,對外提供推理服務(wù);
2.機(jī)器學(xué)習(xí)任務(wù)流程
3.模型訓(xùn)練基本流程
假設(shè)我們現(xiàn)在要訓(xùn)練一個模型窃蹋,這個模型要用來判斷一個西瓜是好西瓜卡啰,還是壞西瓜?如果是好西瓜就輸出1警没,如果是壞西瓜就輸出0碎乃,這是典型的分類問題。
4.模型訓(xùn)練詳細(xì)流程
Step:一次梯度更新的過程惠奸;
Epoch:模型完成一次完整訓(xùn)練集的訓(xùn)練梅誓;