??現(xiàn)在一提到AI我們想到的一般都是什么大語言模型答恶、深度學(xué)習(xí)等慰枕,但是以算法為核心的這個(gè)領(lǐng)域的應(yīng)用,其發(fā)展的過程是怎么樣的苛骨?有怎樣的分類方法?通過這樣時(shí)間的縱向梳理和類別的橫向并列就能對(duì)這個(gè)領(lǐng)域的沿革和類別有了經(jīng)緯交織的理解苟呐,能獲得全面的一個(gè)把控痒芝,實(shí)現(xiàn)俯視這個(gè)領(lǐng)域。本篇文章說機(jī)器學(xué)習(xí)的來源與發(fā)展沿革牵素。
??一大堆數(shù)據(jù)中存在什么結(jié)構(gòu)或者模式嗎严衬,通過建立模型來描述這些結(jié)構(gòu),并且把這個(gè)模型用于對(duì)未知數(shù)據(jù)進(jìn)行推斷或預(yù)測笆呆。這一直是人類試圖把握世界的一種方法请琳,這樣可以簡化對(duì)象,掌握關(guān)鍵因素和演化關(guān)系赠幕。二十世紀(jì)二十年代俄精,基于當(dāng)時(shí)的概率和數(shù)理統(tǒng)計(jì)的發(fā)展,在小數(shù)據(jù)量上形成簡單模型榕堰,如線性回歸等竖慧,強(qiáng)調(diào)理論性,可解釋性好逆屡,統(tǒng)計(jì)學(xué)習(xí)應(yīng)運(yùn)而生圾旨。隨著計(jì)算機(jī)技術(shù)的發(fā)展,需要大量運(yùn)算的貝葉斯統(tǒng)計(jì)快速發(fā)展魏蔗,成為統(tǒng)計(jì)學(xué)習(xí)的又一個(gè)主力砍的,隨著數(shù)據(jù)海量化和數(shù)據(jù)維度的暴漲,只能使用更復(fù)雜的模型來擬合沫勿,于是在1980年代開始出現(xiàn)了改變世界的機(jī)器學(xué)習(xí)挨约。統(tǒng)計(jì)學(xué)習(xí)更偏理論分析和可解釋性,機(jī)器學(xué)習(xí)則關(guān)注預(yù)測性能和工程實(shí)現(xiàn)产雹。
??關(guān)注決策對(duì)結(jié)果影響的“統(tǒng)計(jì)決策”在構(gòu)建模型中的核心地位诫惭,引入優(yōu)化理論(如梯度下降)來構(gòu)建有效算法,將生物學(xué)和物理學(xué)的一些方法引入到模型中蔓挖,這是機(jī)器學(xué)習(xí)對(duì)統(tǒng)計(jì)學(xué)習(xí)的發(fā)展夕土。
??機(jī)器學(xué)習(xí)有多條發(fā)展路線,其中基于模仿生物神經(jīng)元連接方式的連接主義取得了很好的效果。在此基礎(chǔ)上怨绣,發(fā)展出了深度學(xué)習(xí)以及當(dāng)下如日中天的大語言模型角溃。他們之間是一種完全包括的關(guān)系。
??看上圖時(shí)請(qǐng)注意其層次方式和線條篮撑。虛線框表示使用的理論基礎(chǔ)减细。
???:集合中的包含關(guān)系。
??縮寫內(nèi)容:SVM: 支持向量機(jī) 赢笨。 CNN:卷積神經(jīng)網(wǎng)絡(luò)未蝌。RNN : 循環(huán)神經(jīng)網(wǎng)絡(luò)。 LSTM:長短期記憶網(wǎng)絡(luò)茧妒。 GAN:生成對(duì)抗網(wǎng)絡(luò)萧吠。 DQN:深度 Q 網(wǎng)絡(luò)。 GPT:生成式預(yù)訓(xùn)練變換模型桐筏。 BERT:雙向編碼器表示的變換模型纸型。 PaLM:路徑語言模型 。 Claude: Claude 模型(沒有特定的翻譯梅忌,一般保留其英文名稱)
??連結(jié)線:1.雙實(shí)線:技術(shù)繼承關(guān)系狰腌。 2.實(shí)線:特點(diǎn)和代表 3.虛線:理論基礎(chǔ)