基礎(chǔ)“AI入門(mén)”是指人工智能相關(guān)的基本概念副女。大多數(shù)人工智能算法是接受一個(gè)輸入數(shù)組导帝,從而產(chǎn)生一個(gè)輸出數(shù)組—人工智能所能解決的問(wèn)題通常被歸化為此類模型章钾。而在算法模型內(nèi)部,還需要有額外的數(shù)組來(lái)存儲(chǔ)長(zhǎng)短期記憶艺演。算法的訓(xùn)練實(shí)際上就是通過(guò)調(diào)整長(zhǎng)期記憶的值來(lái)產(chǎn)生對(duì)應(yīng)于給定輸入的預(yù)期輸出的一個(gè)過(guò)程却紧。
算法一“ 數(shù)據(jù)歸一化”是指大多數(shù)人工智能算法對(duì)原始數(shù)據(jù)的預(yù)處理流程。數(shù)據(jù)需要以一個(gè)輸入數(shù)組的形式傳遞給算法胎撤,但實(shí)踐中獲取到的數(shù)據(jù)并不一定都是數(shù)值型的晓殊,也有一些是類別信息,比如顏色伤提、形狀巫俺、性別、物種抑或其他一些非數(shù)值型的描述性特征肿男。此外介汹,就算是現(xiàn)成的數(shù)值型數(shù)據(jù),也必須在一定范圍內(nèi)歸一化舶沛,并且通常是歸一化到 (-1, 1) 區(qū)間嘹承。
算法二“距離度量”是指我們比較數(shù)據(jù)的方法,說(shuō)起來(lái)這種比較方法其實(shí)跟在地圖上標(biāo)識(shí)出兩點(diǎn)間的距離十分相像如庭。人工智能通常以數(shù)值數(shù)組的形式處理數(shù)據(jù)叹卷,包括輸入數(shù)據(jù)、輸出數(shù)據(jù)柱彻、長(zhǎng)期記憶豪娜、短期記憶和其他很多數(shù)據(jù)都是如此,這些數(shù)組很多時(shí)候也被稱作“向量”哟楷。我們可以像計(jì)算兩點(diǎn)間距離一樣瘤载,計(jì)算出兩個(gè)數(shù)據(jù)之間的差異(二維和三維的點(diǎn)可以分別看作長(zhǎng)度為二和三的向量)。當(dāng)然卖擅,在人工智能領(lǐng)域鸣奔,我們經(jīng)常要處理的是更高維空間中的數(shù)據(jù)墨技。
算法三“隨機(jī)數(shù)生成”是指人工智能算法中隨機(jī)數(shù)的生成和使用。關(guān)于均勻隨機(jī)數(shù)和正態(tài)隨機(jī)數(shù)的研究切入——出現(xiàn)這種不同的根源在于有的時(shí)候算法要求隨機(jī)數(shù)具有等可能性挎狸,而有的時(shí)候又需要它們服從某種既定的分布扣汪。此外我們要探索生成隨機(jī)數(shù)的方法。
算法四“K均值聚類算法”是指將數(shù)據(jù)按相似度分類的方法锨匆。K均值算法本身可以用來(lái)將數(shù)據(jù)按共性分組崭别,同時(shí)也可以被用于組成更復(fù)雜的算法—比如遺傳算法就利用K均值算法對(duì)種群按特征歸類,各路網(wǎng)商也利用聚類算法劃分顧客恐锣,依照同類型顧客的消費(fèi)習(xí)慣調(diào)整銷售策略茅主。
算法五“誤差計(jì)算”是指評(píng)估人工智能算法效果的方法。誤差計(jì)算的過(guò)程由一個(gè)用以評(píng)估算法最終效果的評(píng)分函數(shù)執(zhí)行土榴,其結(jié)果決定了算法的效果诀姚。一類常用的評(píng)分函數(shù)只需要給定輸入向量和預(yù)期輸出向量,也就是所謂的“訓(xùn)練數(shù)據(jù)”玷禽;算法的效果則由實(shí)際輸出與預(yù)期輸出間的差異決定赫段。
算法六“邁向機(jī)器學(xué)習(xí)”是指從數(shù)據(jù)中學(xué)習(xí)特征來(lái)優(yōu)化結(jié)果的簡(jiǎn)單機(jī)器學(xué)習(xí)算法。大多數(shù)人工智能算法是用權(quán)值向量將輸入向量轉(zhuǎn)化為期望的輸出向量矢赁,這些權(quán)值向量構(gòu)成了算法的長(zhǎng)期記憶糯笙,“訓(xùn)練”就是一個(gè)調(diào)整長(zhǎng)期記憶以產(chǎn)生預(yù)期輸出的過(guò)程。具有學(xué)習(xí)能力的簡(jiǎn)單模型的構(gòu)建方法撩银,簡(jiǎn)單但卻行之有效的訓(xùn)練算法炬丸,能夠調(diào)整這種長(zhǎng)期記憶(權(quán)重向量)并優(yōu)化輸出結(jié)果—簡(jiǎn)單隨機(jī)漫步和爬山算法正是其中之二。
算法七“優(yōu)化訓(xùn)練”是指在前面六種算法基礎(chǔ)上進(jìn)行了一定的拓展蜒蕾,介紹了像模擬退火算法和Nelder-Mead法[2]這樣用來(lái)快速優(yōu)化人工智能模型權(quán)重的算法稠炬。通過(guò)前面六種算法基礎(chǔ)來(lái)如何通過(guò)一定的調(diào)整,將這些優(yōu)化算法應(yīng)用于之前提到過(guò)的部分模型咪啡。
算法八“離散優(yōu)化”是指如何優(yōu)化非數(shù)值型的類別型數(shù)據(jù)首启。并非所有優(yōu)化問(wèn)題都是數(shù)值型的,還有離散型和類別型問(wèn)題撤摸,比如背包問(wèn)題和旅行商問(wèn)題毅桃。如何模擬退火算法可以用于處理這兩個(gè)問(wèn)題,并且該算法既適用于連續(xù)的數(shù)值型問(wèn)題准夷,也適用于離散的類別型問(wèn)題钥飞。
算法九“線性回歸”是指如何用線性和非線性方程來(lái)學(xué)習(xí)趨勢(shì)并做出預(yù)測(cè)。如何簡(jiǎn)單線性回歸衫嵌,并演示如何用它來(lái)擬合數(shù)據(jù)為線性模型读宙。此外還將介紹可以擬合非線性數(shù)據(jù)的廣義線性模型(General Linear Model,GLM)楔绞。