機(jī)器學(xué)習(xí)是實(shí)現(xiàn)人工智能的手段拂蝎,其主要研究?jī)?nèi)容是如何利用數(shù)據(jù)或經(jīng)驗(yàn)進(jìn)行學(xué)習(xí)可缚,改善具體算法的性能霎迫。
- 多領(lǐng)域交叉,涉及概率論帘靡、統(tǒng)計(jì)學(xué)知给,算法復(fù)雜度理論等多門(mén)學(xué)科。
- 廣泛應(yīng)用于網(wǎng)絡(luò)搜索描姚、垃圾郵件過(guò)濾涩赢、推薦系統(tǒng)、廣告投放轰胁、信用評(píng)價(jià)谒主、欺詐檢測(cè)、股票交易和醫(yī)療診斷等應(yīng)用赃阀。
數(shù)據(jù)挖掘和預(yù)測(cè)競(jìng)賽平臺(tái):https://www.kaggle.com和阿里天池
分類
-
無(wú)監(jiān)督學(xué)習(xí):利用無(wú)標(biāo)簽/標(biāo)準(zhǔn)答案的數(shù)據(jù)霎肯,學(xué)習(xí)數(shù)據(jù)的分布或數(shù)據(jù)與數(shù)據(jù)之間的關(guān)系抽取出通用的規(guī)則,達(dá)到聚類和降維的目的榛斯。最常見(jiàn)的用途是將數(shù)據(jù)分為不同的聚類观游,使相似的樣本位于同一組中。例如驮俗,無(wú)監(jiān)督學(xué)習(xí)算法可以根據(jù)音樂(lè)的各種屬性將歌曲分為不同的聚類懂缕。所以聚類可以作為其他機(jī)器學(xué)習(xí)算法(例如音樂(lè)推薦服務(wù))的輸入,在很難獲取真標(biāo)簽的領(lǐng)域王凑,聚類可能會(huì)非常有用搪柑。例如聋丝,在反濫用和反欺詐等領(lǐng)域,聚類有助于人們更好地了解相關(guān)數(shù)據(jù)工碾。
主要算法:聚類弱睦、主成分分析(PCA)、K-means渊额、 -
半監(jiān)督學(xué)習(xí):給出的訓(xùn)練數(shù)據(jù)况木,有一部分有標(biāo)簽,有一部分沒(méi)有標(biāo)簽旬迹,我們想學(xué)習(xí)出數(shù)據(jù)組織結(jié)構(gòu)的同時(shí)火惊,也能做相應(yīng)的預(yù)測(cè)。半監(jiān)督學(xué)習(xí)采用的一種技術(shù)是推斷無(wú)標(biāo)簽樣本的標(biāo)簽奔垦,然后使用推斷出的標(biāo)簽進(jìn)行訓(xùn)練屹耐,以創(chuàng)建新模型。如果獲得有標(biāo)簽樣本需要高昂的成本椿猎,而無(wú)標(biāo)簽樣本則有很多张症,那么半監(jiān)督學(xué)習(xí)將非常有用。
主要算法:自訓(xùn)練(Self-Training)鸵贬、直推學(xué)習(xí)(Transductive Learning)俗他、生成式模型(Generative Model)等。 -
監(jiān)督學(xué)習(xí):利用一組帶有標(biāo)簽/標(biāo)準(zhǔn)答案的數(shù)據(jù)阔逼,學(xué)習(xí)從輸入到輸出的映射兆衅,然后將這種映射關(guān)系應(yīng)用到未知數(shù)據(jù)上,達(dá)到分類和回歸的目的嗜浮。簡(jiǎn)單口語(yǔ)化地說(shuō)明羡亩,在給定的訓(xùn)練樣本中,每個(gè)樣本的輸入X都對(duì)應(yīng)一個(gè)確定的結(jié)果Y危融,我們需要訓(xùn)練出一個(gè)模型(數(shù)學(xué)上看是一個(gè)x→y的映射關(guān)系f)畏铆,在未知結(jié)果的樣本X給定后,我們能對(duì)結(jié)果Y做出預(yù)測(cè)吉殃。
這里的預(yù)測(cè)結(jié)果Y如果是離散值(很多時(shí)候是類別類型辞居,比如郵件分類問(wèn)題中的垃圾郵件/普通郵件,用戶會(huì)/不會(huì)購(gòu)買(mǎi)某商品)蛋勺,我們把它叫做分類問(wèn)題(classification problem)瓦灶;如果預(yù)測(cè)結(jié)果Y是連續(xù)值(比如房?jī)r(jià),股票價(jià)格等)抱完,我們把它叫做回歸問(wèn)題(regression problem)贼陶。
主要算法:分類問(wèn)題(樸素貝葉斯、邏輯回歸、支持向量機(jī)(SVM)等)碉怔;回歸問(wèn)題(線性回歸烘贴、)決策樹(shù)、k近鄰(KNN)撮胧、集成學(xué)習(xí)庙楚。 - 增強(qiáng)學(xué)習(xí):允許代理根據(jù)其當(dāng)前狀態(tài)決定最佳的下一個(gè)動(dòng)作,通過(guò)學(xué)習(xí)將最大化獎(jiǎng)勵(lì)的行為趴樱。增強(qiáng)算法通常通過(guò)反復(fù)試驗(yàn)來(lái)學(xué)習(xí)最佳行為,通常用于機(jī)器人酪捡。機(jī)器人可以通過(guò)在碰到障礙物后接收負(fù)面反饋來(lái)學(xué)習(xí)避免碰撞叁征,以及在視頻游戲中 - 反復(fù)試驗(yàn)顯示特定動(dòng)作可以激發(fā)玩家的獎(jiǎng)勵(lì)。代理人然后可以使用這些獎(jiǎng)勵(lì)來(lái)了解游戲的最佳狀態(tài)并選擇下一個(gè)動(dòng)作逛薇。
- 深度學(xué)習(xí):是機(jī)器學(xué)習(xí)中人工神經(jīng)網(wǎng)絡(luò)算法的延申捺疼,廣泛應(yīng)用在計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理中,是機(jī)器學(xué)習(xí)的深入永罚。
scikit-learn庫(kù)
sklearn庫(kù)分為6大部分啤呼,分別用于完成分類任務(wù)、回歸任務(wù)呢袱、聚類任務(wù)官扣、降維任務(wù)、模型選擇以及數(shù)據(jù)的預(yù)處理羞福。