2018-04-03 landscape

機器學習主要解決什么問題?

1 需要手動調(diào)整大量規(guī)則的問題
2 傳統(tǒng)方法無法解決的問題包警,機器學習可以碰碰運氣
3 波動性的環(huán)境
4 復雜問題和大量數(shù)據(jù)

機器學習的種類

分類機器學習算法主要依靠以下幾個標準
1 是否需要人類監(jiān)督(監(jiān)督式學習弱匪,非監(jiān)督式學習,半監(jiān)督式學習,強化學習)
2 是否可以從不斷增長中的數(shù)據(jù)中學習(批量學習和在線學習)
3 是否只是用舊的數(shù)據(jù)點去比較新的數(shù)據(jù)點,還是建立一個預測模型(基于實例學習和基于模型學習)

監(jiān)督式學習中有這些,有些之前在吳恩達機器學習中看到過有些還沒學
k-臨近算法,只是簡單的計算距離
線性回歸
邏輯斯蒂回歸
支持向量機
決策樹和隨機森林 (隨機森林指的是利用多棵樹對樣本進行訓練并預測的一種分類器水慨。)
神經(jīng)網(wǎng)絡

非監(jiān)督式學習

聚集型
k-means
層次聚類分析
期望極大化算法

形象化和降維
PCA
Kernel PCA
Locally-Linear Embedding
t-SNE

關聯(lián)規(guī)則學習
Apriopri
Eclat
非監(jiān)督式學習可以很好的執(zhí)行異常檢測和特征提取等任務

半監(jiān)督式學習可以處理有的有標簽有的沒標簽的那些數(shù)據(jù),許多半監(jiān)督式學習算法是非監(jiān)督式還有監(jiān)督式的結合體敬扛,比如DBNs就是許多RBMs的結合強化學習則是讓學習系統(tǒng)(也被叫做代理人agent)去觀察環(huán)境晰洒,行動之后獲得反饋,他必須靠自己學習去尋找一個好的策略啥箭。

批量學習和在線學習的區(qū)別在于谍珊,一個是一開始就把所有數(shù)據(jù)喂給學習系統(tǒng),讓它一次性學完然后去工作急侥。另一個一點點把數(shù)據(jù)喂給系統(tǒng)砌滞,讓它不斷適應新的數(shù)據(jù)。

基于實例的學習和基于模型的學習
基于實例的學習記住那些樣本坏怪,然后測量新樣本和它們的相似度贝润。比如K-鄰近回歸算法。
基于模型的的學習則是根據(jù)一個模型來進行預測铝宵,一般來說是這樣的:
1.研究數(shù)據(jù)
2.選擇模型
3.使用數(shù)據(jù)對模型進行訓練
4.使用訓練好的模型進行預測

機器學習中可能出現(xiàn)的問題

1.缺乏足夠訓練數(shù)據(jù)打掘,2001年微軟的研究者指出更多的數(shù)據(jù)可以有效的提高預測的準確度。這就表明我們必須重新考慮到底應該在算法研究上投入更多的錢和時間還是在收集數(shù)據(jù)建設語料庫上投入更多的錢和時間捉超。
2.非代表性的線性數(shù)據(jù)胧卤,比如在GDP和幸福感之間關聯(lián)的研究之中,漏掉了很多富有卻不幸福還有幸福但不富裕的國家拼岳,使得整個模型看上去就是一個線性模型枝誊。這種現(xiàn)象的原因可能是認為操作,也可能是取樣方法出現(xiàn)了問題從而導致取樣偏差惜纸。
3.低質(zhì)量的數(shù)據(jù)
如果你的數(shù)據(jù)集到處都是錯誤和漏洞自然訓練不出什么好結果叶撒。
4.不相干的特征
如果你選取的特征和你要預測的內(nèi)容毫不相干自然也是沒法預測的。解決這一問題的方法被稱為特征設計(feature engineering)耐版,首先要選取最有用的特征祠够,其次可以合并已有特征產(chǎn)生更有用的特征,或者獲取新數(shù)據(jù)來增加特征粪牲。
5.過擬合
過擬合主要發(fā)生在模型過于復雜以及數(shù)據(jù)集的干擾噪點太多的時候古瓤,因此主要的解決方法大致是1.簡化模型,使用更少的特征去訓練。2.收集更多數(shù)據(jù)3.通過修復數(shù)據(jù)錯誤以及刪除異常值的方法減少訓練集的噪音落君。
6.欠擬合
與過擬合相反穿香,解決方法大致為
1.選擇更加強大的模型,使用更多參數(shù)
2.通過特征設計(feature engineering)給模型更好的特征去學習
3.減少模型的約束(比如減小正則化的超參數(shù))

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末绎速,一起剝皮案震驚了整個濱河市皮获,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌纹冤,老刑警劉巖洒宝,帶你破解...
    沈念sama閱讀 222,865評論 6 518
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異萌京,居然都是意外死亡雁歌,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,296評論 3 399
  • 文/潘曉璐 我一進店門枫夺,熙熙樓的掌柜王于貴愁眉苦臉地迎上來将宪,“玉大人绘闷,你說我怎么就攤上這事橡庞。” “怎么了印蔗?”我有些...
    開封第一講書人閱讀 169,631評論 0 364
  • 文/不壞的土叔 我叫張陵扒最,是天一觀的道長。 經(jīng)常有香客問我华嘹,道長吧趣,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 60,199評論 1 300
  • 正文 為了忘掉前任耙厚,我火速辦了婚禮强挫,結果婚禮上,老公的妹妹穿的比我還像新娘薛躬。我一直安慰自己俯渤,他們只是感情好,可當我...
    茶點故事閱讀 69,196評論 6 398
  • 文/花漫 我一把揭開白布型宝。 她就那樣靜靜地躺著八匠,像睡著了一般。 火紅的嫁衣襯著肌膚如雪趴酣。 梳的紋絲不亂的頭發(fā)上梨树,一...
    開封第一講書人閱讀 52,793評論 1 314
  • 那天,我揣著相機與錄音岖寞,去河邊找鬼抡四。 笑死,一個胖子當著我的面吹牛仗谆,可吹牛的內(nèi)容都是我干的指巡。 我是一名探鬼主播跨释,決...
    沈念sama閱讀 41,221評論 3 423
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼厌处!你這毒婦竟也來了鳖谈?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 40,174評論 0 277
  • 序言:老撾萬榮一對情侶失蹤阔涉,失蹤者是張志新(化名)和其女友劉穎缆娃,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體瑰排,經(jīng)...
    沈念sama閱讀 46,699評論 1 320
  • 正文 獨居荒郊野嶺守林人離奇死亡贯要,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,770評論 3 343
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了椭住。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片崇渗。...
    茶點故事閱讀 40,918評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖京郑,靈堂內(nèi)的尸體忽然破棺而出宅广,到底是詐尸還是另有隱情,我是刑警寧澤些举,帶...
    沈念sama閱讀 36,573評論 5 351
  • 正文 年R本政府宣布跟狱,位于F島的核電站,受9級特大地震影響户魏,放射性物質(zhì)發(fā)生泄漏驶臊。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,255評論 3 336
  • 文/蒙蒙 一叼丑、第九天 我趴在偏房一處隱蔽的房頂上張望关翎。 院中可真熱鬧,春花似錦鸠信、人聲如沸纵寝。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,749評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽店雅。三九已至,卻和暖如春贞铣,著一層夾襖步出監(jiān)牢的瞬間闹啦,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,862評論 1 274
  • 我被黑心中介騙來泰國打工辕坝, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留窍奋,地道東北人。 一個月前我還...
    沈念sama閱讀 49,364評論 3 379
  • 正文 我出身青樓,卻偏偏與公主長得像琳袄,于是被迫代替她去往敵國和親江场。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,926評論 2 361

推薦閱讀更多精彩內(nèi)容