機器學習項目優(yōu)化-第一周-吳恩達 Deep Learning Specialization 學習筆記

機器學習策略

在機器學習算法訓練過程中艰额,提高算法準確率的方法可以有很多種柄沮,例如:

  • 收集更多數(shù)據(jù)或者將數(shù)據(jù)集的內涵更加多樣化

  • 采用更小的梯度下降來延長算法的訓練時間

  • 采用 Adam 優(yōu)化算法

  • 使用更大的神經網絡

  • 采用L2 正則化或隨機失活正則化

  • 更改網絡的基礎架構:如更換激活函數(shù)狱意、修改隱藏單元的數(shù)量等等

如果對于如何選擇合適的策略沒有一個清晰的概念详囤,很可能在一個方向上花了很長時間但最終對于算法的改進有限纬纪,因此 Andrew 在這里希望教給大家如何針對自己算法中存在的問題在這些策略中進行選擇包各。

正交化(orthogonalization)

正交化就是將系統(tǒng)中一個系列的功能調整和另一個系列的功能調整盡可能的分開问畅,最典型的例子就是老式電視機中調節(jié)畫面上下和水平位置的按鈕是獨立的兩個护姆。

在機器學習系統(tǒng)構建過程中卵皂,對于系統(tǒng)的調整可以遵照如下的過程:

  1. 針對選定的成本函數(shù)系統(tǒng)在訓練集中表現(xiàn)良好灯变,否則此時可以考慮采用更大的神經網絡捅膘,或者采用更好的優(yōu)化算法如 Adam 等

  2. 針對選定的成本函數(shù)算法在調整集上的表現(xiàn)良好刃泌,否則此時可以考慮 L2 正則化署尤、dropout 正則化俗扇,或者采用更大的訓練數(shù)據(jù)集

  3. 針對選定的成本函數(shù)算法在測試集上的表現(xiàn)良好狐援,否則這種情況很可能算法針對調整集做了過擬合究孕,所以可以考慮采用更大的調整數(shù)據(jù)集

  4. 算法在真實世界的表現(xiàn)良好镶殷,否則可以考慮更換調整數(shù)據(jù)集或者干脆更換成本函數(shù)

再一次绘趋,由于其非正交化特性陷遮,建議有保留的使用 early stoping 方法帽馋。

設定單一的衡量指標

在實際訓練中绽族,有多個指標可以用來衡量算法的準確程度吧慢,例如:

  • 查準率(precision, P):通過系統(tǒng)識別出來的結果中检诗,正確取得目標值所占的比例。例如貓的識別分類中涕癣,被判定為貓圖片確實是貓的比例

  • 查全率(recall, R):通過系統(tǒng)識別出來的結果中被正確識別的目標數(shù)量與樣本中所包含的目標數(shù)量的比值坠韩。繼續(xù)貓分類器的例子,所有被正確識別為貓的圖片數(shù)量與所有真正是貓的圖片數(shù)量的比值

如果同時選擇這兩個指標作為衡量尺度俭尖,則很可能其中一個分類器在查準率上表現(xiàn)較好焰望,而另一個分類器在查全率上表現(xiàn)較好熊赖,這樣就很難決定該如何選擇俱笛。為了免于陷入這一困境迎膜,一個聰明的做法是采用一個將二者結合起來的參數(shù)來作為衡量指標——機器學習中常用 F1 score 這一參數(shù)镊讼,其數(shù)學表達式為:

F1 = 2 / (1 / P + 1 / R)

類似的均值計算形式被稱為調和平均(harmonic average)蝶棋,在某些情況下也可以采用算數(shù)平均的方式來判斷優(yōu)劣兼贸。

同時溶诞,如果對于算法的衡量指標不只一個,且不能找到類似于 F1 score 這樣的參數(shù)赖歌,最好的辦法就是選擇其中的一個最為重要的指標作為優(yōu)化指標(Optimizing metric),最大限度的優(yōu)化算法在這一指標上的表現(xiàn)返劲,而其他指標則可以作為滿足指標(satisficing metrics)篮绿,只需要算法能夠滿足相應的閾值要求即可孵延。

更進一步的地,在開發(fā)過程中也很可能遇到當前衡量指標表現(xiàn)優(yōu)越的分類器同時帶來其他的意想不到的副作用搔耕,例如貓分類器的結果中混雜了色情圖片隙袁,這個時候就需要及時考慮是否修改衡量指標痰娱,但指標的定義和優(yōu)化依然需要盡量正交化的進行弃榨。

數(shù)據(jù)集的劃分和選擇

這一部分可以參照改善深層神經網絡第一周的內容。

最優(yōu)誤差和可避免偏差

理論上的最優(yōu)誤差稱為 Bayersian optimal error梨睁,但這個值在不過擬合的情況下是不可能達到的鲸睛,只能無限的接近。同時坡贺,在很多機器學習的工作中官辈,我們都把人的表現(xiàn)來近似代替最優(yōu)誤差來衡量系統(tǒng)的準確率,并且可以把系統(tǒng)在訓練集上的表現(xiàn)和人類的表現(xiàn)的差距稱為可避免偏差(avoidable bias)遍坟。

當人的表現(xiàn)非常好的時候拳亿,例如識別誤差 1% ,而系統(tǒng)的誤差在訓練集為 8%愿伴,在驗證集為 10%肺魁,此時我們可以認為系統(tǒng)突出的問題是表現(xiàn)欠擬合,我們應該繼續(xù)朝減少偏差的方向努力隔节,例如采用更大的神經網絡鹅经,或者更長的訓練時間。

而當人的表現(xiàn)也存在很大的誤差時怎诫,如識別誤差達 7.5%瘾晃,而此時若系統(tǒng)的誤差在訓練集為 8%,在驗證集為 10%幻妓,則可以認為系統(tǒng)的可避免偏差已經相對較小蹦误,此時努力的方向應該是減少系統(tǒng)的方差,即采用正則化或更大的訓練數(shù)據(jù)集肉津。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末胖缤,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子阀圾,更是在濱河造成了極大的恐慌哪廓,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,204評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件初烘,死亡現(xiàn)場離奇詭異涡真,居然都是意外死亡分俯,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,091評論 3 395
  • 文/潘曉璐 我一進店門哆料,熙熙樓的掌柜王于貴愁眉苦臉地迎上來缸剪,“玉大人,你說我怎么就攤上這事东亦⌒咏冢” “怎么了?”我有些...
    開封第一講書人閱讀 164,548評論 0 354
  • 文/不壞的土叔 我叫張陵典阵,是天一觀的道長奋渔。 經常有香客問我,道長壮啊,這世上最難降的妖魔是什么嫉鲸? 我笑而不...
    開封第一講書人閱讀 58,657評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮歹啼,結果婚禮上玄渗,老公的妹妹穿的比我還像新娘。我一直安慰自己狸眼,他們只是感情好藤树,可當我...
    茶點故事閱讀 67,689評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著拓萌,像睡著了一般岁钓。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上司志,一...
    開封第一講書人閱讀 51,554評論 1 305
  • 那天甜紫,我揣著相機與錄音,去河邊找鬼骂远。 笑死囚霸,一個胖子當著我的面吹牛,可吹牛的內容都是我干的激才。 我是一名探鬼主播拓型,決...
    沈念sama閱讀 40,302評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼瘸恼!你這毒婦竟也來了劣挫?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 39,216評論 0 276
  • 序言:老撾萬榮一對情侶失蹤东帅,失蹤者是張志新(化名)和其女友劉穎压固,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體靠闭,經...
    沈念sama閱讀 45,661評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡帐我,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,851評論 3 336
  • 正文 我和宋清朗相戀三年坎炼,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片拦键。...
    茶點故事閱讀 39,977評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡谣光,死狀恐怖,靈堂內的尸體忽然破棺而出芬为,到底是詐尸還是另有隱情萄金,我是刑警寧澤,帶...
    沈念sama閱讀 35,697評論 5 347
  • 正文 年R本政府宣布媚朦,位于F島的核電站氧敢,受9級特大地震影響,放射性物質發(fā)生泄漏莲镣。R本人自食惡果不足惜福稳,卻給世界環(huán)境...
    茶點故事閱讀 41,306評論 3 330
  • 文/蒙蒙 一涎拉、第九天 我趴在偏房一處隱蔽的房頂上張望瑞侮。 院中可真熱鬧,春花似錦鼓拧、人聲如沸半火。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,898評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽钮糖。三九已至,卻和暖如春酌住,著一層夾襖步出監(jiān)牢的瞬間店归,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,019評論 1 270
  • 我被黑心中介騙來泰國打工酪我, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 48,138評論 3 370
  • 正文 我出身青樓蜈出,卻偏偏與公主長得像吁伺,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子欺矫,可洞房花燭夜當晚...
    茶點故事閱讀 44,927評論 2 355

推薦閱讀更多精彩內容