邏輯回歸理論推導(dǎo)及如何應(yīng)用于多分類

logistic回歸又稱logistic回歸分析,是一種廣義的線性回歸分析模型尘喝,常用于數(shù)據(jù)挖掘,疾病自動(dòng)診斷斋陪,經(jīng)濟(jì)預(yù)測(cè)等領(lǐng)域朽褪。

自變量既可以是連續(xù)的,也可以是分類的无虚。

1.理論推導(dǎo)

2.怎么使用邏輯回歸進(jìn)行多分類:

我們已經(jīng)知道缔赠,普通的logistic回歸只能針對(duì)二分類(Binary Classification)問題,要想實(shí)現(xiàn)多個(gè)類別的分類骑科,我們必須要改進(jìn)logistic回歸,讓其適應(yīng)多分類問題构拳。

關(guān)于這種改進(jìn)咆爽,有兩種方式可以做到。

(1)第一種方式是直接根據(jù)每個(gè)類別置森,都建立一個(gè)二分類器斗埂,帶有這個(gè)類別的樣本標(biāo)記為1,帶有其他類別的樣本標(biāo)記為0凫海。假如我們有k個(gè)類別呛凶,最后我們就得到了k個(gè)針對(duì)不同標(biāo)記的普通的logistic二分類器。(本質(zhì)上就是ovr的做法)
(2)第二種方式是修改logistic回歸的損失函數(shù)行贪,讓其適應(yīng)多分類問題漾稀。這個(gè)損失函數(shù)不再籠統(tǒng)地只考慮二分類非1就0的損失,而是具體考慮每個(gè)樣本標(biāo)記的損失建瘫。這種方法叫做softmax回歸崭捍,即logistic回歸的多分類版本。

ovr

對(duì)于二分類問題啰脚,我們只需要一個(gè)分類器即可殷蛇,但是對(duì)于多分類問題,我們需要多個(gè)分類器

橄浓,其中hc 表示一個(gè)二分類模型粒梦,其判斷樣本 x屬于第c 類的概率值。

對(duì)于 hc 的訓(xùn)練荸实,我們挑選出帶有標(biāo)記為 c的樣本標(biāo)記為1匀们,將剩下的不帶標(biāo)記 c

的樣本標(biāo)記為0。針對(duì)每個(gè)分類器准给,都按上述步驟構(gòu)造訓(xùn)練集進(jìn)行訓(xùn)練昼蛀。

針對(duì)每一個(gè)測(cè)試樣本宴猾,我們需要找到這k個(gè)分類函數(shù)輸出值最大的那一個(gè),即為測(cè)試樣本的標(biāo)記

softmax

該模型將邏輯回歸推廣到分類問題叼旋,其中類標(biāo)簽y可以采用兩個(gè)以上的可能值仇哆。這對(duì)于諸如MNIST數(shù)字分類之類的問題將是有用的,其中目標(biāo)是區(qū)分10個(gè)不同的數(shù)字夫植。Softmax回歸是一種監(jiān)督學(xué)習(xí)算法讹剔,但我們稍后會(huì)將其與我們的深度學(xué)習(xí)/無監(jiān)督特征學(xué)習(xí)方法結(jié)合使用。

在softmax回歸設(shè)置中详民,我們對(duì)多類分類感興趣(而不是僅對(duì)二元分類)延欠,所以y可以取k個(gè)不同的取值。因此沈跨,在我們的訓(xùn)練集

由捎,其中

給定測(cè)試輸入x,我們希望我們的模型估計(jì)每個(gè)類別的概率饿凛。因此狞玛,我們的模型將輸出k維向量(其元素總和為1),給出我們的k個(gè)類別的估計(jì)概率涧窒。具體地說心肪,我們的假設(shè)h_\theta(x)采用以下形式:

其中,

是模型的參數(shù)纠吴,而

是歸一化項(xiàng)硬鞍。

為方便起見,我們還會(huì)向量法來表示模型的所有參數(shù)戴已。當(dāng)你實(shí)現(xiàn)softmax回歸時(shí)固该,將θ表示為通過堆疊 [圖片上傳失敗...(image-3da094-1584342852734)]

成行獲得的k-by(n + 1)矩陣通常很方便,這樣

損失函數(shù)

求導(dǎo)后糖儡,可得

更新參數(shù)

ovr vs. softmax

假設(shè)您正在處理音樂分類應(yīng)用程序蹬音,并且您正在嘗試識(shí)別k種類型的音樂。您應(yīng)該使用softmax分類器休玩,還是應(yīng)該使用邏輯回歸構(gòu)建k個(gè)單獨(dú)的二元分類器著淆?這取決于這四個(gè)類是否相互排斥。例如拴疤,如果您的四個(gè)類是經(jīng)典永部,鄉(xiāng)村,搖滾和爵士樂呐矾,那么假設(shè)您的每個(gè)訓(xùn)練樣例都標(biāo)有這四個(gè)類別標(biāo)簽中的一個(gè)苔埋,那么您應(yīng)該構(gòu)建一個(gè)k = 4的softmax分類器。(如果有'還有一些不屬于上述四個(gè)類的例子蜒犯,那么你可以在softmax回歸中設(shè)置k = 5组橄,并且還有第五個(gè)荞膘,“以上都不是”類。)但是玉工,如果你的類別是has_vocals羽资,舞蹈,配樂遵班,流行音樂屠升,那么這些課程并不相互排斥;例如,可以有一段來自音軌的流行音樂狭郑,另外還有人聲腹暖。在這種情況下,構(gòu)建4個(gè)二元邏輯回歸分類器更合適翰萨。這樣脏答,對(duì)于每個(gè)新的音樂作品,您的算法可以單獨(dú)決定它是否屬于四個(gè)類別中的每一個(gè)∧豆恚現(xiàn)在殖告,考慮一個(gè)計(jì)算機(jī)視覺示例,您嘗試將圖像分為三個(gè)不同的類辛孵。(i)假設(shè)您的課程是indoor_scene丛肮,outdoor_urban_scene和outdoor_wilderness_scene赡磅。你會(huì)使用sofmax回歸還是三個(gè)邏輯回歸分類器魄缚?(ii)現(xiàn)在假設(shè)你的課程是indoor_scene,black_and_white_image和image_has_people焚廊。您會(huì)使用softmax回歸或多重邏輯回歸分類器嗎冶匹?在第一種情況下,類是互斥的咆瘟,因此softmax回歸分類器是合適的嚼隘。在第二種情況下,構(gòu)建三個(gè)單獨(dú)的邏輯回歸分類器更為合適袒餐。

總結(jié)就是飞蛹,如果類別之間是互斥的,那么用softmax會(huì)比較合適灸眼,如果類別之間不是互斥的卧檐,用ovr比較合適。

注:源自:邏輯回歸(百度百科)
多分類部分來源于:https://zhuanlan.zhihu.com/p/45230536
Softmax函數(shù)詳解與推導(dǎo)
原理推導(dǎo)參考:周志華的《機(jī)器學(xué)習(xí)》

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末焰宣,一起剝皮案震驚了整個(gè)濱河市霉囚,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌匕积,老刑警劉巖盈罐,帶你破解...
    沈念sama閱讀 221,430評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件榜跌,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡盅粪,警方通過查閱死者的電腦和手機(jī)钓葫,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,406評(píng)論 3 398
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來湾揽,“玉大人瓤逼,你說我怎么就攤上這事】馕铮” “怎么了霸旗?”我有些...
    開封第一講書人閱讀 167,834評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)戚揭。 經(jīng)常有香客問我诱告,道長(zhǎng),這世上最難降的妖魔是什么民晒? 我笑而不...
    開封第一講書人閱讀 59,543評(píng)論 1 296
  • 正文 為了忘掉前任精居,我火速辦了婚禮,結(jié)果婚禮上潜必,老公的妹妹穿的比我還像新娘靴姿。我一直安慰自己,他們只是感情好磁滚,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,547評(píng)論 6 397
  • 文/花漫 我一把揭開白布佛吓。 她就那樣靜靜地躺著,像睡著了一般垂攘。 火紅的嫁衣襯著肌膚如雪维雇。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,196評(píng)論 1 308
  • 那天晒他,我揣著相機(jī)與錄音吱型,去河邊找鬼。 笑死陨仅,一個(gè)胖子當(dāng)著我的面吹牛津滞,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播灼伤,決...
    沈念sama閱讀 40,776評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼触徐,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了饺蔑?” 一聲冷哼從身側(cè)響起锌介,我...
    開封第一講書人閱讀 39,671評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后孔祸,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體隆敢,經(jīng)...
    沈念sama閱讀 46,221評(píng)論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,303評(píng)論 3 340
  • 正文 我和宋清朗相戀三年崔慧,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了拂蝎。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,444評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡惶室,死狀恐怖温自,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情皇钞,我是刑警寧澤悼泌,帶...
    沈念sama閱讀 36,134評(píng)論 5 350
  • 正文 年R本政府宣布,位于F島的核電站夹界,受9級(jí)特大地震影響馆里,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜可柿,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,810評(píng)論 3 333
  • 文/蒙蒙 一鸠踪、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧复斥,春花似錦营密、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,285評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至侣集,卻和暖如春键俱,著一層夾襖步出監(jiān)牢的瞬間兰绣,已是汗流浹背世分。 一陣腳步聲響...
    開封第一講書人閱讀 33,399評(píng)論 1 272
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留缀辩,地道東北人臭埋。 一個(gè)月前我還...
    沈念sama閱讀 48,837評(píng)論 3 376
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像臀玄,于是被迫代替她去往敵國(guó)和親瓢阴。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,455評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容