本筆記為參加阿里云“天池龍珠計(jì)劃 機(jī)器學(xué)習(xí)訓(xùn)練營(yíng)”所做的學(xué)習(xí)記錄拍鲤,代碼及知識(shí)內(nèi)容均來源于訓(xùn)練營(yíng),本人稍作擴(kuò)充冗懦。
具體活動(dòng)內(nèi)容請(qǐng)移步阿里云天池龍珠計(jì)劃; 同時(shí)感謝公眾號(hào)“機(jī)器學(xué)習(xí)煉丹術(shù)”的介紹、推廣和組織。
1 邏輯回歸的介紹和應(yīng)用
1.1 邏輯回歸的介紹
邏輯回歸(Logistic regression爬骤,簡(jiǎn)稱LR)雖然其中帶有"回歸"兩個(gè)字,但邏輯回歸其實(shí)是一個(gè)分類模型莫换,并且廣泛應(yīng)用于各個(gè)領(lǐng)域之中霞玄。雖然現(xiàn)在深度學(xué)習(xí)相對(duì)于這些傳統(tǒng)方法更為火熱骤铃,但實(shí)則這些傳統(tǒng)方法由于其獨(dú)特的優(yōu)勢(shì)依然廣泛應(yīng)用于各個(gè)領(lǐng)域中。
而對(duì)于邏輯回歸而且坷剧,最為突出的兩點(diǎn)就是其模型簡(jiǎn)單和模型的可解釋性強(qiáng)惰爬。
邏輯回歸模型的優(yōu)劣勢(shì):
- 優(yōu)點(diǎn):實(shí)現(xiàn)簡(jiǎn)單,易于理解和實(shí)現(xiàn)惫企;計(jì)算代價(jià)不高撕瞧,速度很快,存儲(chǔ)資源低狞尔;
- 缺點(diǎn):容易欠擬合丛版,分類精度可能不高
1.1 邏輯回歸的應(yīng)用
邏輯回歸模型廣泛用于各個(gè)領(lǐng)域,包括機(jī)器學(xué)習(xí)偏序,大多數(shù)醫(yī)學(xué)領(lǐng)域和社會(huì)科學(xué)页畦。例如,最初由Boyd 等人開發(fā)的創(chuàng)傷和損傷嚴(yán)重度評(píng)分(TRISS)被廣泛用于預(yù)測(cè)受傷患者的死亡率研儒,使用邏輯回歸 基于觀察到的患者特征(年齡豫缨,性別,體重指數(shù),各種血液檢查的結(jié)果等)分析預(yù)測(cè)發(fā)生特定疾捕硕洹(例如糖尿病好芭,冠心病)的風(fēng)險(xiǎn)逸月。邏輯回歸模型也用于預(yù)測(cè)在給定的過程中栓撞,系統(tǒng)或產(chǎn)品的故障的可能性。還用于市場(chǎng)營(yíng)銷應(yīng)用程序碗硬,例如預(yù)測(cè)客戶購(gòu)買產(chǎn)品或中止訂購(gòu)的傾向等瓤湘。在經(jīng)濟(jì)學(xué)中它可以用來預(yù)測(cè)一個(gè)人選擇進(jìn)入勞動(dòng)力市場(chǎng)的可能性,而商業(yè)應(yīng)用則可以用來預(yù)測(cè)房主拖欠抵押貸款的可能性恩尾。條件隨機(jī)字段是邏輯回歸到順序數(shù)據(jù)的擴(kuò)展弛说,用于自然語(yǔ)言處理。
邏輯回歸模型現(xiàn)在同樣是很多分類算法的基礎(chǔ)組件,比如 分類任務(wù)中基于GBDT算法+LR邏輯回歸實(shí)現(xiàn)的信用卡交易反欺詐翰意,CTR(點(diǎn)擊通過率)預(yù)估等木人,其好處在于輸出值自然地落在0到1之間,并且有概率意義冀偶。模型清晰醒第,有對(duì)應(yīng)的概率學(xué)理論基礎(chǔ)。它擬合出來的參數(shù)就代表了每一個(gè)特征(feature)對(duì)結(jié)果的影響进鸠。也是一個(gè)理解數(shù)據(jù)的好工具稠曼。但同時(shí)由于其本質(zhì)上是一個(gè)線性的分類器,所以不能應(yīng)對(duì)較為復(fù)雜的數(shù)據(jù)情況客年。很多時(shí)候我們也會(huì)拿邏輯回歸模型去做一些任務(wù)嘗試的基線(基礎(chǔ)水平)霞幅。
說了這些邏輯回歸的概念和應(yīng)用漠吻,大家應(yīng)該已經(jīng)對(duì)其有所期待了吧,那么我們現(xiàn)在開始吧K究摇M灸恕!
2 學(xué)習(xí)目標(biāo)
- 了解 邏輯回歸 的理論
- 掌握 邏輯回歸 的 sklearn 函數(shù)調(diào)用使用并將其運(yùn)用到鳶尾花數(shù)據(jù)集預(yù)測(cè)
3 代碼流程
Part1 Demo實(shí)踐
- Step1:庫(kù)函數(shù)導(dǎo)入
- Step2:模型訓(xùn)練
- Step3:模型參數(shù)查看
- Step4:數(shù)據(jù)和模型可視化
- Step5:模型預(yù)測(cè)
Part2 基于鳶尾花(iris)數(shù)據(jù)集的邏輯回歸分類實(shí)踐
- Step1:庫(kù)函數(shù)導(dǎo)入
- Step2:數(shù)據(jù)讀取/載入
- Step3:數(shù)據(jù)信息簡(jiǎn)單查看
- Step4:可視化描述
- Step5:利用 邏輯回歸模型 在二分類上 進(jìn)行訓(xùn)練和預(yù)測(cè)
- Step5:利用 邏輯回歸模型 在三分類(多分類)上 進(jìn)行訓(xùn)練和預(yù)測(cè)