IT大佬整理的Python機(jī)器學(xué)習(xí)十大算法案例

1、k-近鄰算法:手寫字符識別

通過算法訓(xùn)練識別字符為0-9的數(shù)字,也可以為A-Z的字符深夯,目前sklearn提供的數(shù)據(jù)集里面為0-9的數(shù)字。數(shù)據(jù)訓(xùn)練前需要用圖像處理軟件將數(shù)字轉(zhuǎn)換成寬高為32X32的黑白圖像诺苹,然后將其變換成1x1024的向量咕晋。

2雹拄、樸素貝葉斯:垃圾郵件過濾

郵箱系統(tǒng)如何分辨一封Email是否屬于垃圾郵件?這應(yīng)該屬于文本挖掘的范疇捡需,通常會采用樸素貝葉斯的方法進(jìn)行判別办桨。它的主要原理是,根據(jù)郵件正文中的單詞站辉,是否經(jīng)常出現(xiàn)在垃圾郵件中呢撞,進(jìn)行判斷。

3饰剥、Logistic回歸:預(yù)測病馬的死亡率

Logistic回歸又稱Logistic回歸分析殊霞,是一種廣義的線性回歸分析模型,常用于數(shù)據(jù)挖掘汰蓉,疾病自動診斷绷蹲,經(jīng)濟(jì)預(yù)測等領(lǐng)域。使用Logistic回歸來預(yù)測患疝氣病的馬的存活問題是一個典型的案例顾孽,項目數(shù)據(jù)集包含了醫(yī)院檢測馬疝病的368個樣本和28個特征祝钢,有的指標(biāo)比較主觀,有的指標(biāo)難以測量若厚。

4拦英、基于協(xié)同過濾:菜肴推薦引擎

構(gòu)建一個推薦系統(tǒng),該系統(tǒng)可以像一個人推薦去哪兒吃飯和菜品推薦测秸,解決人們選擇飯店和不知道點什么菜的問題疤估。這個系統(tǒng)能夠?qū)ふ矣脩魶]有嘗過的菜肴,預(yù)估用戶對該菜品的評分霎冯,然后通過SVD來減少特征空間并提高推薦效果铃拇。

5、基于異常值分析:支付中的交易欺詐偵測

采用支付寶支付時沈撞,或者刷信用卡支付時慷荔,系統(tǒng)會實時判斷這筆刷卡行為是否屬于盜刷。通過判斷刷卡的時間缠俺、地點拧廊、商戶名稱、金額晋修、頻率等要素進(jìn)行判斷。這里面基本的原理就是尋找異常值凰盔。如果您的刷卡被判定為異常墓卦,這筆交易可能會被終止。

異常值的判斷户敬,應(yīng)該是基于一個欺詐規(guī)則庫的落剪≌霰荆可能包含兩類規(guī)則,即事件類規(guī)則和模型類規(guī)則忠怖。第一呢堰,事件類規(guī)則,例如刷卡的時間是否異常(凌晨刷卡)凡泣、刷卡的地點是否異常(非經(jīng)常所在地刷卡)枉疼、刷卡的商戶是否異常(被列入黑名單的套現(xiàn)商戶)、刷卡金額是否異常(是否偏離正常均值的三倍標(biāo)準(zhǔn)差)鞋拟、刷卡頻次是否異常(高頻密集刷卡)骂维。第二,模型類規(guī)則贺纲,則是通過算法判定交易是否屬于欺詐航闺。一般通過支付數(shù)據(jù)、賣家數(shù)據(jù)猴誊、結(jié)算數(shù)據(jù)潦刃,構(gòu)建模型進(jìn)行分類問題的判斷。

6懈叹、決策樹:預(yù)測隱形眼鏡的類型

預(yù)測隱形眼鏡的類型是決策樹分類問題中的一個案例乖杠。隱形眼鏡數(shù)據(jù)集是非常著名的數(shù)據(jù)集,它包含了很多患者眼部狀況的觀察條件以及醫(yī)生推薦的隱形眼鏡類型项阴。隱形眼鏡類型包括硬材質(zhì)滑黔、軟材質(zhì)以及不適合佩戴隱形眼鏡。數(shù)據(jù)中采用的特征有四個:age(年齡)环揽、prescript(癥狀)略荡、astigmatic(是否散光)、tearRate(眼淚數(shù)量)歉胶。

7汛兜、Apriori算法關(guān)聯(lián)分析:發(fā)現(xiàn)毒蘑菇的相似特征

Apriori算法關(guān)聯(lián)分析是從大規(guī)模數(shù)據(jù)集中尋找物品間的隱含關(guān)系。通過分析尋找毒蘑菇的公共特征通今,利用這些特征就能避免遲到有毒的蘑菇粥谬。所提供的數(shù)據(jù)集合重有蘑菇的23種特征的數(shù)據(jù)集,每一個特征是標(biāo)稱數(shù)據(jù)辫塌。而我們需要將樣本轉(zhuǎn)換成特征的集合漏策,枚舉每個特征所有可能的舉止,如果某個樣本包含特征臼氨,那么特征對應(yīng)的整數(shù)應(yīng)該被包含在數(shù)據(jù)集中掺喻,每一個樣本都是這樣的特征集合。如果第一個特征有毒就是2,如果能食用就是1感耙,下一個特征是形狀有6可能值褂乍,用整數(shù)3-8表示,相當(dāng)于把需要的特征維度都進(jìn)行排列離散化即硼。最終只有一個大維特征集逃片。

8、基于社會網(wǎng)絡(luò)分析:電信中的種子客戶

種子客戶和社會網(wǎng)絡(luò)只酥,最早出現(xiàn)在電信領(lǐng)域的研究褥实。即,通過人們的通話記錄层皱,就可以勾勒出人們的關(guān)系網(wǎng)絡(luò)性锭。電信領(lǐng)域的網(wǎng)絡(luò),一般會分析客戶的影響力和客戶流失叫胖、產(chǎn)品擴(kuò)散的關(guān)系草冈。基于通話記錄瓮增,可以構(gòu)建客戶影響力指標(biāo)體系怎棱。采用的指標(biāo),大概包括如下绷跑,一度人脈拳恋、二度人脈、三度人脈砸捏、平均通話頻次谬运、平均通話量等】巡兀基于社會影響力梆暖,分析的結(jié)果表明,高影響力客戶的流失會導(dǎo)致關(guān)聯(lián)客戶的流失掂骏。其次轰驳,在產(chǎn)品的擴(kuò)散上,選擇高影響力客戶作為傳播的起點弟灼,很容易推動新套餐的擴(kuò)散和滲透级解。此外,社會網(wǎng)絡(luò)在銀行(擔(dān)保網(wǎng)絡(luò))田绑、保險(團(tuán)伙欺詐)勤哗、互聯(lián)網(wǎng)(社交互動)中也都有很多的應(yīng)用和案例。

9掩驱、基于文本分析:紅樓夢歸屬

對于紅樓夢的作者芒划,通常認(rèn)為前80回合是曹雪芹所著豁延,后四十回合為高鶚?biāo)鶎憽F鋵嵵饕獑栴}腊状,就是想確定,前80回合和后40回合是否在遣詞造句方面存在顯著差異苔可。有些學(xué)者通過統(tǒng)計名詞缴挖、動詞、形容詞焚辅、副詞映屋、虛詞出現(xiàn)的頻次,以及不同詞性之間的相關(guān)系做判斷同蜻。有些學(xué)者通過虛詞(例如之棚点、其、或湾蔓、亦瘫析、了、的默责、不贬循、把、別桃序、好)杖虾,判斷前后文風(fēng)的差異。有些學(xué)者通過場景(花卉媒熊、樹木奇适、飲食、醫(yī)藥與詩詞)頻次的差異芦鳍,來做統(tǒng)計判斷嚷往。總而言之怜校,主要通過一些指標(biāo)量化间影,然后比較指標(biāo)之間是否存在顯著差異,藉此進(jìn)行寫作風(fēng)格的判斷茄茁。

10魂贬、利用PCA來對數(shù)據(jù)降維

對數(shù)據(jù)進(jìn)行簡化可以使得數(shù)據(jù)集更易使用,使得數(shù)據(jù)更加直接可觀裙顽。一般降維方法有主成分分析付燥、因子分析和獨立成分分析,其中主要是主成分分析愈犹。PCA降維的一個案例是利用PCA對半導(dǎo)體制造數(shù)據(jù)降維键科,對半導(dǎo)體數(shù)據(jù)進(jìn)行預(yù)處理為后續(xù)分析計算做好準(zhǔn)備闻丑。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市勋颖,隨后出現(xiàn)的幾起案子嗦嗡,更是在濱河造成了極大的恐慌,老刑警劉巖饭玲,帶你破解...
    沈念sama閱讀 207,113評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件侥祭,死亡現(xiàn)場離奇詭異,居然都是意外死亡茄厘,警方通過查閱死者的電腦和手機(jī)矮冬,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,644評論 2 381
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來次哈,“玉大人胎署,你說我怎么就攤上這事∫ぶ停” “怎么了琼牧?”我有些...
    開封第一講書人閱讀 153,340評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長葛假。 經(jīng)常有香客問我障陶,道長,這世上最難降的妖魔是什么聊训? 我笑而不...
    開封第一講書人閱讀 55,449評論 1 279
  • 正文 為了忘掉前任抱究,我火速辦了婚禮,結(jié)果婚禮上带斑,老公的妹妹穿的比我還像新娘鼓寺。我一直安慰自己,他們只是感情好勋磕,可當(dāng)我...
    茶點故事閱讀 64,445評論 5 374
  • 文/花漫 我一把揭開白布妈候。 她就那樣靜靜地躺著,像睡著了一般挂滓。 火紅的嫁衣襯著肌膚如雪苦银。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,166評論 1 284
  • 那天赶站,我揣著相機(jī)與錄音幔虏,去河邊找鬼。 笑死贝椿,一個胖子當(dāng)著我的面吹牛想括,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播烙博,決...
    沈念sama閱讀 38,442評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼瑟蜈,長吁一口氣:“原來是場噩夢啊……” “哼烟逊!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起铺根,我...
    開封第一講書人閱讀 37,105評論 0 261
  • 序言:老撾萬榮一對情侶失蹤宪躯,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后位迂,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體眷唉,經(jīng)...
    沈念sama閱讀 43,601評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,066評論 2 325
  • 正文 我和宋清朗相戀三年囤官,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蛤虐。...
    茶點故事閱讀 38,161評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡党饮,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出驳庭,到底是詐尸還是另有隱情刑顺,我是刑警寧澤,帶...
    沈念sama閱讀 33,792評論 4 323
  • 正文 年R本政府宣布饲常,位于F島的核電站蹲堂,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏贝淤。R本人自食惡果不足惜柒竞,卻給世界環(huán)境...
    茶點故事閱讀 39,351評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望播聪。 院中可真熱鬧朽基,春花似錦、人聲如沸离陶。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,352評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽招刨。三九已至霎俩,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間沉眶,已是汗流浹背打却。 一陣腳步聲響...
    開封第一講書人閱讀 31,584評論 1 261
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留沦寂,地道東北人学密。 一個月前我還...
    沈念sama閱讀 45,618評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像传藏,于是被迫代替她去往敵國和親腻暮。 傳聞我的和親對象是個殘疾皇子彤守,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,916評論 2 344

推薦閱讀更多精彩內(nèi)容