大師兄的數(shù)據(jù)分析學(xué)習(xí)筆記(三十):半監(jiān)督學(xué)習(xí)

大師兄的數(shù)據(jù)分析學(xué)習(xí)筆記(二十九):關(guān)聯(lián)
大師兄的數(shù)據(jù)分析學(xué)習(xí)筆記(三十一):機(jī)器學(xué)習(xí)模型總結(jié)

一舱沧、 關(guān)于半監(jiān)督學(xué)習(xí)

  • 半監(jiān)督學(xué)習(xí)指的是數(shù)據(jù)中部分有標(biāo)注稚字、部分無標(biāo)注,且通常無標(biāo)注的部分遠(yuǎn)大于有標(biāo)注的部分驾诈,主要由以下原因產(chǎn)生:
  • 從數(shù)據(jù)中獲取標(biāo)注的成本較大帮孔,且有些樣本的標(biāo)注不能通過自動化方式獲取祭务。
  • 無標(biāo)注樣本可能很容易獲得中狂。
  • 半監(jiān)督學(xué)習(xí)的目標(biāo),就是嘗試用數(shù)據(jù)中有標(biāo)注的部分,為無標(biāo)注的部分打上標(biāo)注有送。
  • 半監(jiān)督學(xué)習(xí)的主要算法思路包括生成思路判別思路淌喻。

二、標(biāo)簽傳播算法

  • 標(biāo)簽傳播算法是典型的半監(jiān)督學(xué)習(xí)算法雀摘,它的思路如下:
  1. 將沒有標(biāo)注的樣本裸删,和周圍有標(biāo)注的樣本進(jìn)行比較;
  2. 如果相似度高,就標(biāo)注為臨近的標(biāo)注阵赠。
  3. 迭代以上的過程涯塔,優(yōu)先標(biāo)注離有標(biāo)注樣本比較近的無標(biāo)注樣本,然后將新被標(biāo)過的樣本考慮進(jìn)來清蚀。
  • 標(biāo)簽傳播算法的相似度有兩種判別方法:

1.rbf:rbf(exp(-\gamma|x-y|^2),\gamma>0)匕荸,其中x-y代表數(shù)據(jù)之間的距離,距離越遠(yuǎn)枷邪,算法約接近0榛搔。
2.knn:1[x'\in kNN(x)],在一個無標(biāo)注數(shù)據(jù)周圍找k個有標(biāo)注數(shù)據(jù)东揣,哪種標(biāo)注多就用哪個賦值践惑。

三、代碼實(shí)現(xiàn)

>>>import numpy as np
>>>from sklearn import datasets
>>>from sklearn.semi_supervised import LabelPropagation
>>>from sklearn.metrics import accuracy_score,recall_score,f1_score

>>>iris = datasets.load_iris()
>>>target = iris.target
>>>labels = np.copy(target)
>>>unlabeld_points = np.random.rand(len(target))<0.1
>>>prime_labels = labels[unlabeld_points]
>>>labels[unlabeld_points] = -1
>>>print(f"unlabeled number:{list(labels).count(-1)}")

>>>label_prop_model = LabelPropagation()
>>>label_prop_model.fit(iris.data,labels)
>>>Y_pred = label_prop_model.predict(iris.data)
>>>Y_pred = Y_pred[unlabeld_points]

>>>print(f"ACC:{accuracy_score(prime_labels,Y_pred)}")
>>>print(f"REC:{recall_score(prime_labels,Y_pred,average='micro')}")
>>>print(f"F-Score:{f1_score(prime_labels,Y_pred,average='micro')}")
unlabeled number:13
ACC:0.8461538461538461
REC:0.8461538461538461
F-Score:0.8461538461538461

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末嘶卧,一起剝皮案震驚了整個濱河市尔觉,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌芥吟,老刑警劉巖侦铜,帶你破解...
    沈念sama閱讀 218,284評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異运沦,居然都是意外死亡泵额,警方通過查閱死者的電腦和手機(jī)配深,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,115評論 3 395
  • 文/潘曉璐 我一進(jìn)店門携添,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人篓叶,你說我怎么就攤上這事烈掠。” “怎么了缸托?”我有些...
    開封第一講書人閱讀 164,614評論 0 354
  • 文/不壞的土叔 我叫張陵左敌,是天一觀的道長。 經(jīng)常有香客問我俐镐,道長矫限,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,671評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮叼风,結(jié)果婚禮上取董,老公的妹妹穿的比我還像新娘。我一直安慰自己无宿,他們只是感情好茵汰,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,699評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著孽鸡,像睡著了一般蹂午。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上彬碱,一...
    開封第一講書人閱讀 51,562評論 1 305
  • 那天豆胸,我揣著相機(jī)與錄音,去河邊找鬼堡妒。 笑死配乱,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的皮迟。 我是一名探鬼主播搬泥,決...
    沈念sama閱讀 40,309評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼伏尼!你這毒婦竟也來了忿檩?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,223評論 0 276
  • 序言:老撾萬榮一對情侶失蹤爆阶,失蹤者是張志新(化名)和其女友劉穎燥透,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體辨图,經(jīng)...
    沈念sama閱讀 45,668評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡班套,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,859評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了故河。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片吱韭。...
    茶點(diǎn)故事閱讀 39,981評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖鱼的,靈堂內(nèi)的尸體忽然破棺而出理盆,到底是詐尸還是另有隱情,我是刑警寧澤凑阶,帶...
    沈念sama閱讀 35,705評論 5 347
  • 正文 年R本政府宣布猿规,位于F島的核電站,受9級特大地震影響宙橱,放射性物質(zhì)發(fā)生泄漏姨俩。R本人自食惡果不足惜蘸拔,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,310評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望环葵。 院中可真熱鬧都伪,春花似錦、人聲如沸积担。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,904評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽帝璧。三九已至先誉,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間的烁,已是汗流浹背褐耳。 一陣腳步聲響...
    開封第一講書人閱讀 33,023評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留渴庆,地道東北人铃芦。 一個月前我還...
    沈念sama閱讀 48,146評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像襟雷,于是被迫代替她去往敵國和親刃滓。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,933評論 2 355

推薦閱讀更多精彩內(nèi)容