機(jī)器學(xué)習(xí)學(xué)習(xí)筆記--隨機(jī)森林算法

1.Hello 隨機(jī)森林

#-*- coding:utf-8 -*-

from sklearn.model_selection import cross_val_score

from sklearn.datasets import make_blobs

from sklearn.ensemble import RandomForestClassifier

from sklearn.ensemble import ExtraTreesClassifier

from sklearn.tree import DecisionTreeClassifier

x,y = make_blobs(n_samples=10000,n_features=10,centers=100,random_state=0)

clf = DecisionTreeClassifier(max_depth=None,min_samples_split=2,random_state=0)

scores = cross_val_score(clf,x,y)

print scores.mean()

#以上是決策樹算法

#以下是隨機(jī)森林算法

clf = RandomForestClassifier(n_estimators=10,max_depth=None,min_samples_split=2,random_state=0)

scores = cross_val_score(clf,x,y)

print scores.mean()


輸出:

0.979408793821

0.999607843137

隨機(jī)森林的判決能力優(yōu)于決策樹


2.對(duì)比隨機(jī)森林和決策樹 檢測(cè)FTP暴力破解

# -*- coding:utf-8 -*-

import re

import matplotlib.pyplot as plt

import os

from sklearn.feature_extraction.text import CountVectorizer

from sklearn import cross_validation

import os

from sklearn.datasets import load_iris

from sklearn import tree

from sklearn.ensemble import RandomForestClassifier

import numpy as np

def load_one_file(filename):

x=[]

with open(filename) as f:

line=f.readline()

line=line.strip('\n')

return line

def load_adfa_training_files(rootdir):

x=[]

y=[]

list = os.listdir(rootdir)

for i in range(0,len(list)):

path = os.path.join(rootdir,list[i])

if os.path.isfile(path):

x.append(load_one_file(path))

y.append(0)

return x,y

def dirlist(path,allfile):

filelist = os.listdir(path)

for filename in filelist:

filepath = os.path.join(path,filename)

if os.path.isdir(filepath):

dirlist(filepath,allfile)

else:

allfile.append(filepath)

return allfile

def load_adfa_hydra_ftp_files(rootdir):

x=[]

y=[]

allfile=dirlist(rootdir,[])

for file in allfile:

if re.match(r"/home/qin/code/python/web-ml/1book-master/data/ADFA-LD/Attack_Data_Master/Hydra_FTP_\d+/UAD-Hydra-FTP*",file):

x.append(load_one_file(file))

y.append(1)

return x,y

if __name__ == "__main__":

x1,y1= load_adfa_training_files("/home/qin/code/python/web-ml/1book-master/data/ADFA-LD/Training_Data_Master/")

x2,y2 = load_adfa_hydra_ftp_files("/home/qin/code/python/web-ml/1book-master/data/ADFA-LD/Attack_Data_Master/")

x=x1+x2

y=y1+y2

vectorizer = CountVectorizer(min_df=1)

x=vectorizer.fit_transform(x)

x=x.toarray()

clf1 = tree.DecisionTreeClassifier()

score=cross_validation.cross_val_score(clf1,x,y,n_jobs=-1,cv=10)

print np.mean(score)

clf2 = RandomForestClassifier(n_estimators=10,max_depth=None,min_samples_split=2,random_state=0)

score=cross_validation.cross_val_score(clf2,x,y,n_jobs=-1,cv=10)

print np.mean(score)


輸出:

0.962736573657

0.986898789879

隨機(jī)森林好于決策樹

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌枢冤,老刑警劉巖烹看,帶你破解...
    沈念sama閱讀 217,406評(píng)論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件仗颈,死亡現(xiàn)場(chǎng)離奇詭異型酥,居然都是意外死亡躬柬,警方通過(guò)查閱死者的電腦和手機(jī)昧旨,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,732評(píng)論 3 393
  • 文/潘曉璐 我一進(jìn)店門拾给,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)祥得,“玉大人,你說(shuō)我怎么就攤上這事蒋得〖都埃” “怎么了?”我有些...
    開封第一講書人閱讀 163,711評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵额衙,是天一觀的道長(zhǎng)饮焦。 經(jīng)常有香客問(wèn)我,道長(zhǎng)窍侧,這世上最難降的妖魔是什么县踢? 我笑而不...
    開封第一講書人閱讀 58,380評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮伟件,結(jié)果婚禮上硼啤,老公的妹妹穿的比我還像新娘。我一直安慰自己斧账,他們只是感情好丙曙,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,432評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著其骄,像睡著了一般。 火紅的嫁衣襯著肌膚如雪扯旷。 梳的紋絲不亂的頭發(fā)上拯爽,一...
    開封第一講書人閱讀 51,301評(píng)論 1 301
  • 那天,我揣著相機(jī)與錄音钧忽,去河邊找鬼毯炮。 笑死,一個(gè)胖子當(dāng)著我的面吹牛耸黑,可吹牛的內(nèi)容都是我干的桃煎。 我是一名探鬼主播,決...
    沈念sama閱讀 40,145評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼大刊,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼为迈!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起缺菌,我...
    開封第一講書人閱讀 39,008評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤葫辐,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后伴郁,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體耿战,經(jīng)...
    沈念sama閱讀 45,443評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,649評(píng)論 3 334
  • 正文 我和宋清朗相戀三年焊傅,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了剂陡。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片狈涮。...
    茶點(diǎn)故事閱讀 39,795評(píng)論 1 347
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖鸭栖,靈堂內(nèi)的尸體忽然破棺而出歌馍,到底是詐尸還是另有隱情,我是刑警寧澤纤泵,帶...
    沈念sama閱讀 35,501評(píng)論 5 345
  • 正文 年R本政府宣布骆姐,位于F島的核電站,受9級(jí)特大地震影響捏题,放射性物質(zhì)發(fā)生泄漏玻褪。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,119評(píng)論 3 328
  • 文/蒙蒙 一公荧、第九天 我趴在偏房一處隱蔽的房頂上張望带射。 院中可真熱鬧,春花似錦循狰、人聲如沸窟社。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,731評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)灿里。三九已至,卻和暖如春程腹,著一層夾襖步出監(jiān)牢的瞬間匣吊,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,865評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工寸潦, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留色鸳,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,899評(píng)論 2 370
  • 正文 我出身青樓见转,卻偏偏與公主長(zhǎng)得像命雀,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子斩箫,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,724評(píng)論 2 354