通過簡單示例來理解什么是機(jī)器學(xué)習(xí)

1 什么是機(jī)器學(xué)習(xí)

什么是機(jī)器學(xué)習(xí)?

這個問題不同的人員會有不同的理解管呵。我個人覺得袭蝗,用大白話來描述機(jī)器學(xué)習(xí)唤殴,就是讓計(jì)算機(jī)能夠通過一定方式的學(xué)習(xí)和訓(xùn)練,選擇合適的模型到腥,在遇到新輸入的數(shù)據(jù)時(shí)朵逝,可以找出有用的信息,并預(yù)測潛在的需求乡范。最終反映的結(jié)果就是配名,好像計(jì)算機(jī)或者其他設(shè)備跟人類一樣具有智能化的特征啤咽,能夠快速識別和選擇有用的信息。

機(jī)器學(xué)習(xí)通城觯可以分為三個大的步驟宇整,即 輸入、整合芋膘、輸出没陡,可以用下圖來表示大致的意思:

sklearn01.jpg

2 機(jī)器學(xué)習(xí)示例(scikit-learn)

在python語言中,scikit-learn是一個開源的機(jī)器學(xué)習(xí)庫索赏。下面以sklearn為例,來簡單描述機(jī)器學(xué)習(xí)的過程贴彼。

2.1 加載數(shù)據(jù)

通常第一步是獲取相關(guān)數(shù)據(jù)潜腻,并進(jìn)行相應(yīng)的處理,使之可以在后續(xù)過程中使用器仗。

from sklearn import datasets
  • 加載iris數(shù)據(jù)集并查看相關(guān)信息
# 加載數(shù)據(jù)集
iris = datasets.load_iris()

# print(iris)
print(type(iris))
print(iris.keys())

# 查看部分?jǐn)?shù)據(jù)
print(iris.data[ :5, :])
# print(iris.data)
<class 'sklearn.datasets.base.Bunch'>
dict_keys(['DESCR', 'data', 'feature_names', 'target', 'target_names'])
[[ 5.1  3.5  1.4  0.2]
 [ 4.9  3.   1.4  0.2]
 [ 4.7  3.2  1.3  0.2]
 [ 4.6  3.1  1.5  0.2]
 [ 5.   3.6  1.4  0.2]]
# 查看數(shù)據(jù)維度大小
print(iris.data.shape)

# 數(shù)據(jù)屬性
print(iris.feature_names)

# 特征名稱
print(iris.target_names)

# 標(biāo)簽
print(iris.target)
(150, 4)
['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']
['setosa' 'versicolor' 'virginica']
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2
 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
 2 2]

2.2 選擇機(jī)器學(xué)習(xí)模型or算法

在獲取數(shù)據(jù)融涣,并將數(shù)據(jù)整理好后,需要選擇合適的模型or算法來進(jìn)行訓(xùn)練精钮。
機(jī)器學(xué)習(xí)的模型有很多種威鹿,這里不作討論,且每種模型的參數(shù)選擇也是很大的一門學(xué)問轨香。

from sklearn import svm

svm_classifier = svm.SVC(gamma=0.1, C=100)

# 預(yù)測結(jié)果得分很低
# svm_classifier = svm.SVC(gamma=10000, C=0.001)

# 定義測試集的數(shù)據(jù)量大小
N = 10

# 訓(xùn)練集
train_x = iris.data[:-N, :]
train_y = iris.target[ :-N]

# 測試集
test_x = iris.data[ :N, :]
y_true = iris.target[:N]

# 訓(xùn)練數(shù)據(jù)模型
svm_classifier.fit(train_x, train_y)

SVC(C=100, cache_size=200, class_weight=None, coef0=0.0,
  decision_function_shape=None, degree=3, gamma=0.1, kernel='rbf',
  max_iter=-1, probability=False, random_state=None, shrinking=True,
  tol=0.001, verbose=False)
  • 將訓(xùn)練好的模式進(jìn)行測試
y_pred = svm_classifier.predict(test_x)
  • 查看測試結(jié)果
from sklearn.metrics import accuracy_score

print(accuracy_score(y_true, y_pred))
1.0

2.3 將訓(xùn)練好的模型進(jìn)行應(yīng)用忽你,即預(yù)測

  • 保存模型
import pickle

with open('svm_model_iris.pkl', 'wb') as f:
    pickle.dump(svm_classifier, f)
  • 加載模型進(jìn)行應(yīng)用
import numpy as np
# np.random.seed(9)

with open('svm_model_iris.pkl', 'rb') as f:
    model = pickle.load(f)

random_samples_index = np.random.randint(0,150,6)
random_samples = iris.data[random_samples_index, :]
random_targets = iris.target[random_samples_index]

random_predict = model.predict(random_samples)

print('真實(shí)值:', random_targets)
print('預(yù)測值:', random_predict)
真實(shí)值: [1 1 1 0 2 2]
預(yù)測值: [1 1 1 0 2 2]

閑談

預(yù)測的結(jié)果好不好,直接體現(xiàn)出機(jī)器學(xué)習(xí)模型選擇的優(yōu)劣臂容。對于機(jī)器學(xué)習(xí)這門高深的學(xué)問科雳,我還有許多需要進(jìn)一步學(xué)習(xí)的地方,歡迎一起交流脓杉,共同進(jìn)步糟秘。

最后分享網(wǎng)上的一張圖,來看看如何理解Machine Learning球散。

machine learning.jpg

如果您喜歡我的文章尿赚,歡迎關(guān)注微信公眾號:Python數(shù)據(jù)之道(ID:PyDataRoad)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市蕉堰,隨后出現(xiàn)的幾起案子凌净,更是在濱河造成了極大的恐慌,老刑警劉巖嘁灯,帶你破解...
    沈念sama閱讀 212,718評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件泻蚊,死亡現(xiàn)場離奇詭異,居然都是意外死亡丑婿,警方通過查閱死者的電腦和手機(jī)性雄,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,683評論 3 385
  • 文/潘曉璐 我一進(jìn)店門没卸,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人秒旋,你說我怎么就攤上這事约计。” “怎么了迁筛?”我有些...
    開封第一講書人閱讀 158,207評論 0 348
  • 文/不壞的土叔 我叫張陵煤蚌,是天一觀的道長。 經(jīng)常有香客問我细卧,道長尉桩,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,755評論 1 284
  • 正文 為了忘掉前任贪庙,我火速辦了婚禮蜘犁,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘止邮。我一直安慰自己这橙,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,862評論 6 386
  • 文/花漫 我一把揭開白布导披。 她就那樣靜靜地躺著屈扎,像睡著了一般。 火紅的嫁衣襯著肌膚如雪撩匕。 梳的紋絲不亂的頭發(fā)上鹰晨,一...
    開封第一講書人閱讀 50,050評論 1 291
  • 那天,我揣著相機(jī)與錄音止毕,去河邊找鬼并村。 笑死,一個胖子當(dāng)著我的面吹牛滓技,可吹牛的內(nèi)容都是我干的哩牍。 我是一名探鬼主播,決...
    沈念sama閱讀 39,136評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼令漂,長吁一口氣:“原來是場噩夢啊……” “哼膝昆!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起叠必,我...
    開封第一講書人閱讀 37,882評論 0 268
  • 序言:老撾萬榮一對情侶失蹤荚孵,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后纬朝,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體收叶,經(jīng)...
    沈念sama閱讀 44,330評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,651評論 2 327
  • 正文 我和宋清朗相戀三年共苛,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了判没。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蜓萄。...
    茶點(diǎn)故事閱讀 38,789評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖澄峰,靈堂內(nèi)的尸體忽然破棺而出嫉沽,到底是詐尸還是另有隱情,我是刑警寧澤俏竞,帶...
    沈念sama閱讀 34,477評論 4 333
  • 正文 年R本政府宣布绸硕,位于F島的核電站,受9級特大地震影響魂毁,放射性物質(zhì)發(fā)生泄漏玻佩。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,135評論 3 317
  • 文/蒙蒙 一席楚、第九天 我趴在偏房一處隱蔽的房頂上張望夺蛇。 院中可真熱鬧,春花似錦酣胀、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,864評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至丸升,卻和暖如春铆农,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背狡耻。 一陣腳步聲響...
    開封第一講書人閱讀 32,099評論 1 267
  • 我被黑心中介騙來泰國打工墩剖, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人夷狰。 一個月前我還...
    沈念sama閱讀 46,598評論 2 362
  • 正文 我出身青樓岭皂,卻偏偏與公主長得像,于是被迫代替她去往敵國和親沼头。 傳聞我的和親對象是個殘疾皇子爷绘,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,697評論 2 351

推薦閱讀更多精彩內(nèi)容