《零基礎學機器學習》
作者:黃佳
出版社:人民郵電出版社
出版日期:2020年12月
1.1 機器學習的家族圖譜
主要包括機器學習快速上手路徑鱼响、數(shù)學和Python 基礎知識尊勿、機器學習基礎算法(線性回歸和邏輯回歸)、深度神經(jīng)網(wǎng)絡、卷積神經(jīng)網(wǎng)絡、循環(huán)神經(jīng)網(wǎng)絡蝙叛、經(jīng)典算法、集成學習、無監(jiān)督和半監(jiān)督等非監(jiān)督學習類型指么、強化學習實戰(zhàn)等內(nèi)容酝惧,以及相關實戰(zhàn)案例。
所有案例均通過Python及Scikit-learn 機器學習庫和Keras 深度學習框架實現(xiàn)伯诬,同時還包含豐富的數(shù)據(jù)分析和數(shù)據(jù)可視化內(nèi)容晚唇。
1.2 快捷的云實戰(zhàn)模式
加州房價數(shù)據(jù)分析:
import pandas as pd #導入Pandas,用于數(shù)據(jù)讀取和處理
# 讀入房價數(shù)據(jù)盗似,示例代碼中的文件地址為internet鏈接哩陕,讀者也可以下載該文件到本機進行讀取
# 如,當數(shù)據(jù)集和代碼文件位于相同本地目錄,路徑名應為"./house.csv"悍及,或直接放"house.csv"亦可
df_housing = pd.read_csv("https://raw.githubusercontent.com/huangjia2019/house/master/house.csv")
df_housing.head #顯示加州房價數(shù)據(jù)
X = df_housing.drop("median_house_value",axis = 1) #構建特征集X
y = df_housing.median_house_value #構建標簽集y
from sklearn.model_selection import train_test_split #導入數(shù)據(jù)集拆分工具
X_train, X_test, y_train, y_test = train_test_split(X, y,
test_size=0.2, random_state=0) #以80%/20%的比例進行數(shù)據(jù)集的拆分
from sklearn.linear_model import LinearRegression #導入線性回歸算法模型
model = LinearRegression() #使用線性回歸算法
model.fit(X_train, y_train) #用訓練集數(shù)據(jù)葵礼,訓練機器,擬合函數(shù)并鸵,確定參數(shù)
y_pred = model.predict(X_test) #預測測試集的Y值
print ('房價的真值(測試集)',y_test)
print ('預測的房價(測試集)',y_pred)
print("給預測評分:", model.score(X_test, y_test)) #評估預測結果
import matplotlib.pyplot as plt #導入matplotlib畫圖庫
#用散點圖顯示家庭收入中位數(shù)和房價中位數(shù)的分布
plt.scatter(X_test.median_income, y_test, color='brown')
#畫出回歸函數(shù)(從特征到預測標簽)
plt.plot(X_test.median_income, y_pred, color='green', linewidth=1)
plt.xlabel('家庭收入中位數(shù)') #X軸-家庭收入中位數(shù)
plt.ylabel('房價中位數(shù)') #Y軸-房價中位數(shù)
plt.show() #顯示房價分布和機器習得的函數(shù)圖形
1.3 基本機器學習術語
1.4 Python和機器學習框架
1.5 機器學習項目實戰(zhàn)架構
image.png