2017-12-30

project checklist

frame the problem

select a performance measure

RMSE:均方誤差根
MAE: 平均絕對誤差
范數(shù)越大對大特征值更有效赋访,會忽略小特征值惠呼,但數(shù)據正態(tài)分布時,RSEM性能更好搂妻。

Download and load the data

Take a quick look at the data strucure

data.head()

data.info()
data[‘attribute’].value_counts()
data.describe()
也可以畫直方圖來了解各個數(shù)字型屬性的分布
data.hist(bins = 50,figsize=(20,15))

create a test set

random select
from sklearn.model_selection import train_test_split
train_set,test_set = train_test_split(data,test_size = 0.2, random_state = 42)
stratified sampling通過對分組屬性進行分層采樣劃分
from sklearn.model_selection import StratifiedShuffleSplit
spliter = StratifiedShuffleSplit(n_splits = 1,test_size = 0.2,random_state = 42)
for train_index,test_index in spliter.split(data,data[‘category’]):
strat_train_set = data.loc[train_index]
start_test_set = data.loc[test_index]

exploring the data:discover and visualize the data to gain insights

visualizing geographical data
housing.plot(kind = ’scatter’,x= ‘longitude’,y = ‘latitude’ ,alpha = 0.4,s = housing[‘population’]/100,label = ‘population’,c = “median_house_value”,camp = plt.get_cmap(“jet”),colorbar = Ture)
plt.legend()

looking for correlations

corr_mattix = housing.corr()

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市蜓洪,隨后出現(xiàn)的幾起案子皮服,更是在濱河造成了極大的恐慌,老刑警劉巖着饥,帶你破解...
    沈念sama閱讀 221,548評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件犀农,死亡現(xiàn)場離奇詭異,居然都是意外死亡宰掉,警方通過查閱死者的電腦和手機呵哨,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,497評論 3 399
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來轨奄,“玉大人,你說我怎么就攤上這事≡藐牵” “怎么了紧武?”我有些...
    開封第一講書人閱讀 167,990評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長舞丛。 經常有香客問我耘子,道長,這世上最難降的妖魔是什么球切? 我笑而不...
    開封第一講書人閱讀 59,618評論 1 296
  • 正文 為了忘掉前任谷誓,我火速辦了婚禮,結果婚禮上吨凑,老公的妹妹穿的比我還像新娘捍歪。我一直安慰自己户辱,他們只是感情好,可當我...
    茶點故事閱讀 68,618評論 6 397
  • 文/花漫 我一把揭開白布糙臼。 她就那樣靜靜地躺著庐镐,像睡著了一般。 火紅的嫁衣襯著肌膚如雪变逃。 梳的紋絲不亂的頭發(fā)上必逆,一...
    開封第一講書人閱讀 52,246評論 1 308
  • 那天,我揣著相機與錄音揽乱,去河邊找鬼名眉。 笑死,一個胖子當著我的面吹牛凰棉,可吹牛的內容都是我干的损拢。 我是一名探鬼主播,決...
    沈念sama閱讀 40,819評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼撒犀,長吁一口氣:“原來是場噩夢啊……” “哼福压!你這毒婦竟也來了?” 一聲冷哼從身側響起或舞,我...
    開封第一講書人閱讀 39,725評論 0 276
  • 序言:老撾萬榮一對情侶失蹤荆姆,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后映凳,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體胞枕,經...
    沈念sama閱讀 46,268評論 1 320
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 38,356評論 3 340
  • 正文 我和宋清朗相戀三年魏宽,在試婚紗的時候發(fā)現(xiàn)自己被綠了腐泻。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,488評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡队询,死狀恐怖派桩,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情蚌斩,我是刑警寧澤铆惑,帶...
    沈念sama閱讀 36,181評論 5 350
  • 正文 年R本政府宣布,位于F島的核電站送膳,受9級特大地震影響员魏,放射性物質發(fā)生泄漏。R本人自食惡果不足惜叠聋,卻給世界環(huán)境...
    茶點故事閱讀 41,862評論 3 333
  • 文/蒙蒙 一撕阎、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧碌补,春花似錦虏束、人聲如沸棉饶。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,331評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽照藻。三九已至,卻和暖如春汗侵,著一層夾襖步出監(jiān)牢的瞬間幸缕,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,445評論 1 272
  • 我被黑心中介騙來泰國打工晰韵, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留冀值,地道東北人。 一個月前我還...
    沈念sama閱讀 48,897評論 3 376
  • 正文 我出身青樓宫屠,卻偏偏與公主長得像,于是被迫代替她去往敵國和親滑蚯。 傳聞我的和親對象是個殘疾皇子浪蹂,可洞房花燭夜當晚...
    茶點故事閱讀 45,500評論 2 359

推薦閱讀更多精彩內容

  • project checklist frame the problem select a performance ...
    陸文斌閱讀 204評論 0 0
  • 愛情是什么呢?愛一個人你是如何去面對自己和那個TA告材,(我愛你)經常掛在嘴邊坤次,直到有一天,有心中發(fā)出愛的光芒斥赋,只是去...
    那一日閱讀 103評論 0 0
  • 我用冷漠懲罰我過于單純的過往 這樣的冷漠其實還微微發(fā)燙 好像一把靠在角落的舊傘 只有陰雨天才變得繁忙 可它并不悲傷...
    烏荊子閱讀 313評論 0 1
  • 第十章 公正的評判一本書 我們學會主動的閱讀不會為了已經了解一本書在說什么而停頓下來缰猴,必須能評論,提出批評疤剑,才算...
    星期六1111閱讀 221評論 0 0
  • 排序算法 直接插入排序 基本思想 在要排序的一組數(shù)中滑绒,假設前面(n-1) [n>=2]個數(shù)已經是排好順序的,現(xiàn)在要...
    忘凈空閱讀 362評論 0 0