2. 特征預(yù)處理（歸一化、標(biāo)準(zhǔn)化物臂、缺失值處理）

特征預(yù)處理：對數(shù)據(jù)進(jìn)行處理通過特定的統(tǒng)計方法 (數(shù)學(xué)方法) 將數(shù)據(jù)轉(zhuǎn)換成算法要求的數(shù)據(jù)旺拉。

數(shù)值型數(shù)據(jù)：標(biāo)準(zhǔn)縮放：1. 歸一化。2. 標(biāo)準(zhǔn)化棵磷。3. 缺失值
類別型數(shù)據(jù)：one-hot編碼
時間類型：時間的切分

sklearn特征預(yù)處理api

sklearn.preprocessing

(1)歸一化

歸一化特點(diǎn)：通過對原始數(shù)據(jù)進(jìn)行變換把數(shù)據(jù)映射到(默認(rèn)為[0,1])之間
歸一化缺點(diǎn)：最大值與最小值非常容易受異常點(diǎn)影響蛾狗，魯棒性較差。使用較少

Sklearn歸一化api仪媒。多個特征同等重要時
sklearn.preprocessing.MinMaxScaler
MinMaxScaler(feature_range=(0,1))
每個特征縮放到給定范圍(默認(rèn)[0,1])

MinMaxScaler.fit_transform(x)
X: numpy array格式的數(shù)據(jù) [n_samples, n_features]
返回值：轉(zhuǎn)換后的形式相同的array

(2)標(biāo)準(zhǔn)化用的比歸一化多

特點(diǎn)：通過對原始數(shù)據(jù)進(jìn)行變換把數(shù)據(jù)變換為均值為0沉桌，標(biāo)準(zhǔn)差為1范圍內(nèi)。
和歸一化一樣算吩，公式作用于每一列

sklearn.preprocessing.StandardScaler()

StandardScaler.fit_transform(x)
StandardScaler.mean_ 原始數(shù)據(jù)中每列特征的平均值
StandardScaler.std_ 原始數(shù)據(jù)每列特征的標(biāo)準(zhǔn)差

(3)缺失值得是np.nan模式

sklearn.preprocessing.Imputer
Imputer(missing_values=’NaN’, strategy=‘mean’, axis=0） 0是列1是行

Imputer.fit_transform(x)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末留凭，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子偎巢，更是在濱河造成了極大的恐慌蔼夜，老刑警劉巖，帶你破解...
沈念sama閱讀 219,427評論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件压昼，死亡現(xiàn)場離奇詭異求冷，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)窍霞，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,551評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門匠题，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人但金，你說我怎么就攤上這事韭山。” “怎么了傲绣？”我有些...
開封第一講書人閱讀 165,747評論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵掠哥，是天一觀的道長。經(jīng)常有香客問我秃诵，道長，這世上最難降的妖魔是什么塞琼？我笑而不...
開封第一講書人閱讀 58,939評論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任菠净，我火速辦了婚禮，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘毅往。我一直安慰自己牵咙，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,955評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布攀唯。她就那樣靜靜地躺著洁桌，像睡著了一般。火紅的嫁衣襯著肌膚如雪侯嘀。梳的紋絲不亂的頭發(fā)上另凌，一...
開封第一講書人閱讀 51,737評論 1贊 305
城市分裂傳說
那天，我揣著相機(jī)與錄音戒幔，去河邊找鬼吠谢。笑死，一個胖子當(dāng)著我的面吹牛诗茎，可吹牛的內(nèi)容都是我干的工坊。我是一名探鬼主播，決...
沈念sama閱讀 40,448評論 3贊 420
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼敢订，長吁一口氣：“原來是場噩夢啊……” “哼王污！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起楚午，我...
開封第一講書人閱讀 39,352評論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤昭齐，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后醒叁，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體司浪，經(jīng)...
沈念sama閱讀 45,834評論 1贊 317
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,992評論 3贊 338
?白月光啟示錄
正文我和宋清朗相戀三年把沼，在試婚紗的時候發(fā)現(xiàn)自己被綠了啊易。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 40,133評論 1贊 351
活死人
序言：一個原本活蹦亂跳的男人離奇死亡饮睬，死狀恐怖租谈，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情捆愁，我是刑警寧澤割去，帶...
沈念sama閱讀 35,815評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站昼丑，受9級特大地震影響呻逆，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜菩帝，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,477評論 3贊 331
男人毒藥：我在死后第九天來索命
文/蒙蒙一咖城、第九天我趴在偏房一處隱蔽的房頂上張望茬腿。院中可真熱鬧，春花似錦宜雀、人聲如沸切平。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,022評論 0贊 22
一樁弒父案辐董，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽悴品。三九已至，卻和暖如春简烘，著一層夾襖步出監(jiān)牢的瞬間苔严，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,147評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工夸研，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留邦蜜，地道東北人。一個月前我還...
沈念sama閱讀 48,398評論 3贊 373
代替公主和親
正文我出身青樓亥至，卻偏偏與公主長得像悼沈，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子姐扮，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,077評論 2贊 355

2. 特征預(yù)處理（歸一化乐导、標(biāo)準(zhǔn)化苦丁、缺失值處理）

2. 特征預(yù)處理（歸一化、標(biāo)準(zhǔn)化物臂、缺失值處理）

特征預(yù)處理：對數(shù)據(jù)進(jìn)行處理通過特定的統(tǒng)計方法 (數(shù)學(xué)方法) 將數(shù)據(jù)轉(zhuǎn)換成算法要求的數(shù)據(jù)旺拉。

sklearn特征預(yù)處理api

(1)歸一化

(2)標(biāo)準(zhǔn)化用的比歸一化多

(3)缺失值得是np.nan模式

推薦閱讀更多精彩內(nèi)容

2. 特征預(yù)處理（歸一化、標(biāo)準(zhǔn)化物臂、缺失值處理）

特征預(yù)處理：對數(shù)據(jù)進(jìn)行處理 通過特定的統(tǒng)計方法 (數(shù)學(xué)方法) 將數(shù)據(jù)轉(zhuǎn)換成算法要求的數(shù)據(jù)旺拉。

sklearn特征預(yù)處理api

(1)歸一化

(2)標(biāo)準(zhǔn)化 用的比歸一化多

(3)缺失值 得是np.nan模式

推薦閱讀更多精彩內(nèi)容

特征預(yù)處理：對數(shù)據(jù)進(jìn)行處理通過特定的統(tǒng)計方法 (數(shù)學(xué)方法) 將數(shù)據(jù)轉(zhuǎn)換成算法要求的數(shù)據(jù)旺拉。

(2)標(biāo)準(zhǔn)化用的比歸一化多

(3)缺失值得是np.nan模式