2020-05-11

人工智能

數(shù)據(jù)特征預處理枝嘶,數(shù)據(jù)降維

處理方法:? ? ?1哈恰,數(shù)值型數(shù)據(jù)? ? ?:? ?標準縮放? ? ? (1)歸一化

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (2)標準化

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(3)缺失值?

? ? ? ? ? ? ? ? ? ? ? ?2, 類別型數(shù)據(jù)? ? :? ? one-hot 編碼

? ? ? ? ? ? ? ? ? ? ? ?3电谣,時間類型? ? ? ? ?:? ? 時間的切分

下面是歸一化浑彰,標準化恭理,缺失值,(這是小編的筆記)


歸一化:通過對原始數(shù)據(jù)進行轉(zhuǎn)換闸昨,把數(shù)據(jù)映射到蚯斯,0,1之間饵较。(其實就是把復雜的數(shù)據(jù)通過公式算法變成簡單的0~1之間拍嵌。)


標準化:通過對原始數(shù)據(jù)進行轉(zhuǎn)換,把數(shù)據(jù)轉(zhuǎn)換成均值為0循诉,方差為1的范圍横辆。(方差考量數(shù)據(jù)的穩(wěn)定數(shù)據(jù)的穩(wěn)定性,如果方差為零茄猫,表示數(shù)據(jù)的值是一樣的)

#導入包

from sklearn.preprocessingimport StandardScaler

import numpyas np

from sklearn.imputeimport SimpleImputer

def sdandar():

"""

? ? 標準化處理

? ? :return: None

"""

? ? #實例化

? ? bzh = StandardScaler()

data = bzh.fit_transform([[1,-1,3],[2,4,2],[4,6,-1]])

print(data)

return None

def inputer():

"""

? ? 標準化處理

? ? :return: None

"""

? ? #實例化

? ? qsz = SimpleImputer(strategy='mean')

data = qsz.fit_transform([[1,-1,3],[np.nan,4,2],[4,6,-1]])

print(data)

return None

if __name__ =="__main__":

inputer()

數(shù)據(jù)的降維:(改變特征的數(shù)量)

特征選擇的原因:冗余——部分特征的相關度高狈蚤,容易消耗計算機性能

? ? ? ? ? ? ? ? ? ? ? ? ? ? ?噪聲——部分特征對與預測結果有影響

特征選擇的主要方法:Filter過濾式,Embedded嵌入式划纽,Wrapper包裹式

PCA:本質(zhì)——PCA是一種分析脆侮,簡化數(shù)據(jù)集的技術

? ? ? ? ? ?目的——是數(shù)據(jù)維數(shù)壓縮,盡可能降低數(shù)據(jù)的維數(shù)勇劣,這樣會損失少量的信息

? ? ? ? ? ?作用——可以削減回歸分析或聚類分析中的特征數(shù)量

簡而言之:小編的理解是靖避,數(shù)據(jù)特征預處理和降維的核心是提煉數(shù)據(jù)潭枣,去除水分,提高計算機性能的利用幻捏。

?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末盆犁,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子篡九,更是在濱河造成了極大的恐慌谐岁,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,042評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件榛臼,死亡現(xiàn)場離奇詭異伊佃,居然都是意外死亡,警方通過查閱死者的電腦和手機讽坏,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,996評論 2 384
  • 文/潘曉璐 我一進店門锭魔,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人路呜,你說我怎么就攤上這事迷捧。” “怎么了胀葱?”我有些...
    開封第一講書人閱讀 156,674評論 0 345
  • 文/不壞的土叔 我叫張陵漠秋,是天一觀的道長。 經(jīng)常有香客問我抵屿,道長庆锦,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,340評論 1 283
  • 正文 為了忘掉前任轧葛,我火速辦了婚禮搂抒,結果婚禮上,老公的妹妹穿的比我還像新娘尿扯。我一直安慰自己求晶,他們只是感情好,可當我...
    茶點故事閱讀 65,404評論 5 384
  • 文/花漫 我一把揭開白布衷笋。 她就那樣靜靜地躺著芳杏,像睡著了一般。 火紅的嫁衣襯著肌膚如雪辟宗。 梳的紋絲不亂的頭發(fā)上爵赵,一...
    開封第一講書人閱讀 49,749評論 1 289
  • 那天,我揣著相機與錄音泊脐,去河邊找鬼空幻。 笑死,一個胖子當著我的面吹牛容客,可吹牛的內(nèi)容都是我干的秕铛。 我是一名探鬼主播则剃,決...
    沈念sama閱讀 38,902評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼如捅!你這毒婦竟也來了?” 一聲冷哼從身側響起调煎,我...
    開封第一講書人閱讀 37,662評論 0 266
  • 序言:老撾萬榮一對情侶失蹤镜遣,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后士袄,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體悲关,經(jīng)...
    沈念sama閱讀 44,110評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,451評論 2 325
  • 正文 我和宋清朗相戀三年娄柳,在試婚紗的時候發(fā)現(xiàn)自己被綠了寓辱。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,577評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡赤拒,死狀恐怖秫筏,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情挎挖,我是刑警寧澤这敬,帶...
    沈念sama閱讀 34,258評論 4 328
  • 正文 年R本政府宣布,位于F島的核電站蕉朵,受9級特大地震影響崔涂,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜始衅,卻給世界環(huán)境...
    茶點故事閱讀 39,848評論 3 312
  • 文/蒙蒙 一冷蚂、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧汛闸,春花似錦蝙茶、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,726評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至孕锄,卻和暖如春吮廉,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背畸肆。 一陣腳步聲響...
    開封第一講書人閱讀 31,952評論 1 264
  • 我被黑心中介騙來泰國打工宦芦, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人轴脐。 一個月前我還...
    沈念sama閱讀 46,271評論 2 360
  • 正文 我出身青樓调卑,卻偏偏與公主長得像抡砂,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子恬涧,可洞房花燭夜當晚...
    茶點故事閱讀 43,452評論 2 348