我是從負(fù)責(zé)運(yùn)輸公司的財(cái)務(wù)轉(zhuǎn)行成為運(yùn)輸?shù)臄?shù)據(jù)分析的耘眨。轉(zhuǎn)行大概準(zhǔn)備了半年多,不知道能不能算迅速境肾。 首先是數(shù)據(jù)處理能力剔难,例如京東系統(tǒng)中發(fā)車數(shù)據(jù)、裝貨數(shù)據(jù)奥喻、客戶下單數(shù)據(jù)偶宫,可以用海量形...
我是從負(fù)責(zé)運(yùn)輸公司的財(cái)務(wù)轉(zhuǎn)行成為運(yùn)輸?shù)臄?shù)據(jù)分析的耘眨。轉(zhuǎn)行大概準(zhǔn)備了半年多,不知道能不能算迅速境肾。 首先是數(shù)據(jù)處理能力剔难,例如京東系統(tǒng)中發(fā)車數(shù)據(jù)、裝貨數(shù)據(jù)奥喻、客戶下單數(shù)據(jù)偶宫,可以用海量形...
一、概念 人工神經(jīng)網(wǎng)絡(luò)是是一種應(yīng)用類似于大腦神經(jīng)突觸聯(lián)接的結(jié)構(gòu)進(jìn)行信息處理的數(shù)學(xué)模型环鲤。這種模型可以適用于分類與回歸纯趋。 神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn):可以把非線性做的特別好,擬合能力特別強(qiáng)冷离,...
特征處理包括:數(shù)據(jù)清洗和特征預(yù)處理吵冒。 一、數(shù)據(jù)清洗: 1.數(shù)據(jù)樣本抽樣 ①樣本要具備代表性 ②樣本比例要平衡以及樣本不平衡時(shí)如何處理 ③考慮全量數(shù)據(jù) 2.異常值處理 2.1...
一西剥、概念 LDA:Linear Discriminant Analysis 線性判別式分析 (NOT:在文本分析領(lǐng)域痹栖,還有個(gè)LDA的概念,全稱為隱含狄利克雷分布(Latent...
特征選擇就是剔除與標(biāo)注不相關(guān)或者冗余的特征蔫耽,它是數(shù)據(jù)歸約的思路之一(另一個(gè)思路為抽樣) 特征選擇主要包括三種思想:過濾思想结耀、包裹思想和嵌入思想留夜。 編程實(shí)現(xiàn): 第一步匙铡,導(dǎo)入必要...
相關(guān)分析最常用的方法就是用相關(guān)系數(shù)直接衡量連續(xù)值的相關(guān)性图甜,而離散屬性的相關(guān)性是用熵增益轉(zhuǎn)換成相關(guān)性的形式來衡量。 一鳖眼、分析連續(xù)值的相關(guān)性: Pearson相關(guān)系數(shù)及Spear...
分析思路: 先導(dǎo)入pandas黑毅、numpy包; 定義一個(gè)myPCA钦讳,傳入data及n_components參數(shù)矿瘦,并設(shè)置components為1000000維; ①先求每個(gè)屬性...
分析思路: 1.導(dǎo)入必要的包(pandas愿卒,numpy缚去,scipy.stats,matplotlib.pyplot琼开,seaborn) 2.讀取文件易结,為df 3.按 depar...