商業(yè)分析python實戰(zhàn)(一):企業(yè)所得稅預(yù)測

原文鏈接:商業(yè)分析python實戰(zhàn)(一):企業(yè)所得稅預(yù)測


企業(yè)所得稅是企業(yè)經(jīng)營過程中的一項重點關(guān)注內(nèi)容妻往,分析企業(yè)所得稅的影響因素草冈,預(yù)測未來兩年有效的企業(yè)所得稅,為未來企業(yè)發(fā)展提供指導(dǎo)依據(jù)勇劣,在企業(yè)經(jīng)營過程中有重大意義随夸。現(xiàn)有某企業(yè)2004年至2015年相關(guān)的數(shù)據(jù)九默,希望以此為基礎(chǔ),預(yù)測2016年及2017年的企業(yè)所得稅逃魄。

步驟

1荤西、獲取數(shù)據(jù);

2、相關(guān)性分析邪锌;

3勉躺、Lasso特征選擇;

4觅丰、單個特征灰色預(yù)測饵溅;

5、SVR預(yù)測2016年及2017年企業(yè)所得稅妇萄,并對模型進行評價蜕企。

NO.1 獲取數(shù)據(jù)

考慮數(shù)據(jù)的可得性和與實際情況的關(guān)聯(lián)性,選取2004年-2015年某企業(yè)相關(guān)維度的數(shù)據(jù)冠句,具體字段名及說明如下表:

NO.2 分析企業(yè)所得稅數(shù)據(jù)的相關(guān)性

從已有數(shù)據(jù)轻掩,可知道共有10個因素會影響企業(yè)所得稅,需要計算各影響因素與目標(biāo)特征之間的相關(guān)系數(shù)懦底,進而判斷企業(yè)所得稅與選取特征之間的相關(guān)性唇牧。這里,我們計算10個特征間的Pearson相關(guān)系數(shù)聚唐,結(jié)果如下:

由上可知丐重,x6與企業(yè)所得稅(y)呈負相關(guān)關(guān)系蠢箩,其余特征均與y呈正相關(guān)關(guān)系诱咏,且各個特征間存在嚴(yán)重的多重共線性,如x1尿扯,x2亲桦,x3崖蜜,x4,x7烙肺,x8纳猪,x10。因此桃笙,需要對這些特征進行進一步篩選,避免信息重復(fù)沙绝。

NO.3 用Lasso回歸選取關(guān)鍵特征

Lasso回歸方法屬于正則化方法的一種搏明,是一種收縮估計方法,它可以將特征的系數(shù)進行壓縮并使某些回歸系數(shù)變?yōu)?闪檬,從而達到特征選擇的目的星著。Lasso對數(shù)據(jù)類型沒有太多限制,一般不需要對數(shù)據(jù)進行標(biāo)準(zhǔn)化處理粗悯,可以有效的解決多重共線性問題虚循,但它傾向于選擇多個特征中的一個特征,會導(dǎo)致結(jié)果的不穩(wěn)定性。本例中横缔,多重共線性的問題較為嚴(yán)重铺遂,因此使用Lasso進行特征選擇是一個恰當(dāng)?shù)姆椒ā?/p>

根據(jù)上圖的結(jié)果茎刚,Lasso識別的影響企業(yè)所得稅因素為x1襟锐,x9,x2膛锭。

NO.4 用灰色預(yù)測得到單特征預(yù)測值

因為各因素沒有2016年粮坞、2017年的數(shù)據(jù),因此我們需要先通過灰色預(yù)測得到單個特征在2016年初狰、2017年的值莫杈。灰色預(yù)測是一種對含有不確定因素的系統(tǒng)進行預(yù)測的方法奢入,具有預(yù)測精度高筝闹、模型可檢驗、參數(shù)估計方法簡單的特點俊马,但對序列的光滑度要求較高丁存。灰色預(yù)測通過后驗差檢驗判別模型精度柴我,結(jié)果參照表如下:

通過GM方法進行灰色預(yù)測解寝,x1、x2艘儒、x3的后驗差檢驗結(jié)果及在2016年聋伦、2017年的預(yù)測值如下:

NO.5 用SVR構(gòu)建預(yù)測模型

SVR(支持向量回歸)不僅適用于線性模型,也能很好的抓住數(shù)據(jù)和特征之間的非線性關(guān)系界睁,可避免局部最小問題,但計算復(fù)雜度較高翻斟,數(shù)據(jù)量大時逾礁,耗時較長。模型預(yù)測后,可通過R2值來判斷模型效果窒篱,R2越接近1,表示模型擬合效果越好。

實現(xiàn)代碼

點擊原文(商業(yè)分析python實戰(zhàn)(一):企業(yè)所得稅預(yù)測)后臺回復(fù)“企業(yè)”可得本例數(shù)據(jù)及代碼鲸阔。

參考內(nèi)容:

1褐筛、《R語言商務(wù)數(shù)據(jù)分析實戰(zhàn)》

2晃痴、https://www.cnblogs.com/zinyy/p/953

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末琼蚯,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌转捕,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,490評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件嵌屎,死亡現(xiàn)場離奇詭異淤堵,居然都是意外死亡隘截,警方通過查閱死者的電腦和手機扎阶,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,581評論 3 395
  • 文/潘曉璐 我一進店門汹胃,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人东臀,你說我怎么就攤上這事着饥。” “怎么了惰赋?”我有些...
    開封第一講書人閱讀 165,830評論 0 356
  • 文/不壞的土叔 我叫張陵宰掉,是天一觀的道長。 經(jīng)常有香客問我赁濒,道長轨奄,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,957評論 1 295
  • 正文 為了忘掉前任流部,我火速辦了婚禮戚绕,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘枝冀。我一直安慰自己舞丛,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,974評論 6 393
  • 文/花漫 我一把揭開白布果漾。 她就那樣靜靜地躺著球切,像睡著了一般。 火紅的嫁衣襯著肌膚如雪绒障。 梳的紋絲不亂的頭發(fā)上吨凑,一...
    開封第一講書人閱讀 51,754評論 1 307
  • 那天,我揣著相機與錄音户辱,去河邊找鬼鸵钝。 笑死,一個胖子當(dāng)著我的面吹牛庐镐,可吹牛的內(nèi)容都是我干的恩商。 我是一名探鬼主播,決...
    沈念sama閱讀 40,464評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼必逆,長吁一口氣:“原來是場噩夢啊……” “哼怠堪!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起名眉,我...
    開封第一講書人閱讀 39,357評論 0 276
  • 序言:老撾萬榮一對情侶失蹤粟矿,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后损拢,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體陌粹,經(jīng)...
    沈念sama閱讀 45,847評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,995評論 3 338
  • 正文 我和宋清朗相戀三年福压,在試婚紗的時候發(fā)現(xiàn)自己被綠了申屹。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片绘证。...
    茶點故事閱讀 40,137評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖哗讥,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情胞枕,我是刑警寧澤杆煞,帶...
    沈念sama閱讀 35,819評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站腐泻,受9級特大地震影響决乎,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜派桩,卻給世界環(huán)境...
    茶點故事閱讀 41,482評論 3 331
  • 文/蒙蒙 一构诚、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧铆惑,春花似錦范嘱、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,023評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至撕阎,卻和暖如春受裹,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背虏束。 一陣腳步聲響...
    開封第一講書人閱讀 33,149評論 1 272
  • 我被黑心中介騙來泰國打工棉饶, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人镇匀。 一個月前我還...
    沈念sama閱讀 48,409評論 3 373
  • 正文 我出身青樓照藻,卻偏偏與公主長得像,于是被迫代替她去往敵國和親坑律。 傳聞我的和親對象是個殘疾皇子岩梳,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,086評論 2 355

推薦閱讀更多精彩內(nèi)容