目的:希望自己能夠通過數(shù)學(xué)职车,財(cái)務(wù)扛芽,計(jì)算機(jī)技書川尖,能看到不一樣的世界叮喳。此次為第一篇馍悟,以后會(huì)不定期帶來通過數(shù)學(xué)分析來建模篓冲,看到不一樣的世界。我本人是對(duì)計(jì)算機(jī)刹前,稅務(wù)相當(dāng)感興趣的人,所以的分析手段都是通過看論文得到的,如果你有什么很好的建議或者想做這個(gè),可以聯(lián)系我仙粱,qq:1421074836
1.準(zhǔn)備工作
收集稅務(wù)案件(企業(yè))數(shù)量:6404件(大約2009-至今)
目標(biāo)收集網(wǎng)址:http://hd.chinatax.gov.cn/xxk/action/GetArticleView1.do?op=xxkweb&id=231742
使用工具:Python(編程語言)伐割,mysql(數(shù)據(jù)存儲(chǔ)),echart(圖像生成)
2.如何分析--案件生成熱力圖
2.1將所在位置信息繪制在地圖上
1.提取企業(yè)所在的地址,進(jìn)行提取省唯卖,市,縣,使用符號(hào):U
2.將U堪嫂,與經(jīng)緯度進(jìn)行關(guān)聯(lián)? ?---->? ?(U,X,Y)
3.將(U,X,Y)繪制到地圖上
特別提醒:由于算法相對(duì)比較不完善皆串,所以有效數(shù)據(jù)使用率為4368 /6404=68.20%
繪制圖像如下:
2.2按照案件的類型-形成餅狀圖
1.案件性質(zhì) 餅狀圖? (共分析了6404條數(shù)據(jù))
2.說明追繳金額,罰款金額占比
最后:由于大量的分析數(shù)據(jù)需要不斷的建模套么,故此次就分析這么多肃弟,
謝謝
-----丁香小全 2018-5-9