上一篇文件用VBA介紹了如何實(shí)現(xiàn)一鍵按列分類匯總并保存單獨(dú)文件茂浮,代碼有幾十行睦优,而且一旦數(shù)據(jù)量多了菌羽,效果可能不盡如人意掠械。
文章可以參見(jiàn)這里:
vba實(shí)例(27)-一鍵按列分類匯總并保存單獨(dú)文件
今天就來(lái)給大家說(shuō)說(shuō)如何用python來(lái)實(shí)現(xiàn)這個(gè)效果,先給大家看看效果:
代碼只有十幾行算凿,效果要提升好多倍份蝴,這也是使用python的優(yōu)勢(shì)所在。
思路與代碼詳解
核心思路基本和VBA的一致:讀取excel數(shù)據(jù) - 獲取“歸屬事業(yè)部”列中事業(yè)部種類數(shù) - 按每個(gè)事業(yè)部進(jìn)行整行提取 - 保存xlsx文件氓轰。
1婚夫、這里使用的是python中的pandas數(shù)據(jù)處理庫(kù),這個(gè)是在數(shù)據(jù)處理界非常牛逼的一個(gè)工具庫(kù)署鸡,使用之前需要導(dǎo)入庫(kù)案糙。
import?pandas?as?pd?
2、讀取excel的數(shù)據(jù)靴庆。讀取"拆分實(shí)例.xlsx"這個(gè)excel中,sheet名字為"全國(guó)客戶明細(xì)"的數(shù)據(jù)时捌,將讀取的內(nèi)容賦值給df渐裂。
df?=?pd.read_excel("拆分實(shí)例.xlsx",sheet_name="全國(guó)客戶明細(xì)")
3霞赫、獲取“歸屬事業(yè)部”列的種類數(shù),使用pandas庫(kù)的unique方法动雹,將所有事業(yè)部的名字賦值給變量group_names焰薄。
group_names=df["歸屬事業(yè)部"].unique()
4拿诸、將某個(gè)事業(yè)部的數(shù)據(jù)整行提取出來(lái)保存成xlsx文件扒袖,并按事業(yè)部的名字進(jìn)行命名。
df_group=df.groupby(by=['歸屬事業(yè)部']).get_group(group_name).reset_index(drop=True)
df_group.to_excel(".\拆分結(jié)果\\"+group_name+".xlsx")
5亩码、遍歷每一個(gè)事業(yè)部季率,進(jìn)行同樣的操作。
for?group_name?in?group_names:
完整代碼如下:
import?pandas?as?pd
import?time
start?=?time.time()
df?=?pd.read_excel("拆分實(shí)例.xlsx",sheet_name="全國(guó)客戶明細(xì)")
group_names=df["歸屬事業(yè)部"].unique()
for?group_name?in?group_names:
????df_group=df.groupby(by=['歸屬事業(yè)部']).get_group(group_name).reset_index(drop=True)
????df_group.to_excel(".\拆分結(jié)果\\"+group_name+".xlsx")
elapsed?=?(time.time()?-?start)
print("完成描沟,共花費(fèi)時(shí)間為:",elapsed)
優(yōu)化
上面這個(gè)代碼生成的excel飒泻,數(shù)據(jù)是沒(méi)有任何問(wèn)題,但是單元格格式比較簡(jiǎn)陋吏廉,甚至可以說(shuō)“丑”泞遗。
如果需要如下圖像生成VBA的比較美觀的樣式,要怎么弄呢迟蜜?需要做一些格式上的處理刹孔。
可以新建一個(gè)“模板”文件,
然后調(diào)用openpyxl庫(kù)將分類的數(shù)據(jù)dataframe寫入到模板文件中娜睛,設(shè)置邊框等格式髓霞,另存為xlsx文件即可。
效果如下:
如果你對(duì)上面的內(nèi)容感興趣畦戒,可以在公號(hào)內(nèi)回復(fù)「python處理」自取試用方库,盡快吧!
歡迎交流障斋!