之前寫過一篇文章:大學(xué)生們都在讀什么書蛹磺?讓Python用數(shù)據(jù)告訴你!
在這篇文章中,我用Python爬蟲爬取了全國20多個圖書館的熱門借閱圖書信息阳欲,并按照一定的規(guī)則做了統(tǒng)計匯總,得到了這一份大學(xué)生各領(lǐng)域必讀TOP150書單,這份書單分領(lǐng)域保存在Excel的50多個sheet頁中檩奠,每個sheet頁的文件是這樣子的:
雖然內(nèi)容非常全面,但是這些擠在一塊的內(nèi)容附帽,總覺得根本沒有人會有興趣看下去埠戳,起碼得調(diào)整一下格式,做個簡單的美化蕉扮,讓excel更易讀整胃。
而50多個shee頁如果分別去調(diào)格式的話,也是個不小的工作量喳钟,這時屁使,Python的用武之地就來了!我可以用Python批量美化這些excel的格式奔则,節(jié)省自己的時間蛮寂。
Python對excel的操作我用到了xlwings
這個包。
xlwings
能夠非常方便的讀寫Excel文件中的數(shù)據(jù)易茬,并且能夠進行單元格格式的修改,還可以和matplotlib酬蹋、numpy、pandas無縫連接抽莱,支持讀寫numpy范抓、pandas數(shù)據(jù)類型,并將matplotlib可視化圖表導(dǎo)入到excel中食铐,更重要的是尉咕,在操作excel的時候,你可以實時看到效果璃岳,可以說這是我最喜歡的處理excel的Python包了年缎。
xlwings
的使用方式也非常簡單,只需要:
import xlwings as xw
這里我們主要使用其修改單元格格式的功能铃慷。
分為三步:
第1步单芜,先自己用excel制作一個格式模板,調(diào)整行高犁柜、列寬等洲鸠,并命名為sample.xlsx
。
因為行高和列寬都是一些數(shù)值,用代碼的方式調(diào)整不太直觀扒腕,所以采用在模板excel上調(diào)整好绢淀,然后應(yīng)用到目標(biāo)excel的方式。制作好的格式模板如下:
第2步瘾腰,讓程序讀取這個模板里的格式皆的,告訴程序接下來所有的shee頁都按照這個格式來美化。
#獲取樣例表格的列寬數(shù)據(jù)
def get_sample_format(col):##因為無需讀取整個excel所有列的列寬蹋盆,所以這里傳入一個讀取的列寬范圍參數(shù)
wb = xw.Book("sample.xlsx") # 建立于sample.xlsx文件的連接
sheet = wb.sheets["sheet1"] #打開sample.xlsx文件的sheet1
format = []
for i in range(col):
format.append(sheet[0,i].column_width)
print('列寬:'+str(format)) #'行高:'+sheet.range('A1').column_width+
wb.close()
return format
第3步费薄,讓程序批量操作這50個shee頁,按照模板的列寬進行設(shè)置栖雾,同時修改一些字體楞抡、單元格背景等。
## 美化表格 todo:還需要一個異常退出 https://blog.csdn.net/qq_37289115/article/details/107322332
def beautiful_sheet(table_name,raw,col,format):
#設(shè)置顏色
wb2 = xw.Book(table_name) # 建立excel表連接
sheets_name= [st.name for st in wb2.sheets]
for st in sheets_name:
sheet2 = wb2.sheets[st]
# sheet2[0,0] =
sheet2.range('a1').value= ['序號','書名(@知乎 東寫西讀整理)','總瀏覽次數(shù)','霸榜高校數(shù)','霸榜率','在高校榜單排名中位數(shù)','豆瓣評分','豆瓣鏈接(@知乎 東寫西讀整理)'] #更改標(biāo)題行
sheet2[0:raw,0:col+1].api.Borders(12).LineStyle = 0 #設(shè)置單元格橫邊框為細(xì)框線
sheet2[0:raw, 0:col+1].api.Borders(11).LineStyle = 0 #設(shè)置單元格豎邊框為細(xì)框線
sheet2[0:raw,0:col].api.Font.Name = '微軟雅黑'# 設(shè)置字體格式為微軟雅黑
sheet2[0:raw, 0:col].api.HorizontalAlignment = -4108 #設(shè)置字體居中
sheet2[:,4].api.NumberFormat = "0%" #“霸榜率”這一列單元格設(shè)置為百分比格式顯示
for i in range(raw): ##行遍歷
if i==0:
sheet2[i, 0:col].color = [217, 217, 217] #設(shè)置標(biāo)題背景顏色格式
elif i%2 ==0:
sheet2[i,0:col].color = [183, 222, 232] #設(shè)置偶數(shù)行背景顏色格式為淺藍(lán)色
for i,item in enumerate(format): #列遍歷,根據(jù)sample.xlsx中的列寬進行調(diào)整
sheet2[0,i].column_width = item
wb2.save()#保存excel
wb2.close()#關(guān)閉excel
return None
好了析藕,優(yōu)化后的excel是這個樣子的:
最后召廷,附上完整代碼:
import xlwings as xw
#獲取樣例表格的列寬數(shù)據(jù)
def get_sample_format(col):##因為無需讀取整個excel所有列的列寬,所以這里傳入一個讀取的列寬范圍參數(shù)
wb = xw.Book("sample.xlsx") # 建立于sample.xlsx文件的連接
sheet = wb.sheets["sheet1"] #打開sample.xlsx文件的sheet1
format = []
for i in range(col):
format.append(sheet[0,i].column_width)
print('列寬:'+str(format)) #'行高:'+sheet.range('A1').column_width+
wb.close()
return format
## 美化表格 todo:還需要一個異常退出 https://blog.csdn.net/qq_37289115/article/details/107322332
def beautiful_sheet(table_name,raw,col,format):
#設(shè)置顏色
wb2 = xw.Book(table_name) # 建立excel表連接
sheets_name= [st.name for st in wb2.sheets]
for st in sheets_name:
sheet2 = wb2.sheets[st]
# sheet2[0,0] =
sheet2.range('a1').value= ['序號','書名(@知乎 東寫西讀整理)','總瀏覽次數(shù)','霸榜高校數(shù)','霸榜率','在高校榜單排名中位數(shù)','豆瓣評分','豆瓣鏈接(@知乎 東寫西讀整理)'] #更改標(biāo)題行
sheet2[0:raw,0:col+1].api.Borders(12).LineStyle = 0 #設(shè)置單元格橫邊框為細(xì)框線
sheet2[0:raw, 0:col+1].api.Borders(11).LineStyle = 0 #設(shè)置單元格豎邊框為細(xì)框線
sheet2[0:raw,0:col].api.Font.Name = '微軟雅黑'# 設(shè)置字體格式為微軟雅黑
sheet2[0:raw, 0:col].api.HorizontalAlignment = -4108 #設(shè)置字體居中
sheet2[:,4].api.NumberFormat = "0%" #“霸榜率”這一列單元格設(shè)置為百分比格式顯示
for i in range(raw): ##行遍歷
if i==0:
sheet2[i, 0:col].color = [217, 217, 217] #設(shè)置標(biāo)題背景顏色格式
elif i%2 ==0:
sheet2[i,0:col].color = [183, 222, 232] #設(shè)置偶數(shù)行背景顏色格式為淺藍(lán)色
for i,item in enumerate(format): #列遍歷,根據(jù)sample.xlsx中的列寬進行調(diào)整
sheet2[0,i].column_width = item
wb2.save()#保存excel
wb2.close()#關(guān)閉excel
return None
if __name__ == '__main__':
table_name = "Top150.xlsx"#需要修改的excel名字
raw = 151 #需要修改格式的行數(shù)
col = 8 ##需要修改格式的列數(shù)
format = get_sample_format(col)
beautiful_sheet(table_name,raw,col,format)