全文轉(zhuǎn)載自:https://www.cnblogs.com/Forever77/p/11135124.html 感謝
原文非常清晰阿宅,全程無bug灵再,調(diào)試通過边翁,留作記錄以防丟失
一啼肩、xlrd和xlwt
使用之前需要先安裝橄妆,windows上如果直接在cmd中運行python則需要先執(zhí)行pip3 install xlrd和pip3 install xlwt,如果使用pycharm則需要在項目的解釋器中安裝這兩個模塊祈坠,F(xiàn)ile-Settings-Project:layout-Project Interpreter害碾,點擊右側(cè)界面的+號,然后搜索xlrd和xlwt颁虐,然后點擊Install Package進行安裝蛮原。
對于excel來說,整個excel文件稱為工作簿另绩,工作簿中的每個頁稱為工作表儒陨,工作表又由單元格組成。
對于xlrd和xlwt笋籽,行數(shù)和列數(shù)從0開始蹦漠,單元格的行和列也從0開始,例如sheet.row_values(2)表示第三行的內(nèi)容车海,sheet.cell(1,2).value表示第二行第三列單元格的內(nèi)容笛园。
1.xlrd模塊讀取excel文件
使用xlrd模塊之前需要先導(dǎo)入import xlrd,xlrd模塊既可讀取xls文件也可讀取xlsx文件侍芝。
獲取工作簿對象:book = xlrd.open_workbook('excel文件名稱')
獲取所有工作表名稱:names = book.sheet_names()研铆,結(jié)果為列表
根據(jù)索引獲取工作表對象:sheet = book.sheet_by_index(i)
根據(jù)名稱獲取工作表對象:sheet = book.sheet_by_name('工作表名稱')
獲取工作表行數(shù):rows = sheet.nrows
獲取工作表列數(shù):cols = sheet.ncols
獲取工作表某一行的內(nèi)容:row =?sheet.row_values(i) ,結(jié)果為列表? ?【sheet.row(i)州叠,列表】
獲取工作表某一列的內(nèi)容:col =?sheet.col_values(i)? 結(jié)果為列表? ?【sheet.col(i)棵红,列表】
獲取工作表某一單元格的內(nèi)容:cell = sheet.cell_value(m,n)、 sheet.cell(m,n).value咧栗、sheet.row(m)[n].value逆甜,sheet.col(n)[m].value虱肄,結(jié)果為字符串或數(shù)值? ? 【sheet.cell(0,0),xlrd.sheet.Cell對象】
示例:假設(shè)在py執(zhí)行文件同層目錄下有一fruit.xls文件交煞,有三個sheet頁Sheet1咏窿、Sheet2、Sheet3素征,其中Sheet1內(nèi)容如下:
import xlrd
book = xlrd.open_workbook('fruit.xls')print('sheet頁名稱:',book.sheet_names())
sheet = book.sheet_by_index(0)
rows = sheet.nrows
cols = sheet.ncolsprint('該工作表有%d行集嵌,%d列.'%(rows,cols))print('第三行內(nèi)容為:',sheet.row_values(2))print('第二列內(nèi)容為%s,數(shù)據(jù)類型為%s.'%(sheet.col_values(1),type(sheet.col_values(1))))print('第二列內(nèi)容為%s,數(shù)據(jù)類型為%s.'%(sheet.col(1),type(sheet.col(1))))print('第二行第二列的單元格內(nèi)容為:',sheet.cell_value(1,1))print('第三行第二列的單元格內(nèi)容為:',sheet.cell(2,1).value)print('第五行第三列的單元格內(nèi)容為:',sheet.row(4)[2].value)print('第五行第三列的單元格內(nèi)容為%s,數(shù)據(jù)類型為%s'%(sheet.col(2)[4].value,type(sheet.col(2)[4].value)))print('第五行第三列的單元格內(nèi)容為%s,數(shù)據(jù)類型為%s'%(sheet.col(2)[4],type(sheet.col(2)[4])))# 執(zhí)行結(jié)果# sheet頁名稱: ['Sheet1', 'Sheet2', 'Sheet3']# 該工作表有5行,3列.# 第三行內(nèi)容為: ['梨', 3.5, 130.0]# 第二列內(nèi)容為['單價/元', 8.0, 3.5, 4.5, 3.8],數(shù)據(jù)類型為<class 'list'>.# 第二列內(nèi)容為[text:'單價/元', number:8.0, number:3.5, number:4.5, number:3.8],數(shù)據(jù)類型為<class 'list'>.# 第二行第二列的單元格內(nèi)容為: 8.0# 第三行第二列的單元格內(nèi)容為: 3.5# 第五行第三列的單元格內(nèi)容為: 300.0# 第五行第三列的單元格內(nèi)容為300.0,數(shù)據(jù)類型為<class 'float'># 第五行第三列的單元格內(nèi)容為number:300.0,數(shù)據(jù)類型為<class 'xlrd.sheet.Cell'>
可以看出通過sheet.row(i)稚茅、sheet.col(i)也可獲取行或列的內(nèi)容纸淮,并且結(jié)果也是一個列表,但是列表中的每一項類似字典的鍵值對亚享,形式為數(shù)據(jù)類型:值咽块。
而sheet.cell(0,0)獲取單元格內(nèi)容,結(jié)果是一個鍵值對欺税,并且是一個xlrd.sheet.Cell對象侈沪。
2.xlwt寫入excel文件
使用xlwt模塊之前需要先導(dǎo)入import xlwt,xlwt模塊只能寫xls文件晚凿,不能寫xlsx文件(寫xlsx程序不會報錯亭罪,但最后文件無法直接打開,會報錯)歼秽。
創(chuàng)建工作簿:book = xlwt.Workbook()应役,如果寫入中文為亂碼,可添加參數(shù)encoding = 'utf-8'
創(chuàng)建工作表:sheet = book.add_sheet('Sheet1')
向單元格寫入內(nèi)容:sheet.write(m,n,'內(nèi)容1')燥筷、sheet.write(x,y,'內(nèi)容2')
保存工作簿:book.save('excel文件名稱')箩祥,默認保存在py文件相同路徑下,如果該路徑下有相同文件肆氓,會被新創(chuàng)建的文件覆蓋袍祖,即xlwt不能修改文件。
import xlwt
book = xlwt.Workbook()
sheet = book.add_sheet('Sheet1')
sheet.write(0,0,'hello')
sheet.write(1,0,'你好')
book.save('hello.xls')
逐個單元格寫入excel比較麻煩谢揪,可以按行或者列寫入蕉陋。
import xlwt
proj = ['名稱','單價/元','庫存/kg']
fruit = ['蘋果','梨','香蕉','橘子']
price = [8,3.5,4.5,3.8]
storage = [150,130,100,300]
book = xlwt.Workbook()
sheet = book.add_sheet('Sheet1')foriin range(0,len(proj)):
? ? sheet.write(0,i,proj[i]) #按行插入行標(biāo)題foriin range(0,len(fruit)):
? ? sheet.write(i+1,0,fruit[i])#插入第一列水果名稱foriin range(0,len(price)):
? ? sheet.write(i+1,1,price[i])#插入第二列單價foriin range(0,len(storage)):
? ? sheet.write(i+1,2,storage[i])#插入第三列庫存book.save('fruit2.xls')
二、openpyxl模塊
openpyxl模塊可實現(xiàn)對excel文件的讀拨扶、寫和修改凳鬓,只能處理xlsx文件,不能處理xls文件患民,使用之前同樣需要先安裝該模塊缩举,再導(dǎo)入 import openpyxl。
對于openpyxl,行數(shù)和列數(shù)都從1開始蚁孔,單元格的行和列也從1開始。例如sheet.cell(1,2).value表示第一行第二列單元格的內(nèi)容
1.openpyxl讀取excel文件
獲取工作簿對象:book = openpyxl.load_workbook('excel文件名稱')
獲取所有工作表名稱:names = book.sheetnames
獲取工作表對象:sheet1 = book.worksheets[n]惋嚎、sheet2 = book['工作表名稱']杠氢、sheet3 = book[book.sheetnames[n]]
獲取工作表名稱:title = sheet1.title
獲取工作表行數(shù):rows = sheet1.max_row
獲取工作表列數(shù):cols = sheet1.max_column
獲取某一單元格內(nèi)容:cell =?sheet.cell(1,2).value、sheet['單元格'].value例如sheet['B1'].value
假設(shè)有一fruit2.xlsx邻薯,除后綴名其他與上述fruit.xls完全一樣
import openpyxl
book = openpyxl.load_workbook('fruit2.xlsx')print('所有sheet頁名稱:',book.sheetnames)?
sheet = book.worksheets[0]
sheet2 = book['Sheet1']
sheet3 = book[book.sheetnames[0]]print('工作表名稱:',sheet3.title)
rows = sheet.max_row
cols = sheet.max_columnprint('該工作表有%d行春感,%d列.'%(rows,cols))# 執(zhí)行結(jié)果# 所有sheet頁名稱: ['Sheet1', 'Sheet2', 'Sheet3']# 工作表名稱: Sheet1# 該工作表有5行岗照,3列.
2.行和列生成器
對于xlrd模塊來說,可直接通過sheet.row[i]和sheet.col[i]獲取行和列的內(nèi)容温艇,但是對于openpyxl模塊來說,無法直接獲取某一行或列的內(nèi)容堕汞,openpyxl模塊的sheet.rows和sheet.columns表示行和列的生成器勺爱,即generator object,需要通過循環(huán)或轉(zhuǎn)換成列表讯检、元組的形式得到行或列的值琐鲁。
print(sheet.rows,sheet.columns)forcolin sheet.columns:
? ? print(col)forrowin sheet.rows:
? ? foriin row:
? ? ? ? print(i.value,end='')
? ? print()# 執(zhí)行結(jié)果# <generator object Worksheet._cells_by_row at 0x00000230E011A2A0> <generator object Worksheet._cells_by_col at 0x00000230E102FC00># (<Cell 'Sheet1'.A1>, <Cell 'Sheet1'.A2>, <Cell 'Sheet1'.A3>, <Cell 'Sheet1'.A4>, <Cell 'Sheet1'.A5>)# (<Cell 'Sheet1'.B1>, <Cell 'Sheet1'.B2>, <Cell 'Sheet1'.B3>, <Cell 'Sheet1'.B4>, <Cell 'Sheet1'.B5>)# (<Cell 'Sheet1'.C1>, <Cell 'Sheet1'.C2>, <Cell 'Sheet1'.C3>, <Cell 'Sheet1'.C4>, <Cell 'Sheet1'.C5>)# 名稱? 單價/元? 庫存/kg# 蘋果? 8? 150# 梨? 3.5? 130# 香蕉? 4.5? 100# 橘子? 3.8? 300
如果要獲取某一行或者列的內(nèi)容,可將行人灼、列生成器對象轉(zhuǎn)換成列表或者元組围段,再循環(huán)列表或者元組得到內(nèi)容。
前面說過openpyxl模塊的行和列都從1開始投放,但是由于將生成器轉(zhuǎn)化成了列表list(sheet.rows)奈泪,而列表的索引從0開始,因此list(sheet.rows)[1]還是表示第二行的內(nèi)容灸芳,不是第一行的內(nèi)容涝桅。
foriinlist(sheet.rows)[1]:
? ? print(i.value,end='')print()foriin list(sheet.columns)[0]:
? ? print(i.value,end='')# 執(zhí)行結(jié)果# 蘋果? 8? 150# 名稱? 蘋果? 梨? 香蕉? 橘子
獲取單元格的內(nèi)容
print(sheet.cell(1,2).value)#第一行第二列單元格的內(nèi)容print(sheet['a2'].value)#使用excel單元格的表示法,字母不區(qū)分大小寫
3.openpyxl寫excel文件?
創(chuàng)建工作簿:book = openpyxl.Workbook()耗绿,如果寫入中文為亂碼苹支,可添加參數(shù)encoding = 'utf-8'
創(chuàng)建工作表:sheet = book.create_sheet('工作表名稱',0),0表示創(chuàng)建的工作表在工作薄最前面
向單元格寫入內(nèi)容:sheet.cell(m,n,'內(nèi)容1')误阻、sheet.cell(x,y,'內(nèi)容2')
保存工作簿:book.save('excel文件名稱')债蜜,默認保存在py文件相同路徑下,如果該路徑下有相同文件究反,會被新創(chuàng)建的文件覆蓋寻定。
book = openpyxl.Workbook()
sheet = book.create_sheet('Sheet1',0)
proj = ['名稱','單價/元','庫存/kg']
fruit = ['蘋果','香蕉','梨','橘子']
price = [8,3.5,4.5,3.8]
storage = [150,130,300,100]foriin range(len(proj)):
? ? sheet.cell(1,i+1,proj[i])foriin range(len(fruit)):
? ? sheet.cell(i+2,1,fruit[i])foriin range(len(price)):
? ? sheet.cell(i+2,2,price[i])foriin range(len(storage)):
? ? sheet.cell(i+2,3,storage[i])
book.save('fruit2.xlsx')
4.openpyxl修改excel文件
sheet.insert_rows(m)和sheet.insert_cols(n)分別表示在第m行、第n列前面插入行精耐、列
sheet.delete_rows(m)和sheet.delete_cols(n)分別表示刪除第m行狼速、第n列
rows = sheet.max_row
sheet.insert_rows(rows+2)
cherry = ['櫻桃',17,80]? forjin cherry:
? ? sheet.cell(rows+1,cherry.index(j)+1,j)
book.save('fruit2.xlsx')
修改單元格內(nèi)容:sheet.cell(m,n) = '內(nèi)容1'或者sheet['B3'] = '內(nèi)容2'?
sheet.cell(3,2,4)
sheet['B3'] = 5book.save('fruit2.xlsx')
在最后追加行:sheet.append(可迭代對象)
straberry = ['草莓',20,50]
sheet.append(straberry)
book.save('fruit2.xlsx')
三、xlsxwriter 模塊
只能操作xlsx卦停,只能寫向胡。在excel中插入圖片
import matplotlib.pyplot as plt
? 2 import pandas as pd
? 3 import random
? 4 import xlsxwriter
? 5
? 6 ts = pd.Series(random.randrange(10))
? 7 fig = plt.figure()
? 8 ax = fig.add_subplot(1,1,1)
? 9 ts.plot(ax=ax)
10 fig.savefig('foo.png')
11
12 workbook = xlsxwriter.Workbook('pngxls.xlsx')? ? # 創(chuàng)建excel文件
13 worksheet1 = workbook.add_worksheet('png')? # 括號內(nèi)為工作表表名
14 # 第一個參數(shù)是插入的起始單元格恼蓬,第二個參數(shù)是圖片你文件的絕對路徑
15 worksheet1.write('A1','hello')
16 worksheet1.insert_image('B2','foo.png')
18 workbook.close()
xlrd、xlwt和openpyxl處理excel文件僵芹,在寫入文件的時候不如pandas簡單处硬,pandas處理excel文件見另外一篇博客https://www.cnblogs.com/Forever77/p/11298173.html