1. 前言
日常自動(dòng)化辦公中枉圃,使用 Python 真的能做到事半功倍蹂楣!
在上一個(gè)系列中,我們對(duì) Python 操作 Excel 進(jìn)行了一次全面總結(jié)
最全總結(jié) | 聊聊 Python 辦公自動(dòng)化之 Excel(上)
最全總結(jié) | 聊聊 Python 辦公自動(dòng)化之 Excel(中)
最全總結(jié) | 聊聊 Python 辦公自動(dòng)化之 Excel(下)
從本篇文章開始讯蒲,我們繼續(xù)聊聊另外一種常見的文檔格式:Word
2. 準(zhǔn)備
Python 操作 Word 最常見的依賴庫(kù)是:python-docx
所以,在開始操作之前肄扎,我們需要在虛擬環(huán)境下安裝這個(gè)依賴庫(kù)
# 安裝依賴
pip3 install python-docx
3. 寫入實(shí)戰(zhàn)
我們需要了解一個(gè) Word 文檔的頁(yè)面結(jié)構(gòu)
它們分別是:
文檔 - Document
章節(jié) - Section
段落 - Paragraph
文字塊 - Run
經(jīng)常操作的數(shù)據(jù)類型包含:段落墨林、標(biāo)題、列表犯祠、圖片旭等、表格、樣式
首先衡载,使用 Document 創(chuàng)建一個(gè)文檔對(duì)象搔耕,相當(dāng)于創(chuàng)建一個(gè)空白文檔
from docx import Document
# 1、新建一個(gè)空白文檔
doc = Document()
然后,就可以往文檔中寫入數(shù)據(jù)了
使用文檔對(duì)象的 add_heading(text,level) 方法可以寫入標(biāo)題
其中弃榨,第 1 個(gè)參數(shù)為標(biāo)題內(nèi)容菩收,第 2 個(gè)參數(shù)代表標(biāo)題的級(jí)別
比如:分別寫入一級(jí)標(biāo)題、二級(jí)標(biāo)題鲸睛、三級(jí)標(biāo)題
# 2娜饵、新增內(nèi)容
# 2.1 標(biāo)題
# 分別寫入一個(gè)一級(jí)標(biāo)題,一個(gè)二級(jí)標(biāo)題官辈,一個(gè)三級(jí)標(biāo)題
doc.add_heading('一級(jí)標(biāo)題', 0)
doc.add_heading('二級(jí)標(biāo)題', 1)
doc.add_heading('三級(jí)標(biāo)題', 2)
段落 Paragraph 包含 3 類箱舞,分別是:
普通段落
自定義樣式的段落
引用段落
默認(rèn)情況下,使用文檔對(duì)象的 add_paragraph(text,style) 方法來(lái)添加一個(gè)段落
普通段落:假如第二個(gè)參數(shù) style 沒有傳入拳亿,則代表添加一個(gè)普通的段落
引用段落:對(duì)于引用段落晴股,只需要指定段落樣式為 Intense Quote 即可
# 2.2.1 新增普通段落
doc.add_paragraph("我是一個(gè)普通段落。")
# 2.2.3 新增一個(gè)引用段落
# 只需要指定樣式為:Intense Quote
doc.add_paragraph('--我是一個(gè)引用段落--', style='Intense Quote')
自定義樣式的段落:這里有 2 種實(shí)現(xiàn)方式
分別是:
創(chuàng)建一個(gè)空的段落對(duì)象肺魁,增加文字塊 Run 的時(shí)候电湘,同時(shí)指定字體樣式
使用文檔對(duì)象創(chuàng)建一個(gè)新的樣式(或已經(jīng)存在的樣式),然后添加段落的時(shí)候万搔,設(shè)置到第二個(gè)參數(shù)中
考慮到樣式的樣式的復(fù)用性胡桨,第 2 種方式可能更實(shí)用
對(duì)應(yīng)的方法是:
document.styles.add_style(style_name,type)
以第 2 種實(shí)現(xiàn)方式為例瞬雹,新增一個(gè)自定義樣式的段落酗捌,設(shè)置段落的字體名稱、大小尚镰、顏色狗唉、是否加粗分俯、對(duì)齊方式等
PS:第 1 種實(shí)現(xiàn)方式缸剪,文末源碼會(huì)提供
該方法第 2 個(gè)參數(shù)用來(lái)指定樣式類型杏节,包含 3 種
分別對(duì)應(yīng)關(guān)系如下:
1:段落樣式
2:字符樣式
3:表格樣式
def create_style(document, style_name, style_type, font_size=-1, font_color=None, font_name=None, align=None):
"""
創(chuàng)建一個(gè)樣式
:param align:
:param document:
:param style_name: 樣式名稱
:param style_type: 樣式類型奋渔,1:段落樣式, 2:字符樣式, 3:表格樣式
:param font_name:
:param font_color:
:param font_size:
:return:
"""
if font_color is None:
font_color = []
# 注意:必須要判斷樣式是否存在卒稳,否則重新添加會(huì)報(bào)錯(cuò)
style_names = [style.name for style in document.styles]
if style_name in style_names:
# print('樣式已經(jīng)存在充坑,不需要重新添加捻爷!')
return
font_style = document.styles.add_style(style_name, style_type)
# 字體大小
if font_size != -1:
font_style.font.size = Pt(font_size)
# 字體顏色
# 比如:[0xff,0x00,0x00]
if font_color and len(font_color) == 3:
font_style.font.color.rgb = RGBColor(font_color[0], font_color[1], font_color[2])
# 對(duì)齊方式
# 注意:段落也榄、表格才有對(duì)齊方式
if style_type != 2 and align:
font_style.paragraph_format.alignment = align
# font_style.paragraph_format.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
# font_style.paragraph_format.alignment = WD_PARAGRAPH_ALIGNMENT.LEFT
# font_style.paragraph_format.alignment = WD_PARAGRAPH_ALIGNMENT.RIGHT
# 中文字體名稱
if font_name:
font_style.font.name = font_name
font_style._element.rPr.rFonts.set(qn('w:eastAsia'), font_name)
return font_style
需要注意的是甜紫,新添加的樣式的時(shí)候囚霸,必須先判斷樣式名稱是否存在拓型,否則會(huì)報(bào)錯(cuò)
最后,添加段落的時(shí)候册养,將上面創(chuàng)建的樣式傳入到第 2 個(gè)參數(shù)中即可
使用 add_paragraph() 方法添加一個(gè)段落球拦,返回值為一個(gè)段落對(duì)象
該對(duì)象同樣可以使用 add_run(text,style) 方法坎炼,在段落后追加文字塊 Run 并指定樣式
# 1/段落樣式
style_paragraph = create_style(document=doc, style_name="style2", style_type=1, font_size=30,
font_color=[0xff, 0x00, 0x00])
# 2/字符樣式
style_string = create_style(document=doc, style_name="style3", style_type=2, font_size=15,
font_color=[0x00, 0xff, 0x00])
# 3/表格樣式
# 對(duì)齊方式為:居中
style_table = create_style(document=doc, style_name="style4", style_type=3, font_size=25,
font_color=[0x00, 0x00, 0xff], align=WD_PARAGRAPH_ALIGNMENT.CENTER)
current_paragraph = doc.add_paragraph("我是一個(gè)自帶樣式的段落(方式二)!?蠊尽碳柱!", style_paragraph)
# 字符樣式
current_paragraph.add_run("【段落2中的部分字符】", style_string)
Word 文檔中,有序列表和無(wú)序列表也比較常用
事實(shí)上福稳,和添加段落類似的圆,添加列表同樣是使用文檔對(duì)象的 add_paragraph() 方法越妈,指定不同的樣式 style 來(lái)添加
其中钮糖,
有序列表:List Number
無(wú)序列表:List Bullet
def add_list(document, data, isorder):
"""
將列表數(shù)據(jù)添加到無(wú)序列表/有序列表中
:param document: 文檔對(duì)象
:param data: 列表數(shù)據(jù)
:param isorder: 是否有序列表
:return:
"""
# 無(wú)序列表
if not isorder:
for item in data:
document.add_paragraph(item, style='List Bullet')
else:
# 有序列表
for item in data:
document.add_paragraph(item, style='List Number')
# 2.3 列表
# 2.3.1 無(wú)序列表
add_list(doc, ["無(wú)序-Item1", "無(wú)序-Item2", "無(wú)序-Item3"], False)
# 2.3.2 有序列表
add_list(doc, ["有序-Item1", "有序-Item2", "有序-Item3"], True)
接下來(lái)阎抒,我們看看如何在文檔中插入圖片
使用方法:
add_picture(image,widht,height)
其中消痛,
第 1 個(gè)參數(shù)代表圖片路徑或者圖片流(網(wǎng)絡(luò)圖片)
第 2肄满、3 個(gè)參數(shù)用于設(shè)置圖片的寬稠歉、高
需要注意的是,如果沒有顯式指定寬高带饱,則以圖片原生尺寸展示勺疼;如果僅設(shè)置了其中一個(gè)执庐,則會(huì)按照設(shè)置的一個(gè)做等比縮放顯示
寫入本地圖片很簡(jiǎn)單
def add_local_image(doc, image_path, width=None, height=None):
"""
增加本地圖片到Word文檔中
:param doc:
:param image_path:
:param width:
:param height:
:return:
"""
doc.add_picture(image_path, width=None if width is None else Inches(width),
height=None if height is None else Inches(height))
# 2.4.1 插入本地圖片
add_local_image(doc, './1.png', width=2)
對(duì)于網(wǎng)絡(luò)圖片轨淌,我們需要先通過(guò)網(wǎng)絡(luò)圖片地址,獲取圖片字節(jié)流盟步,傳入到第一個(gè)參數(shù)中即可
import ssl
from io import BytesIO
def get_image_data_from_network(url):
"""
獲取網(wǎng)絡(luò)圖片字節(jié)流
:param url: 圖片地址
:return:
"""
ssl._create_default_https_context = ssl._create_unverified_context
# 獲取網(wǎng)絡(luò)圖片的字節(jié)流
image_data = BytesIO(urlopen(url).read())
return image_data
def add_network_image(doc, image_url, width=None, height=None):
"""
增加本地圖片到Word文檔中
:param doc:
:param image_url:
:param width:
:param height:
:return:
"""
# 獲取圖片流
image_data = get_image_data_from_network(image_url)
doc.add_picture(image_data, width=None if width is None else Inches(width),
height=None if height is None else Inches(height))
# 2.4.2 插入網(wǎng)絡(luò)圖片
url = '圖片URL地址'
add_network_image(doc, url, width=3)
最后却盘,我們看看如何在文檔中插入表格
使用方法:
add_table(row_num,column_num,style=None)
返回值:表格對(duì)象 <class 'docx.table.Table'>
其中黄橘,
第 1 個(gè)參數(shù):表格的行數(shù)目
第 2 個(gè)參數(shù):表格的列數(shù)目
第 3 個(gè)參數(shù):表格的樣式
使用行/列索引旬陡,可以獲取表格中某一行/列所有的單元格對(duì)象組成的列表
# 添加一個(gè)table表格
table = doc.add_table(***)
# 通過(guò)行/列索引描孟,獲取某一行/列的所有單元格對(duì)象
# 第一行所有單元格對(duì)象列表
head_cells = table.rows[0].cells
另外匿醒,表格對(duì)象使用 add_row()廉羔、add_column() 方法可以追加一行/列
以指定表頭僻造、表數(shù)據(jù)髓削,插入一張表為例
def add_table(doc, head_datas, datas, style=None):
"""
新增一個(gè)表格
:param doc:
:param head_datas: 表頭
:param datas: 數(shù)據(jù)
:param style:
:return:
"""
# 新增一個(gè)表格
# 表格所有樣式大全:https://blog.csdn.net/ibiao/article/details/78595295
# 默認(rèn)樣式為:Table Grid
table = doc.add_table(rows=1, cols=len(head_datas), style=("Table Grid" if style is None else style))
# 第一行所有單元格對(duì)象列表
head_cells = table.rows[0].cells
# 寫入數(shù)據(jù)到表頭中
for index, head_item in enumerate(head_datas):
head_cells[index].text = head_item
# 遍歷數(shù)據(jù)并寫入數(shù)據(jù)
for data in datas:
# 單獨(dú)添加一行或者列:add_row立膛、add_column
row_cells = table.add_row().cells
for index, cell in enumerate(row_cells):
cell.text = str(data[index])
# 2.5 表格
head_datas = ["姓名", "年齡", "地區(qū)"]
datas = (
('張三', 18, '深圳'),
('李四', 28, '北京'),
('王五', 33, '上海'),
('孫六', 42, '廣州')
)
# 新增一個(gè)表格,并指定樣式
# add_table(doc, head_datas, datas, style_table)
add_table(doc, head_datas, datas)
需要指出的是好啰,表格默認(rèn)采用的樣式是 Table Grid框往,也可以使用上面的方法自定義一個(gè)表格樣式闯捎,插入表格的同時(shí)設(shè)置進(jìn)去即可
4. 最后
本篇文章就 Word 寫入數(shù)據(jù)的常規(guī)操作進(jìn)行了一次全面梳理,更多功能包含:讀取、修改沐飘、查找牲迫、刪除等實(shí)戰(zhàn)內(nèi)容后面會(huì)持續(xù)輸出
要獲取全部源碼盹憎,關(guān)注公眾號(hào)「 AirPython 」陪每,后臺(tái)回復(fù)「 word 」即可獲得全部源碼
如果你覺得文章還不錯(cuò)檩禾,請(qǐng)大家 點(diǎn)贊盼产、分享、留言下侨核,因?yàn)檫@將是我持續(xù)輸出更多優(yōu)質(zhì)文章的最強(qiáng)動(dòng)力搓译!
推薦閱讀
最全總結(jié) | 聊聊 Python 辦公自動(dòng)化之 Excel(上)