Python辦公自動化|從Excel到Word

Python辦公自動化|從Excel到Word

轉(zhuǎn)自:Python數(shù)據(jù)科學(xué)

前言

在前幾天的文章中我們講解了如何從Word表格中提取指定數(shù)據(jù)并按照格式保存到Excel中淫半,今天我們將再次以一位讀者提出的真實需求來講解如何使用Python從 Excel 中計算廓奕、整理數(shù)據(jù)并寫入 Word中封恰,其實并不難茵烈,主要就是以下兩步:

  • openpyxl讀取Excel獲取內(nèi)容

  • docx讀寫Word文件

那我們開始吧执虹!

需求確認

首先來看下我們需要處理的Excel部分數(shù)據(jù)弹澎,因涉及隱私已經(jīng)將數(shù)據(jù)皮卡丘化

image

可以看到數(shù)據(jù)非常多,并且還存在重復(fù)數(shù)據(jù)哎垦。而我們要做的就是對每一列的數(shù)據(jù)按照一定的規(guī)則進行計算、整理并使用Python自動填入到Word中恃疯,大致的要求如下

image
image

上面僅是部分要求漏设,真實需要填入word中的數(shù)據(jù)要更多!

image

除了對按照格式進行處理并存入Word中指定位置之外今妄,還有一個需求:最終輸出的word文件名還需要按照一定規(guī)則生成:

image

OK郑口,需求分析完畢,接下來看Python如何解決蛙奖!

Python實現(xiàn)

首先我們使用Python對該Excel進行解析

from openpyxl import load_workbook
import os
# 獲取桌面的路徑
def GetDesktopPath():
    return os.path.join(os.path.expanduser("~"), 'Desktop')

path = GetDesktopPath() + '/資料/' # 形成文件夾的路徑便后續(xù)重復(fù)使用
workbook = load_workbook(filename=path + '數(shù)據(jù).xlsx')
sheet = workbook.active # 獲取當(dāng)前頁
# 可以用代碼獲取數(shù)據(jù)范圍潘酗,如果要批處理循環(huán)迭代也方便
# 獲取有數(shù)據(jù)范圍
print(sheet.dimensions)
# A1:W10

利用openpyxl讀取單元格有以下幾種用法

cells = sheet['A1:A4']  # 返回A1-A4的4個單元格
cells = sheet['A'] # 獲取A列
cells = sheet['A:C'] # 獲取A-C列
cells = sheet[5] # 獲取第5行
# 注意如果是上述用cells獲取返回的是嵌套元祖
for cell in cells:
    print(cell[0].value) # 遍歷cells依然需要取出元祖中元素才可以獲取值
# 獲取一個范圍的所有cell
# 也可以用iter_col返回列
for row in sheet.iter_rows(min_row=1, max_row=3,min_col=2, max_col=4):
    for cell in row:
        print(cell.value)

明白了原理我們就可以解析獲取Excel中的數(shù)據(jù)了

# SQE
SQE = sheet['Q2'].value
# 供應(yīng)商&制造商
supplier = sheet['G2'].value
# 采購單號
C2_10 = sheet['C2:C10'] # 返回cell.tuple對象
# 利用列表推導(dǎo)式后面同理
vC2_10 = [str(cell[0].value) for cell in C2_10]
# 用set簡易去重后用,連接,填word表用
order_num = ','.join(set(vC2_10))
# 用set簡易去重后用&連接雁仲,word文件名命名使用
order_num_title = '&'.join(set(vC2_10))
# 產(chǎn)品型號
T2_10 = sheet['T2:T10']
vT2_10 = [str(cell[0].value) for cell in T2_10]
ptype = ','.join(set(vT2_10))
# 產(chǎn)品描述
P2_10 = sheet['P2:P10']
vP2_10 = [str(cell[0].value) for cell in P2_10]
info = ','.join(set(vP2_10))
info_title = '&'.join(set(vP2_10))
# 日期
# 用datetime庫獲取今日時間以及相應(yīng)格式化
import datetime
today = datetime.datetime.today()
time = today.strftime('%Y年%m月%d日')
# 驗貨數(shù)量
V2_10 = sheet['V2:V10']
vV2_10 = [int(cell[0].value) for cell in V2_10]
total_num = sum(vV2_10) # 計算總數(shù)量
# 驗貨箱數(shù)
W2_10 = sheet['W2:W10']
vW2_10 = [int(cell[0].value) for cell in W2_10]
box_num = sum(vW2_10)
# 生成最終需要的word文件名
title = f'{order_num_title}-{supplier}-{total_num}-{info_title}-{time}-驗貨報告'
print(title)

通過上面的代碼,我們就成功的從Excel中提取出來數(shù)據(jù)琐脏,這樣Excel部分就結(jié)束了攒砖,接下來進行word的填表啦,由于這里我們默認讀取的word是.docx格式的日裙,實際上讀者的需求是.doc格式文件吹艇,所以windows用戶可以用如下代碼批量轉(zhuǎn)化doc,前提是安裝好win32com

# pip install pypiwin32
from win32com import client
docx_path = path + '模板.docx'
# doc轉(zhuǎn)docx的函數(shù)
def doc2docx(doc_path,docx_path):
    word = client.Dispatch("Word.Application")
    doc = word.Documents.Open(doc_path)
    doc.SaveAs(docx_path, 16)
    doc.Close()
    word.Quit()
    print('\n doc文件已轉(zhuǎn)換為docx \n')
if not os.path.exists(docx_path):
    doc2docx(docx_path[:-1], docx_path)

不過在Mac下暫時沒有好的解決策略昂拂,如果有思路歡迎交流受神,好了有docx格式文件后我們繼續(xù)操作Word部分。

docx_path = path + '模板.docx'
from docx import Document
# 實例化
document = Document(docx_path)
# 讀取word中的所有表格
tables = document.tables
# print(len(tables))
# 15

確定好每個表格數(shù)后即可進行相應(yīng)的填報操作格侯,table的用法和openpyxl中非常類似鼻听,注意索引和原生python一樣都是從0開始。

tables[0].cell(1, 1).text = SQE
tables[1].cell(1, 1).text = supplier
tables[1].cell(2, 1).text = supplier
tables[1].cell(3, 1).text = ptype
tables[1].cell(4, 1).text = info
tables[1].cell(5, 1).text = order_num
tables[1].cell(7, 1).text = time

上面代碼完成Word中這一部分表格


image

我們繼續(xù)用Python填寫下一個表格

for i in range(2, 11):
    tables[6].cell(i, 0).text = str(sheet[f'T{i}'].value)
    tables[6].cell(i, 1).text = str(sheet[f'P{i}'].value)
    tables[6].cell(i, 2).text = str(sheet[f'C{i}'].value)
    tables[6].cell(i, 4).text = str(sheet[f'V{i}'].value)
    tables[6].cell(i, 5).text = str(sheet[f'V{i}'].value)
    tables[6].cell(i, 6).text = '0'
    tables[6].cell(i, 7).text = str(sheet[f'W{i}'].value)
    tables[6].cell(i, 8).text = '0'

tables[6].cell(12, 4).text = str(total_num)
tables[6].cell(12, 5).text = str(total_num)
tables[6].cell(12, 7).text = str(box_num)
image

這里需要注意兩個細節(jié):

  • word寫入的數(shù)據(jù)需是字符串联四,所以從Excel獲取的數(shù)據(jù)需要用str格式化

  • 表格可能存在合并等其他情況撑碴,因此你看到的行數(shù)和列數(shù)可能不是真實的,需要用代碼不斷測試朝墩。

按照上面的辦法醉拓,將之前從Excel中取出來的數(shù)據(jù)一一填充到Word中對應(yīng)位置就大功告成!最后保存一下即可收苏。

document.save(path + f'{title}.docx')
print('\n文件已生成')

結(jié)束語

回顧上面的過程亿卤,其實從需求和文件格式上看,這次文件的讀寫解析任務(wù)較復(fù)雜鹿霸,碼代碼和思考時間會較久排吴,所以當(dāng)我們在考慮使用Python進行辦公自動化之前需要想清楚這個問題:這次需要完成的任務(wù)是否工作量很多,或者以后長期需要進行杜跷,用Python是否可以 解放雙手傍念?如果不是矫夷,實際上手動就可以完成,那么就失去了自動化辦公的意義憋槐!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末双藕,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子阳仔,更是在濱河造成了極大的恐慌忧陪,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,755評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件近范,死亡現(xiàn)場離奇詭異嘶摊,居然都是意外死亡,警方通過查閱死者的電腦和手機评矩,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,305評論 3 395
  • 文/潘曉璐 我一進店門叶堆,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人斥杜,你說我怎么就攤上這事虱颗。” “怎么了蔗喂?”我有些...
    開封第一講書人閱讀 165,138評論 0 355
  • 文/不壞的土叔 我叫張陵忘渔,是天一觀的道長。 經(jīng)常有香客問我缰儿,道長畦粮,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,791評論 1 295
  • 正文 為了忘掉前任乖阵,我火速辦了婚禮宣赔,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘义起。我一直安慰自己拉背,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,794評論 6 392
  • 文/花漫 我一把揭開白布默终。 她就那樣靜靜地躺著椅棺,像睡著了一般。 火紅的嫁衣襯著肌膚如雪齐蔽。 梳的紋絲不亂的頭發(fā)上两疚,一...
    開封第一講書人閱讀 51,631評論 1 305
  • 那天,我揣著相機與錄音含滴,去河邊找鬼诱渤。 笑死,一個胖子當(dāng)著我的面吹牛谈况,可吹牛的內(nèi)容都是我干的勺美。 我是一名探鬼主播递胧,決...
    沈念sama閱讀 40,362評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼丛忆,長吁一口氣:“原來是場噩夢啊……” “哼钾麸!你這毒婦竟也來了洁段?” 一聲冷哼從身側(cè)響起丑勤,我...
    開封第一講書人閱讀 39,264評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎是牢,沒想到半個月后痴荐,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體烘豌,經(jīng)...
    沈念sama閱讀 45,724評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡华蜒,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年辙纬,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片叭喜。...
    茶點故事閱讀 40,040評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡贺拣,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出捂蕴,到底是詐尸還是另有隱情纵柿,我是刑警寧澤,帶...
    沈念sama閱讀 35,742評論 5 346
  • 正文 年R本政府宣布启绰,位于F島的核電站,受9級特大地震影響沟使,放射性物質(zhì)發(fā)生泄漏委可。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,364評論 3 330
  • 文/蒙蒙 一腊嗡、第九天 我趴在偏房一處隱蔽的房頂上張望着倾。 院中可真熱鬧,春花似錦燕少、人聲如沸卡者。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,944評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽崇决。三九已至,卻和暖如春底挫,著一層夾襖步出監(jiān)牢的瞬間恒傻,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,060評論 1 270
  • 我被黑心中介騙來泰國打工建邓, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留盈厘,地道東北人。 一個月前我還...
    沈念sama閱讀 48,247評論 3 371
  • 正文 我出身青樓官边,卻偏偏與公主長得像沸手,于是被迫代替她去往敵國和親外遇。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,979評論 2 355

推薦閱讀更多精彩內(nèi)容