Python 轉(zhuǎn)換PDF到Excel

PDF主要是面向展示和打印使用星立,并不需要文檔被編輯,所以很多編輯的屬性丟失了。當(dāng)您需要分析或修改PDF文檔數(shù)據(jù)時扭仁,您會發(fā)現(xiàn)PDF特別難操作炊琉≌沟伲可以將PDF保存為Excel工作簿,實現(xiàn)輕松編輯數(shù)據(jù)的需求。PDF轉(zhuǎn)Excel锰悼,技術(shù)關(guān)鍵就是提取原文檔內(nèi)的表格數(shù)據(jù)柳骄,保證轉(zhuǎn)換前后數(shù)據(jù)的一致性,方便復(fù)制粘貼及可輕松編輯箕般。本文將介紹如何使用 Spire.PDF for Python 在 Python 中實現(xiàn)PDF轉(zhuǎn) Excel夹界。

安裝 Spire.PDF for Python

本教程需要用到 Spire.PDF for Python“溃可通過以下 pip 命令將它們輕松安裝到 VS Code 中可柿。

pip install Spire.PDF

Spire.PDF for Python 提供的 PdfDocument.SaveToFile() 方法能將 PDF 文件保存為 Excel 格式。以下是如何使用 Spire.PDF for Python 將 PDF 文檔轉(zhuǎn)換為 Excel XLSX 格式并指定轉(zhuǎn)換選項的具體步驟:

  • 創(chuàng)建一個 PdfDocument 對象
  • 使用 PdfDocument.LoadFromFile() 方法加載 PDF 文檔丙者。
  • 創(chuàng)建一個 XlsxLineLayoutOptions 對象复斥,并將相應(yīng)的參數(shù)傳遞給 XlsxLineLayoutOptions 類的構(gòu)造函數(shù),以指定轉(zhuǎn)換選項械媒。
  • 使用 PdfDocument.ConvertOptions.SetPdfToXlsxOptions() 方法應(yīng)用轉(zhuǎn)換選項目锭。
  • 使用 PdfDocument.SaveToFile() 方法將 PDF 文檔保存為 Excel XLSX 格式。
from spire.pdf.common import *
from spire.pdf import *

# 創(chuàng)建PdfDocument對象
pdf = PdfDocument()

# 加載PDF文檔
pdf.LoadFromFile("Sample.pdf")

# 創(chuàng)建 XlsxLineLayoutOptions 對象來指定轉(zhuǎn)換選項
# 參數(shù): convertToMultipleSheet, rotatedText, splitCell, wrapText, overlapText
convertOptions = XlsxLineLayoutOptions(True, True, False, True, False)

# 設(shè)置轉(zhuǎn)換選項
pdf.ConvertOptions.SetPdfToXlsxOptions(convertOptions)

# 將PDF文檔保存為Excel XLSX格式
pdf.SaveToFile("PdftoExcel.xlsx", FileFormat.XLSX)
pdf.Close()

將 PDF保存為Excel后纷捞,轉(zhuǎn)換后可以輕松提取文檔里面的數(shù)據(jù)痢虹。效果圖如下

Convert PDF to Excel.png

除了將PDF保存為Excel, Spire.PDF for python組件還支持將PDF 存為OFD, PDF文檔轉(zhuǎn)換為Word, 將PDF另存為圖片,如PDF to PNG, JPG主儡,BMP等奖唯。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市糜值,隨后出現(xiàn)的幾起案子丰捷,更是在濱河造成了極大的恐慌,老刑警劉巖寂汇,帶你破解...
    沈念sama閱讀 211,884評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件病往,死亡現(xiàn)場離奇詭異,居然都是意外死亡骄瓣,警方通過查閱死者的電腦和手機(jī)停巷,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,347評論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來榕栏,“玉大人畔勤,你說我怎么就攤上這事【矢啵” “怎么了硼被?”我有些...
    開封第一講書人閱讀 157,435評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長渗磅。 經(jīng)常有香客問我嚷硫,道長检访,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,509評論 1 284
  • 正文 為了忘掉前任仔掸,我火速辦了婚禮脆贵,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘起暮。我一直安慰自己卖氨,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,611評論 6 386
  • 文/花漫 我一把揭開白布负懦。 她就那樣靜靜地躺著筒捺,像睡著了一般。 火紅的嫁衣襯著肌膚如雪纸厉。 梳的紋絲不亂的頭發(fā)上系吭,一...
    開封第一講書人閱讀 49,837評論 1 290
  • 那天,我揣著相機(jī)與錄音颗品,去河邊找鬼肯尺。 笑死,一個胖子當(dāng)著我的面吹牛躯枢,可吹牛的內(nèi)容都是我干的则吟。 我是一名探鬼主播,決...
    沈念sama閱讀 38,987評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼锄蹂,長吁一口氣:“原來是場噩夢啊……” “哼氓仲!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起败匹,我...
    開封第一講書人閱讀 37,730評論 0 267
  • 序言:老撾萬榮一對情侶失蹤寨昙,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后掀亩,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,194評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡欢顷,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,525評論 2 327
  • 正文 我和宋清朗相戀三年槽棍,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片抬驴。...
    茶點故事閱讀 38,664評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡炼七,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出布持,到底是詐尸還是另有隱情豌拙,我是刑警寧澤,帶...
    沈念sama閱讀 34,334評論 4 330
  • 正文 年R本政府宣布题暖,位于F島的核電站按傅,受9級特大地震影響捉超,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜唯绍,卻給世界環(huán)境...
    茶點故事閱讀 39,944評論 3 313
  • 文/蒙蒙 一拼岳、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧况芒,春花似錦惜纸、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,764評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至压汪,卻和暖如春粪牲,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背蛾魄。 一陣腳步聲響...
    開封第一講書人閱讀 31,997評論 1 266
  • 我被黑心中介騙來泰國打工虑瀑, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人滴须。 一個月前我還...
    沈念sama閱讀 46,389評論 2 360
  • 正文 我出身青樓舌狗,卻偏偏與公主長得像,于是被迫代替她去往敵國和親扔水。 傳聞我的和親對象是個殘疾皇子痛侍,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,554評論 2 349

推薦閱讀更多精彩內(nèi)容