前言
大家好卸勺,我是查理浆劲。
想必各位小伙伴都經歷過嫌术,當你想要把PDF轉為WORD時,幾個大字赫然甩在你眼前:
不充錢就想白嫖牌借?度气?想得美~
然而,查理是這么輕易像資本低頭的嗎膨报?畢竟迎難而上才是我們的傳統(tǒng)美德磷籍。于是,今天的主題出來了:用python寫一個PDF轉WORD的小工具(基于某網站接口)现柠。
一院领、思路分析
網上一搜,你可以發(fā)現很多PDF轉換的工具够吩,其中不乏在線轉換的網站比然,比如這樣的:
但是呢,這樣的在線網站一般不是廣告特多周循,就是效率低强法,有的甚至都打不開。
我馬上想到湾笛,既然有Python在手饮怯,何不如直接直接寫一個呢?
那么迄本,通過網站提供的測試接口硕淑,我們便可以通過爬蟲模擬的方式實現轉換。
沒有錯了~思路就是如此的簡單明了,今天的主角便是:
https://app.xunjiepdf.com
通過抓包分析置媳,知道這是一個POST請求于樟,接下來用requests庫模擬即可。
需要注意的是拇囊,這個接口僅用于測試迂曲,所以可供轉換的頁面等都有所限制,如需更完整的功能還請支持原版寥袭。
二路捧、我的代碼
正所謂一萬個coders,就有一萬種codes传黄,以下為我的代碼杰扫,僅供參考。
導入相關庫:
import time
定義PDF2Word類:
class PDF2Word():
執(zhí)行主函數:
if __name__=='__main__':
注意:convertPDF函數有兩個參數膘掰,第一個為需要轉換的PDF章姓,第二個參數為轉換后的目錄。
run一下识埋,一鍵入魂凡伊,".docx"文件已經躺在了我的目錄中,舒服了~
寫在最后
無論如何窒舟,最后非常感謝大家點擊觀看我的文章系忙,如過對你有幫助煩請?zhí)∈纸o小編點點贊。有任何問題或者需要文章內的資料可以后臺私信我惠豺,歡迎“騷擾”银还。