pdf合并工具

最近需要合并大量的pdf, 找了幾個工具,要么收費,要么不好用,然后就自己寫了簡單功能的小工具.
特點就是把當前目錄及子目錄下的所有pdf文件合并成一個merged.pdf (比如你直接放在D盤根目錄會把你D盤里面的所有pdf全部合并成一個, 會很占內存和時間)
除了方便打印我也不知道有什么其他的作用, 反正我就是拿來打印的

已知BUG

  1. 某些特殊編碼的pdf合并會失敗(沒找到解決辦法), 而且也無法確定是哪一個文件---整個文件保存失敗也就是完全無法合并
  2. 某些pdf會因為不知道什么原因無法讀取xref,無法打開 --- 解決辦法 : 使用瀏覽器或者其他什么可以打開pdf的程序確定程序可以打開, 然后點擊打印, 通過虛擬打印機再保存出來, 就可以修復了.

如果你嫌棄他會輸出很多警告信息的話可以去pypdf4包的源碼中把那些警告輸出注釋掉, 具體方法就不講了, 如果有需要可以私信我

提供天翼網(wǎng)盤連接:https://cloud.189.cn/t/A73QzqmQRjMz (訪問碼:kpo0)

寫的很簡單, 高手勿噴

為大佬提供源碼:

import re
from PyPDF4.pdf import PdfFileReader as pr, PdfFileWriter as pw
 
 
def MergePDF(dir_path):
    pdf_files = list()
    merged_file = pw()
    for path, _, files in os.walk(dir_path):
        pdf_files.extend([os.path.join(path, f)
                          for f in files if f.lower().endswith('.pdf')])  # 遍歷當前文件夾下所有pdf文件并組合成相對路徑
 
    pdf_files.sort(key=lambda i: int(re.findall(r'(\d+).*?', i)
                                     [0]) if re.findall(r'(\d+).*?', i) else -1)  # 按照路徑排序(沒有數(shù)字的在前面, 有數(shù)字的從小到大排序)
 
    for pdf_file in pdf_files:
        print(pdf_file)
        try:
            pdf = pr(open(pdf_file, "rb"))
        except:
            print(f'{pdf_file}無法解析')
            continue
        if pdf.isEncrypted:
            print(f'{pdf_file} 是加密文件')
            res = input('輸入密碼(回車鍵跳過)')
            while res:
                try:
                    pdf.decrypt(res)  # pdf 解密
                    break
                except:
                    print('密碼錯誤')
                res = input('輸入密碼(回車鍵跳過)')
            if not res:
                continue
        pageCount = pdf.getNumPages()
        # 分別將page添加到輸出output中
        for iPage in range(pageCount):
            merged_file.addPage(pdf.getPage(iPage))
    with open('merged.pdf', "wb") as outputfile:
        # 注意這里的寫法和正常的上下文文件寫入是相反的
        merged_file.write(outputfile)
    print('Done')
    input()
 
 
if __name__ == '__main__':
    # 設置存放多個pdf文件的文件夾
    dir_path = r'.'
    MergePDF(dir_path)
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市庸推,隨后出現(xiàn)的幾起案子锯蛀,更是在濱河造成了極大的恐慌紊册,老刑警劉巖票彪,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件乔妈,死亡現(xiàn)場離奇詭異魔策,居然都是意外死亡,警方通過查閱死者的電腦和手機蜒车,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進店門讳嘱,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人酿愧,你說我怎么就攤上這事沥潭。” “怎么了嬉挡?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵钝鸽,是天一觀的道長汇恤。 經(jīng)常有香客問我,道長拔恰,這世上最難降的妖魔是什么因谎? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮颜懊,結果婚禮上财岔,老公的妹妹穿的比我還像新娘。我一直安慰自己河爹,他們只是感情好匠璧,可當我...
    茶點故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著昌抠,像睡著了一般患朱。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上炊苫,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天裁厅,我揣著相機與錄音,去河邊找鬼侨艾。 笑死执虹,一個胖子當著我的面吹牛,可吹牛的內容都是我干的唠梨。 我是一名探鬼主播袋励,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼当叭!你這毒婦竟也來了茬故?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤蚁鳖,失蹤者是張志新(化名)和其女友劉穎磺芭,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體醉箕,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡钾腺,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了讥裤。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片放棒。...
    茶點故事閱讀 37,997評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖己英,靈堂內的尸體忽然破棺而出间螟,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布寒亥,位于F島的核電站邮府,受9級特大地震影響,放射性物質發(fā)生泄漏溉奕。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一忍啤、第九天 我趴在偏房一處隱蔽的房頂上張望加勤。 院中可真熱鬧,春花似錦同波、人聲如沸鳄梅。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽戴尸。三九已至,卻和暖如春冤狡,著一層夾襖步出監(jiān)牢的瞬間孙蒙,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工悲雳, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留挎峦,地道東北人。 一個月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓合瓢,卻偏偏與公主長得像坦胶,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子晴楔,可洞房花燭夜當晚...
    茶點故事閱讀 42,722評論 2 345