pdf提取時(shí)部分字體無(wú)法顯示問(wèn)題處理

import fitz
import os
import shutil


def flatten_pdf_form(input_pdf_path):
    """將PDF表單字段轉(zhuǎn)換為只讀文本抽减,并將內(nèi)容轉(zhuǎn)換為圖片形式"""
    # 創(chuàng)建臨時(shí)文件路徑
    temp_path = input_pdf_path + ".temp"
    # 打開(kāi)PDF文件
    pdf_document = fitz.open(input_pdf_path)
    # 創(chuàng)建新的PDF文檔
    new_pdf = fitz.open()
    # 遍歷每一頁(yè)
    for page in pdf_document:
        # 創(chuàng)建新頁(yè)面
        new_page = new_pdf.new_page(width=page.rect.width, height=page.rect.height)
        # 首先復(fù)制原始頁(yè)面內(nèi)容
        new_page.show_pdf_page(new_page.rect, pdf_document, page.number)
        # 處理表單字段
        fields = page.widgets()
        for field in fields:
            if field.field_value:
                rect = field.rect
                text = field.field_value
                # 計(jì)算更小的字體大小
                font_size = min(10, 20)
                
                new_page.insert_textbox(
                    rect,  # 文本框區(qū)域
                    text,  # 要顯示的文本
                    fontsize=font_size,  # 字體大小
                    align=1,  # 居中對(duì)齊
                    fontname="msyhbd",  # 使用中文字體
                    fontfile="C:/Windows/Fonts/msyhbd.ttc",  # 指定字體文件路徑
                    color=(0, 0, 0),  # 黑色文本
                )
    # 先保存到臨時(shí)文件
    new_pdf.save(temp_path, garbage=4, deflate=True)
    new_pdf.close()
    pdf_document.close()
    # 刪除原文件并重命名臨時(shí)文件
    os.remove(input_pdf_path)
    os.rename(temp_path, input_pdf_path)
    print(f"已將表單字段轉(zhuǎn)換為圖片并保存")

# 使用示例
input_pdf = r"C:\Users\51952\Downloads\1.pdf"
# 轉(zhuǎn)換PDF
flatten_pdf_form(input_pdf)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末淹遵,一起剝皮案震驚了整個(gè)濱河市腐碱,隨后出現(xiàn)的幾起案子谴垫,更是在濱河造成了極大的恐慌,老刑警劉巖峻黍,帶你破解...
    沈念sama閱讀 219,366評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件躁劣,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡邮屁,警方通過(guò)查閱死者的電腦和手機(jī)整袁,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,521評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)佑吝,“玉大人坐昙,你說(shuō)我怎么就攤上這事∮蠓蓿” “怎么了炸客?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,689評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)戈钢。 經(jīng)常有香客問(wèn)我痹仙,道長(zhǎng),這世上最難降的妖魔是什么殉了? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,925評(píng)論 1 295
  • 正文 為了忘掉前任开仰,我火速辦了婚禮,結(jié)果婚禮上宣渗,老公的妹妹穿的比我還像新娘抖所。我一直安慰自己,他們只是感情好痕囱,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,942評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布田轧。 她就那樣靜靜地躺著,像睡著了一般鞍恢。 火紅的嫁衣襯著肌膚如雪傻粘。 梳的紋絲不亂的頭發(fā)上每窖,一...
    開(kāi)封第一講書(shū)人閱讀 51,727評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音弦悉,去河邊找鬼窒典。 笑死,一個(gè)胖子當(dāng)著我的面吹牛稽莉,可吹牛的內(nèi)容都是我干的瀑志。 我是一名探鬼主播,決...
    沈念sama閱讀 40,447評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼污秆,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼劈猪!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起良拼,我...
    開(kāi)封第一講書(shū)人閱讀 39,349評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤战得,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后庸推,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體常侦,經(jīng)...
    沈念sama閱讀 45,820評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,990評(píng)論 3 337
  • 正文 我和宋清朗相戀三年贬媒,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了聋亡。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,127評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡掖蛤,死狀恐怖杀捻,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情蚓庭,我是刑警寧澤致讥,帶...
    沈念sama閱讀 35,812評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站器赞,受9級(jí)特大地震影響垢袱,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜港柜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,471評(píng)論 3 331
  • 文/蒙蒙 一请契、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧夏醉,春花似錦爽锥、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,017評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至靶擦,卻和暖如春腮考,著一層夾襖步出監(jiān)牢的瞬間雇毫,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,142評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工踩蔚, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留棚放,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,388評(píng)論 3 373
  • 正文 我出身青樓馅闽,卻偏偏與公主長(zhǎng)得像飘蚯,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子福也,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,066評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容