轉(zhuǎn)載請注明:陳熹 chenx6542@foxmail.com (簡書號:半為花間酒)
若公眾號內(nèi)轉(zhuǎn)載請聯(lián)系公眾號:早起Python
這篇文章能學(xué)到的主要內(nèi)容:
PyPDF2
加密和解密操作
PDF 加密
在之前的文章 http://www.reibang.com/p/2d128f26ae7b 中簡單提到過加密一個 PDF 文件的方法,我們先拿自己隨意的一個PDF 文件試一下:
from PyPDF2 import PdfFileWriter, PdfFileReader
path = r'C:\xxx' # 這里填寫目標(biāo) PDF 所在的路徑
pdf_reader = PdfFileReader(path + r'\test.pdf')
pdf_writer = PdfFileWriter()
for page in range(pdf_reader.getNumPages()):
pdf_writer.addPage(pdf_reader.getPage(page))
pdf_writer.encrypt('a123') # 設(shè)置密碼為 a123
with open(path + r'\test.pdf', 'wb') as out:
pdf_writer.write(out)
上面代碼的運(yùn)行邏輯是:實例化一個 PDF 寫入器和讀取器破托,讀取器讀取完目標(biāo) PDF 文件后,一頁一頁交給寫入器,然后對寫入器設(shè)置密碼并輸出。看一下運(yùn)行結(jié)果:
可見這個 PDF 文件成功設(shè)置上了密碼
PDF 已知密碼解密
如果知道密碼的情況下简软,想直接取消 PDF 的加密射众,可以用 .decrypt
碟摆,解密的過程需要讀取器和寫入器共同配合。但區(qū)別于加密 .encrypt
叨橱,.decrypt
是針對讀取器進(jìn)行解密的典蜕,而不是寫入器
from PyPDF2 import PdfFileWriter, PdfFileReader
path = r'C:\xxx'
pdf_reader = PdfFileReader(path + r'\test.pdf')
pdf_reader.decrypt('a123') #
pdf_writer = PdfFileWriter()
for page in range(pdf_reader.getNumPages()):
pdf_writer.addPage(pdf_reader.getPage(page))
with open(path + r'\test.pdf', 'wb') as out:
pdf_writer.write(out)
上面代碼的運(yùn)行邏輯是:首先用讀取器讀取加密文件,然后直接在讀取器上使用 .decrypt
進(jìn)行解密罗洗,逐頁傳到剛實例化的寫入器后統(tǒng)一輸出愉舔,就完成了解密
PDF 暴力解密
暴力破解,其實就是通過手上已經(jīng)有的密碼庫伙菜,或者完全通過數(shù)字轩缤、字母、符號的窮舉,將可能的密碼都放進(jìn)去典奉,逐個嘗試直到成功躺翻。
暴力破解只適用于已知密碼位數(shù)少,由簡單的數(shù)字卫玖、字母構(gòu)成
假設(shè)今天要破解的密碼就是 a123
公你,已知密碼 4 位且由數(shù)字和小寫字母組成。破解又分為兩種情況:
1. 手上有密碼本
本地有一個 password.txt
且可能的密碼一定在其中:
首先讀取 .txt
文件獲取其中所有密碼(示例文件只有 9 個密碼):
passw = []
path = r'C:\Scientific Research\Python'
file = open(path + r'\password.txt')
for line in file.readlines():
passw.append(line.strip())
print(passw)
file.close()
然后就可以用密碼本的密碼做暴力破解:
from PyPDF2 import PdfFileReader
passw = []
path = r'C:\xxx'
file = open(path + r'\password.txt')
for line in file.readlines():
passw.append(line.strip())
file.close()
path = r'C:\xxx'
pdf_reader = PdfFileReader(path + r'\test).pdf')
for i in passw:
if pdf_reader.decrypt(i):
print(f'破解成功假瞬,密碼為{i}')
else:
print(f'破解不成功陕靠,密碼{i}錯誤')
2. 手術(shù)無密碼本,完全窮舉
首先介紹 itertools
脱茉,可以構(gòu)建含需要組合的生成器供后續(xù)迭代:
import itertools
mylist = ("".join(x) for x in itertools.product("0123456789abcdef", repeat=4))
print(next(mylist))
利用這個方法就可以用 while
循環(huán)嘗試暴力破解(為了減少時間剪芥,生成器用"abc123"生成組合):
import itertools
from PyPDF2 import PdfFileReader
mylist = ("".join(x) for x in itertools.product("123abc", repeat=4))
path = r'C:\xxx'
pdf_reader = PdfFileReader(path + r'\test.pdf')
while True:
i = next(mylist)
if pdf_reader.decrypt(i):
print(f'破解成功,密碼為{i}')
break
else:
print(f'破解不成功琴许,密碼{i}錯誤')
最后也成功破解了
需要注意:但即使是這么簡單的組合也耗費(fèi)了一點時間税肪,如果復(fù)雜的密碼破解難度和破解時間就指數(shù)級增長了,暴力的窮舉法就不一定適用