我們經(jīng)常會從網(wǎng)絡(luò)上下載一些帶密碼的壓縮包辰如,想要獲取里面的內(nèi)容踏志,往往就要給提供商支付一些費用剔宪。想要白嫖其中的內(nèi)容,常見的做法是百度搜索一些壓縮包密碼破解軟件陨溅,但后果相信體驗過的人都知道终惑。本文將會利用 Python 破解壓縮包的密碼,這里以 ZIP/RAR 為例门扇。
雹有!
破解原理
其實原理很簡單,一句話概括就是「大力出奇跡」臼寄,Python 有兩個壓縮文件庫:zipfile和?rarfile霸奕,這兩個庫提供的解壓縮方法?extractall()?可以指定密碼,這樣的話首先生成一個密碼字典(手動或用程序)吉拳,然后依次嘗試其中的密碼质帅,如果能夠正常解壓縮則表示密碼正確。
實驗環(huán)境
本文采取的虛擬環(huán)境為 Pipenv留攒,有關(guān) Pipenv 的詳細介紹可以參考我的這篇文章 ??《Python 管理哪家強煤惩?》
庫
zipfile:Python 標準庫,使用時直接導入即可
rarfile:Python 第三方庫炼邀,使用時需要安裝魄揉,API 文檔(https://rarfile.readthedocs.io/en/latest/api.html)
利用 Pipenv 安裝 rarfile
pipenv install rarfile
最后,再將一個帶有密碼的壓縮包放入實驗環(huán)境中即可拭宁。
編碼
知道原理后洛退,編碼就會非常簡單了
準備密碼本
「密碼本」其實就是一個包含了所有可能密碼的文件票彪,用戶可以手動錄入,也可以用程序錄入不狮。文末還會有一個介紹降铸。
讀取壓縮文件
# 根據(jù)文件擴展名,使用不同的庫
if?filename.endswith('.zip'):
fp?=?zipfile.ZipFile(filename)
elif?filename.endswith('.rar'):
fp?=?rarfile.RarFile(filename)
嘗試解壓
先嘗試不用密碼解壓縮摇零,如果成功則表示壓縮文件沒有密碼
fp.extractall(desPath)
fp.close()
print('No password')
return
暴力破解
try:
# 讀取密碼本文件
fpPwd?=?open('pwd.txt')
except:
print('No dict file pwd.txt in current directory.')
return
for?pwd?in?fpPwd:
pwd?=?pwd.rstrip()
try:
fp.extractall(path=desPath,?pwd=pwd.encode())
print('Success! ====>'+pwd)
fp.close()
break
except:
pass
fpPwd.close()
程序入口
if?__name__?==?'__main__':
filename?=?sys.argv[1]
if?os.path.isfile(filename)?and?filename.endswith(('.zip',?'.rar')):
decryptRarZipFile(filename)
else:
print('Must be Rar or Zip file')
使用
如果想要使用上述代碼推掸,我們只需在命令行執(zhí)行?python main.py<filename>即可。例如?python main.py test.zip
運行結(jié)果:
$ python main.py test.zip
Success!?====>323126
擴展
密碼本如何獲茸そ觥谅畅?
看到這里,細心的小伙伴一定會發(fā)現(xiàn)噪服,最核心的其實不是代碼毡泻,而是「密碼本」。理論上只要密碼本中的密碼足夠多粘优,就一定能獲取到壓縮包的密碼仇味,這也就是俗稱的「撞庫」。
這時問題又來了雹顺,如何搜集到足夠多的密碼丹墨?我在搜索資料的時候發(fā)現(xiàn)已經(jīng)有人整理好了,我 fork 了一份到了自己的倉庫嬉愧,有興趣的可以點擊 ??爆破字典(https://github.com/YueYongDev/Blasting_dictionary)
如何加速破解過程贩挣?
解決了密碼本的問題,深入思考的小伙伴的一定又會有新的疑問没酣,密碼本既然如此龐大王财,那如何加速破解的過程呢?這里給出兩個思路
多線程(進程)破解
密碼本如果很多且密碼數(shù)量龐大時裕便,我們可以采用多線程(進程)的方式讀取密碼绒净,一個進程讀一個密碼本,一個線程分段讀密碼闪金。當然疯溺,如果是在 python 中论颅,建議不要采用多線程哎垦,因為 python 中的線程就是雞肋,有興趣的可以閱讀相關(guān)資料恃疯。
利用 GPU 加速
我們以上的代碼都是運行在 CPU 上的漏设,即使開啟多線程(進程)也只是利用到 CPU 的資源,但如果想要加速破解過程今妄,我們其實還可以利用閑置的 GPU 資源郑口。
在介紹為什么可以利用 GPU 加速前鸳碧,我們需要明確一個觀點,兩者都為了完成計算任務(wù)而設(shè)計犬性。
那為什么會想到使用 GPU 加速呢瞻离?這是就要說到兩者的不同了:CPU 雖然有多核,但總數(shù)沒有超過兩位數(shù)乒裆,并且每個核的運算能力極其強大套利。而 GPU 的核數(shù)遠超 CPU,但每個核的運算能力與 CPU 的核相比就相差甚遠了鹤耍。
我們可以簡單的舉個例子肉迫,解一道題,CPU 就是博士生稿黄,GPU 就是小學生喊衫,CPU 負責理解題目并且整理出解題的步驟以及解法,而 GPU 負責其中很簡單但是數(shù)量又很大的簡單運算就行了杆怕。
因此理論上在破解密碼的過程中族购,我們完全可以使用 GPU 來加速這一過程。
事實上陵珍,這樣的工具也已經(jīng)出現(xiàn)了联四,Hashcat?便是最出名的一個,它號稱是世界上最快的密碼恢復工具撑教,可以基于 CPU/GPU 工作朝墩。有興趣的可以訪問他的官網(wǎng)https://hashcat.net/hashcat/進行了解。