最近用jupyter處理一些數(shù)據(jù)集遇到本地文件大于25M無法上傳的問題,因此在jupyter上處理前需要將文件先壓縮渗磅,然后再解壓讀取翼岁。常見的幾種文件壓縮形式有zip, rar等楼肪,Python中也有相應(yīng)的庫處理。
壓縮為zip文件
import zipfile
f = zipfile.ZipFile('目標(biāo)文件地址','w',zipfile.ZIP_DEFLATED)
f.write(filename,file_url)
f.close()
解壓zip文件
f = zipfile.ZipFile("壓縮文件地址",'r')
for file in f.namelist():
f.extract(file,"解壓縮存放地址")
如果是rar文件解壓汉柒,也是類似误褪,同樣的還是要安裝相應(yīng)的庫
from unrar import rarfile
file = rarfile.RarFile('壓縮文件路徑')
file.extractall('解壓到目標(biāo)文件夾路徑')