轉(zhuǎn)載請(qǐng)注明:陳熹 chenx6542@foxmail.com (簡(jiǎn)書(shū)號(hào):半為花間酒)
若公眾號(hào)內(nèi)轉(zhuǎn)載請(qǐng)聯(lián)系公眾號(hào):早起Python
這篇文章能學(xué)到的主要內(nèi)容:
基于os
glob
和shutil
對(duì)文件管理的綜合運(yùn)用
一、需求描述
你的電腦中有一個(gè)文件夾 files1
存放著 1800+ 個(gè)文件,如下所示:
需要完成的內(nèi)容是:將 1835 個(gè)文件移動(dòng)到新文件夾 file2
织中,并且重命名文件村斟,名字開(kāi)頭加上 序號(hào) 和 “終稿” 兩個(gè)字艳悔,如名字更改為 “1-終稿-xxxxx(原文件名)”
你心里可能想著:這是人做的事弄兜?少欺?白翻?但確實(shí)這是真實(shí)的需求乍炉,文件批量重命名非常常見(jiàn)绢片,如果沒(méi)有一些技巧,那么只能耗費(fèi)大量的時(shí)間和人力去做岛琼。這里的技巧底循,就是 Python
另外還有一個(gè)問(wèn)題:要先移動(dòng)再重命名還是先重命名再移動(dòng)呢?繼續(xù)往下看
二槐瑞、前置知識(shí)和數(shù)據(jù)準(zhǔn)備
1. 生成大量隨機(jī)文件
真實(shí)的辦公場(chǎng)景并不會(huì)這樣的需求熙涤,畢竟誰(shuí)想要無(wú)端給自己的電腦產(chǎn)生大量無(wú)用文件呢(也不要給別人的電腦亂用)
不得不提,生成隨機(jī)文件能夠幫助我們更好的測(cè)試自己 Python 文件管理的技能困檩。如果你沒(méi)有合適的文件夾和文件夾供自己練習(xí)祠挫,那么為什么不自己寫(xiě)個(gè)代碼產(chǎn)生呢?
當(dāng)然悼沿,在這個(gè)過(guò)程中我們也會(huì)學(xué)習(xí)一些知識(shí)點(diǎn)等舔,先看代碼:
import random
import string
for i in range(2000):
random_str = ''.join(random.sample(string.ascii_letters + string.digits, random.randint(1, 11)))
file = open(r"C:\\xxx\\file1" + random_str + ".txt", 'w+') # 前面路徑是產(chǎn)生文件的目標(biāo)文件夾
file.write(''.join(random.sample(string.ascii_letters + string.digits, random.randint(1, 11))))
file.close()
通過(guò) string
就可以獲得所有的字母和數(shù)字,利用 random.sample()
常規(guī)接受兩個(gè)參數(shù)糟趾,一個(gè)是抽樣的范圍软瞎,一個(gè)是抽樣的次數(shù),默認(rèn)是放回抽樣拉讯。這樣就可以在給定的字母數(shù)字范圍內(nèi)隨機(jī)抽取 1-10 個(gè)涤浇,但是返回的結(jié)果注意是列表,需要再用 .join
方法完成字符串拼接
用隨機(jī)產(chǎn)生的名字生成文件后魔慷,再在其內(nèi)部用類似的方法隨機(jī)寫(xiě)入一些內(nèi)容:
上面的寫(xiě)法不夠優(yōu)雅只锭,因?yàn)樾枰涮资褂?file.close()
釋放,更好的方法是直接利用上下文管理器 with
結(jié)構(gòu)院尔,減少出錯(cuò)的幾率:
import random
import string
for i in range(2000):
random_str = ''.join(random.sample(string.ascii_letters + string.digits, random.randint(1, 11)))
with open(r"C:\\xxx\\file1" + random_str + ".txt", 'w+') as file:
file.write(''.join(random.sample(string.ascii_letters + string.digits, random.randint(1, 11))))
因?yàn)榧词故请S機(jī)產(chǎn)生名字蜻展,但抽樣的范圍和次數(shù)不大決定了 2000 次抽樣會(huì)有一些抽簽組合成的名字完全一樣,后面形成的文件會(huì)覆蓋之前產(chǎn)生的文件邀摆,最終導(dǎo)致產(chǎn)生的文件沒(méi)有 2000 個(gè)
2. 重命名文件/文件夾
需要用到內(nèi)置庫(kù) os
的 os.rename()
方法
import os
os.rename('practice.txt', 'practice_rename.txt') # 重命名文件
os.rename('文件夾1', '文件夾2') # 重命名文件夾
雖然需求中有重命名文件的需求纵顾,但實(shí)際上并不需要直接借助這個(gè)方法
3. 移動(dòng)文件/文件夾
需要用到內(nèi)置庫(kù) shutil
的 shutil.move
方法
import shutil
shutil.move(r'.\practice.txt', r'.\文件夾1/')
shutil.move(r'.\practice.txt', r'.\文件夾1/new.txt')
注意到上面后兩行代碼的區(qū)別嗎?前一行是將目標(biāo)文件移動(dòng)到目標(biāo)文件夾里栋盹,而后一行施逾,在將目標(biāo)文件移動(dòng)到目標(biāo)文件夾里的同時(shí),能夠?qū)ζ溥M(jìn)行重命名
也就是說(shuō)例获,我們并不需要用 os.rename
先命名文件再用 shutil.move
將其移動(dòng)的指定文件夾汉额,而是可以用 shutil.move
一步到位
4. 遍歷獲取文件
采用基于 glob
庫(kù)的迭代框架:
import glob
path = xxx
for file in glob.glob(f'{path}/**/*.xlsx', recursive=True):
pass
上面的代碼能夠獲取給定路徑內(nèi)部所有文件夾下的 Excel 文件(.xlsx
格式), recursive
參數(shù)默認(rèn)為 False
榨汤,當(dāng)為 True
時(shí)允許逐級(jí)遍歷
而本例需要獲取給定文件夾下的所有 .txt
文件蠕搜,則更加簡(jiǎn)單:
import glob
path = xxx
for file in glob.glob(f'{path}/*.txt'):
pass
3. 代碼實(shí)現(xiàn)
首先導(dǎo)入需要的庫(kù)
import os
import shutil
import glob
path = r"C:\xxx" # 存放大量需更名移動(dòng)文件的文件夾路徑的上一級(jí)路徑
上文提到,不需要利用 os.rename
那為什么要導(dǎo)入 os
庫(kù)呢收壕?
一方面因?yàn)橐ㄟ^(guò)這個(gè)庫(kù)產(chǎn)生新的文件夾妓灌。也可以手動(dòng)完成轨蛤,但交給代碼多了判斷也不容易出錯(cuò):
if not os.path.exists(path + r'\file2'):
os.mkdir(path + r'\file2')
另一方面下文還會(huì)用它獲取文件名
然后就可以移動(dòng)更名一步到位,glob
迭代文件框架遍歷獲取文件絕對(duì)路徑:
count = 1 # 生成序號(hào)
for file in glob.glob(f'{path}\\測(cè)試\\*.txt'):
# 這里是文件絕對(duì)路徑虫埂,可以用字符串方法直接替換修改俱萍,但為了方便理解我還是用路徑拼接
filename = os.path.basename(file)
shutil.move(file, path + r'\file2' + f'\{count}-終稿-{filename}')
count += 1
至此,需求成功完成告丢!