python中對文件崎弃、文件夾(文件操作函數(shù))的操作需要涉及到os模塊和shutil模塊甘晤。
得到當(dāng)前工作目錄,即當(dāng)前Python腳本工作的目錄路徑: os.getcwd()
返回指定目錄下的所有文件和目錄名:os.listdir()
函數(shù)用來刪除一個文件:os.remove()
刪除多個目錄:os.removedirs(r“c:\python”)
檢驗(yàn)給出的路徑是否是一個文件:os.path.isfile()
檢驗(yàn)給出的路徑是否是一個目錄:os.path.isdir()
判斷是否是絕對路徑:os.path.isabs()
檢驗(yàn)給出的路徑是否真地存:os.path.exists()
返回一個路徑的目錄名和文件名:os.path.split() eg os.path.split('/home/swaroop/byte/code/poem.txt') 結(jié)果:('/home/swaroop/byte/code', 'poem.txt')
分離擴(kuò)展名:os.path.splitext()
獲取路徑名:os.path.dirname()
獲取文件名:os.path.basename()
運(yùn)行shell命令: os.system()
讀取和設(shè)置環(huán)境變量:os.getenv() 與os.putenv()
給出當(dāng)前平臺使用的行終止符:os.linesep Windows使用'\r\n'饲做,Linux使用'\n'而Mac使用'\r'
指示你正在使用的平臺:os.name 對于Windows线婚,它是'nt',而對于Linux/Unix用戶盆均,它是'posix'
重命名:os.rename(old塞弊, new)
創(chuàng)建多級目錄:os.makedirs(r“c:\python\test”)
創(chuàng)建單個目錄:os.mkdir(“test”)
獲取文件屬性:os.stat(file)
修改文件權(quán)限與時間戳:os.chmod(file)
終止當(dāng)前進(jìn)程:os.exit()
獲取文件大小:os.path.getsize(filename)
文件操作:
os.mknod("test.txt") 創(chuàng)建空文件
fp = open("test.txt",w) 直接打開一個文件泪姨,如果文件不存在則創(chuàng)建文件
關(guān)于open 模式:
w 以寫方式打開游沿,
a 以追加模式打開 (從 EOF 開始, 必要時創(chuàng)建新文件)
r+ 以讀寫模式打開
w+ 以讀寫模式打開 (參見 w )
a+ 以讀寫模式打開 (參見 a )
rb 以二進(jìn)制讀模式打開
wb 以二進(jìn)制寫模式打開 (參見 w )
ab 以二進(jìn)制追加模式打開 (參見 a )
rb+ 以二進(jìn)制讀寫模式打開 (參見 r+ )
wb+ 以二進(jìn)制讀寫模式打開 (參見 w+ )
ab+ 以二進(jìn)制讀寫模式打開 (參見 a+ )
fp.read([size]) #size為讀取的長度,以byte為單位
fp.readline([size]) #讀一行肮砾,如果定義了size诀黍,有可能返回的只是一行的一部分
fp.readlines([size]) #把文件每一行作為一個list的一個成員,并返回這個list仗处。其實(shí)它的內(nèi)部是通過循環(huán)調(diào)用readline()來實(shí)現(xiàn)的眯勾。如果提供size參數(shù),size是表示讀取內(nèi)容的總長婆誓,也就是說可能只讀到文件的一部分吃环。
fp.write(str) #把str寫到文件中,write()并不會在str后加上一個換行符
fp.writelines(seq) #把seq的內(nèi)容全部寫到文件中(多行一次性寫入)洋幻。這個函數(shù)也只是忠實(shí)地寫入郁轻,不會在每行后面加上任何東西。
fp.close() #關(guān)閉文件鞋屈。python會在一個文件不用后自動關(guān)閉文件范咨,不過這一功能沒有保證故觅,最好還是養(yǎng)成自己關(guān)閉的習(xí)慣。 如果一個文件在關(guān)閉后還對其進(jìn)行操作會產(chǎn)生ValueError
fp.flush() #把緩沖區(qū)的內(nèi)容寫入硬盤
fp.fileno() #返回一個長整型的”文件標(biāo)簽“
fp.isatty() #文件是否是一個終端設(shè)備文件(unix系統(tǒng)中的)
fp.tell() #返回文件操作標(biāo)記的當(dāng)前位置渠啊,以文件的開頭為原點(diǎn)
fp.next() #返回下一行输吏,并將文件操作標(biāo)記位移到下一行。把一個file用于for … in file這樣的語句時替蛉,就是調(diào)用next()函數(shù)來實(shí)現(xiàn)遍歷的贯溅。
fp.seek(offset[,whence]) #將文件打操作標(biāo)記移到offset的位置。這個offset一般是相對于文件的開頭來計算的躲查,一般為正數(shù)它浅。但如果提供了whence參數(shù)就不一定了,whence可以為0表示從頭開始計算镣煮,1表示以當(dāng)前位置為原點(diǎn)計算姐霍。2表示以文件末尾為原點(diǎn)進(jìn)行計算。需要注意典唇,如果文件以a或a+的模式打開镊折,每次進(jìn)行寫操作時,文件操作標(biāo)記會自動返回到文件末尾介衔。
fp.truncate([size]) #把文件裁成規(guī)定的大小恨胚,默認(rèn)的是裁到當(dāng)前文件操作標(biāo)記的位置。如果size比文件的大小還要大炎咖,依據(jù)系統(tǒng)的不同可能是不改變文件赃泡,也可能是用0把文件補(bǔ)到相應(yīng)的大小,也可能是以一些隨機(jī)的內(nèi)容加上去乘盼。
目錄操作:
os.mkdir("file") 創(chuàng)建目錄
復(fù)制文件:
shutil.copyfile("oldfile","newfile") oldfile和newfile都只能是文件
shutil.copy("oldfile","newfile") oldfile只能是文件夾升熊,newfile可以是文件,也可以是目標(biāo)目錄
復(fù)制文件夾:
shutil.copytree("olddir","newdir") olddir和newdir都只能是目錄绸栅,且newdir必須不存在
重命名文件(目錄)
os.rename("oldname","newname") 文件或目錄都是使用這條命令
移動文件(目錄)
shutil.move("oldpos","newpos")
刪除文件
os.remove("file")
刪除目錄
os.rmdir("dir")只能刪除空目錄
shutil.rmtree("dir") 空目錄僚碎、有內(nèi)容的目錄都可以刪
轉(zhuǎn)換目錄
os.chdir("path") 換路徑
Python讀寫文件
1.open
使用open打開文件后一定要記得調(diào)用文件對象的close()方法。比如可以用try/finally語句來確保最后能關(guān)閉文件阴幌。
file_object = open('thefile.txt')
try:
all_the_text = file_object.read( )
finally:
file_object.close( )
注:不能把open語句放在try塊里,因?yàn)楫?dāng)打開文件出現(xiàn)異常時卷中,文件對象file_object無法執(zhí)行close()方法矛双。
2.讀文件
讀文本文件
input = open('data', 'r')
第二個參數(shù)默認(rèn)為r
input = open('data')
讀二進(jìn)制文件
input = open('data', 'rb')
讀取所有內(nèi)容
file_object = open('thefile.txt')
try:
all_the_text = file_object.read( )
finally:
file_object.close( )
讀固定字節(jié)
file_object = open('abinfile', 'rb')
try:
while True:
chunk = file_object.read(100)
if not chunk:
break
do_something_with(chunk)
finally:
file_object.close( )
讀每行
list_of_all_the_lines = file_object.readlines( )
如果文件是文本文件,還可以直接遍歷文件對象獲取每行:
for line in file_object:
process line
3.寫文件
寫文本文件
output = open('data', 'w')
寫二進(jìn)制文件
output = open('data', 'wb')
追加寫文件
output = open('data', 'w+')
寫數(shù)據(jù)
file_object = open('thefile.txt', 'w')
file_object.write(all_the_text)
file_object.close( )
寫入多行
file_object.writelines(list_of_text_strings)
注意蟆豫,調(diào)用writelines寫入多行在性能上會比使用write一次性寫入要高议忽。
在處理日志文件的時候,常常會遇到這樣的情況:日志文件巨大十减,不可能一次性把整個文件讀入到內(nèi)存中進(jìn)行處理栈幸,例如需要在一臺物理內(nèi)存為 2GB 的機(jī)器上處理一個 2GB 的日志文件愤估,我們可能希望每次只處理其中 200MB 的內(nèi)容。
在 Python 中速址,內(nèi)置的 File 對象直接提供了一個 readlines(sizehint) 函數(shù)來完成這樣的事情。以下面的代碼為例:
file = open('test.log', 'r')sizehint = 209715200 # 200Mposition = 0lines = file.readlines(sizehint)while not file.tell() - position < 0: position = file.tell() lines = file.readlines(sizehint)
每次調(diào)用 readlines(sizehint) 函數(shù),會返回大約 200MB 的數(shù)據(jù)草讶,而且所返回的必然都是完整的行數(shù)據(jù)僻弹,大多數(shù)情況下,返回的數(shù)據(jù)的字節(jié)數(shù)會稍微比 sizehint 指定的值大一點(diǎn)(除最后一次調(diào)用 readlines(sizehint) 函數(shù)的時候)并炮。通常情況下默刚,Python 會自動將用戶指定的 sizehint 的值調(diào)整成內(nèi)部緩存大小的整數(shù)倍。
file在python是一個特殊的類型逃魄,它用于在python程序中對外部的文件進(jìn)行操作荤西。在python中一切都是對象,file也不例外伍俘,file有file的方法和屬性邪锌。下面先來看如何創(chuàng)建一個file對象:
file(name[, mode[, buffering]])
file()函數(shù)用于創(chuàng)建一個file對象,它有一個別名叫open()养篓,可能更形象一些秃流,它們是內(nèi)置函數(shù)。來看看它的參數(shù)柳弄。它參數(shù)都是以字符串的形式傳遞的舶胀。name是文件的名字。
mode是打開的模式碧注,可選的值為r w a U嚣伐,分別代表讀(默認(rèn)) 寫 添加支持各種換行符的模式。用w或a模式打開文件的話萍丐,如果文件不存在轩端,那么就自動創(chuàng)建。此外逝变,用w模式打開一個已經(jīng)存在的文件時基茵,原有文件的內(nèi)容會被清空,因?yàn)橐婚_始文件的操作的標(biāo)記是在文件的開頭的壳影,這時候進(jìn)行寫操作拱层,無疑會把原有的內(nèi)容給抹掉。由于歷史的原因宴咧,換行符在不同的系統(tǒng)中有不同模式根灯,比如在 unix中是一個\n,而在windows中是‘\r\n’,用U模式打開文件烙肺,就是支持所有的換行模式纳猪,也就說‘\r’ '\n' '\r\n'都可表示換行,會有一個tuple用來存貯這個文件中用到過的換行符桃笙。不過氏堤,雖說換行有多種模式,讀到python中統(tǒng)一用\n代替怎栽。在模式字符的后面丽猬,還可以加上+ b t這兩種標(biāo)識,分別表示可以對文件同時進(jìn)行讀寫操作和用二進(jìn)制模式熏瞄、文本模式(默認(rèn))打開文件脚祟。
buffering如果為0表示不進(jìn)行緩沖;如果為1表示進(jìn)行“行緩沖“;如果是一個大于1的數(shù)表示緩沖區(qū)的大小,應(yīng)該是以字節(jié)為單位的强饮。
file對象有自己的屬性和方法由桌。先來看看file的屬性。
closed #標(biāo)記文件是否已經(jīng)關(guān)閉邮丰,由close()改寫
encoding #文件編碼
mode #打開模式
name #文件名
newlines #文件中用到的換行模式行您,是一個tuple
softspace #boolean型,一般為0剪廉,據(jù)說用于print
file的讀寫方法:
F.read([size]) #size為讀取的長度娃循,以byte為單位
F.readline([size]) #讀一行,如果定義了size斗蒋,有可能返回的只是一行的一部分
F.readlines([size]) #把文件每一行作為一個list的一個成員捌斧,并返回這個list。其實(shí)它的內(nèi)部是通過循環(huán)調(diào)用readline()來實(shí)現(xiàn)的泉沾。如果提供size參數(shù)捞蚂,size是表示讀取內(nèi)容的總長,也就是說可能只讀到文件的一部分跷究。
F.write(str) #把str寫到文件中姓迅,write()并不會在str后加上一個換行符
F.writelines(seq) #把seq的內(nèi)容全部寫到文件中。這個函數(shù)也只是忠實(shí)地寫入俊马,不會在每行后面加上任何東西丁存。
file的其他方法:
F.close() #關(guān)閉文件。python會在一個文件不用后自動關(guān)閉文件柴我,不過這一功能沒有保證柱嫌,最好還是養(yǎng)成自己關(guān)閉的習(xí)慣。如果一個文件在關(guān)閉后還對其進(jìn)行操作會產(chǎn)生ValueError
F.flush() #把緩沖區(qū)的內(nèi)容寫入硬盤
F.fileno() #返回一個長整型的”文件標(biāo)簽“
F.isatty() #文件是否是一個終端設(shè)備文件(unix系統(tǒng)中的)
F.tell() #返回文件操作標(biāo)記的當(dāng)前位置屯换,以文件的開頭為原點(diǎn)
F.next() #返回下一行,并將文件操作標(biāo)記位移到下一行。把一個file用于for ... in file這樣的語句時彤悔,就是調(diào)用next()函數(shù)來實(shí)現(xiàn)遍歷的嘉抓。
F.seek(offset[,whence]) #將文件打操作標(biāo)記移到offset的位置。這個offset一般是相對于文件的開頭來計算的晕窑,一般為正數(shù)抑片。但如果提供了whence參數(shù)就不一定了,whence可以為0表示從頭開始計算杨赤,1表示以當(dāng)前位置為原點(diǎn)計算敞斋。2表示以文件末尾為原點(diǎn)進(jìn)行計算。需要注意疾牲,如果文件以a或a+的模式打開植捎,每次進(jìn)行寫操作時,文件操作標(biāo)記會自動返回到文件末尾阳柔。
F.truncate([size]) #把文件裁成規(guī)定的大小焰枢,默認(rèn)的是裁到當(dāng)前文件操作標(biāo)記的位置。如果size比文件的大小還要大舌剂,依據(jù)系統(tǒng)的不同可能是不改變文件济锄,也可能是用0把文件補(bǔ)到相應(yīng)的大小,也可能是以一些隨機(jī)的內(nèi)容加上去霍转。