本文是筆者學(xué)習(xí)廖雪峰Python3教程的筆記,在此感謝廖老師的教程讓我們這些初學(xué)者能夠一步一步的進(jìn)行下去.如果讀者想學(xué)習(xí)完成的教程,請(qǐng)?jiān)L問廖雪峰Python3教程,筆記如有侵權(quán),請(qǐng)告知?jiǎng)h除...
讀文件
以讀文件的方式打開文件的做法是使用Python內(nèi)置的open()函數(shù),參數(shù)為文件名和標(biāo)識(shí)符
標(biāo)識(shí)符:
r 以只讀方式打開文件懒豹。文件的指針將會(huì)放在文件的開頭。這是默認(rèn)模式粘衬。
rb 以二進(jìn)制格式打開一個(gè)文件用于只讀函匕。文件指針將會(huì)放在文件的開頭楼咳。這是默認(rèn)模式。
r+ 打開一個(gè)文件用于讀寫。文件指針將會(huì)放在文件的開頭惹苗。
rb+ 以二進(jìn)制格式打開一個(gè)文件用于讀寫痛倚。文件指針將會(huì)放在文件的開頭规婆。
w 打開一個(gè)文件只用于寫入。如果該文件已存在則將其覆蓋蝉稳。如果該文件不存在抒蚜,創(chuàng)建新文件。
wb 以二進(jìn)制格式打開一個(gè)文件只用于寫入耘戚。如果該文件已存在則將其覆蓋嗡髓。如果該文件不存在,創(chuàng)建新文件收津。
w+ 打開一個(gè)文件用于讀寫饿这。如果該文件已存在則將其覆蓋。如果該文件不存在撞秋,創(chuàng)建新文件长捧。
wb+ 以二進(jìn)制格式打開一個(gè)文件用于讀寫。如果該文件已存在則將其覆蓋吻贿。如果該文件不存在串结,創(chuàng)建新文件。
a 打開一個(gè)文件用于追加。如果該文件已存在肌割,文件指針將會(huì)放在文件的結(jié)尾卧蜓。也就是說,新的內(nèi)容將會(huì)被寫入到已有內(nèi)容之后把敞。如果該文件不存在弥奸,創(chuàng)建新文件進(jìn)行寫入。
ab 以二進(jìn)制格式打開一個(gè)文件用于追加奋早。如果該文件已存在其爵,文件指針將會(huì)放在文件的結(jié)尾。也就是說伸蚯,新的內(nèi)容將會(huì)被寫入到已有內(nèi)容之后摩渺。如果該文件不存在,創(chuàng)建新文件進(jìn)行寫入剂邮。
a+ 打開一個(gè)文件用于讀寫摇幻。如果該文件已存在,文件指針將會(huì)放在文件的結(jié)尾挥萌。文件打開時(shí)會(huì)是追加模式绰姻。如果該文件不存在,創(chuàng)建新文件用于讀寫引瀑。
ab+ 以二進(jìn)制格式打開一個(gè)文件用于追加狂芋。如果該文件已存在,文件指針將會(huì)放在文件的結(jié)尾憨栽。如果該文件不存在帜矾,創(chuàng)建新文件用于讀寫。
f = open('User/joe/Desktop/test1.py', 'r')
如果文件不存在的話,就會(huì)拋出一個(gè)IOError錯(cuò)誤,來告訴你找不到文件.
open()打開文件之后,就可以使用read()來一次讀取全部的文件,最后需要調(diào)用close()來關(guān)閉文件.但是由于可能會(huì)出現(xiàn)IOError迫使程序運(yùn)行終止,那么就永遠(yuǎn)不會(huì)走到close()方法了.
所以,Python中提供了with()語句來自動(dòng)幫我們調(diào)用close()方法.
with open('User/joe/Desktop/test1.py', 'r') as f:
f.read()
使用read()方法讀取文件的時(shí)候,是一次性打開全部的內(nèi)容,如果文件很大的話,內(nèi)存就會(huì)出現(xiàn)問題.為了保險(xiǎn)起見,需要在read()方法中傳入一個(gè)size參數(shù),然后反復(fù)調(diào)用read()反復(fù),保證每次讀取合適大小的內(nèi)容,直到最后調(diào)用結(jié)束.除此之外,Python中提供了readlines()方法,來一行一行的讀取文件.
with open('User/joe/Desktop/test1/py', 'r') as f:
for line in f.readlines():
print(line.strip())
file-like Object
像open()函數(shù)返回的這種有個(gè)read()方法的對(duì)象屑柔,在Python中統(tǒng)稱為file-like Object.
StringIO就是在內(nèi)存中創(chuàng)建的file-like Object屡萤,常用作臨時(shí)緩沖。
-
二進(jìn)制文件
要讀取二進(jìn)制文件掸宛,比如圖片死陆、視頻等等,用'rb'模式打開文件即可
-
字符編碼
要讀取編碼文件,需要在open()中傳入encode參數(shù),比如:
f = open('/User/joe/Desktop/test1.py', encoding = 'gbk') f.read()
寫文件
寫文件與讀文件一樣,只不過在open()的標(biāo)識(shí)符參數(shù)中傳入 'w'或者'wb'即可.
然后調(diào)用write()方法,寫出文件,最后調(diào)用close()文件關(guān)閉文件即可.
StringIO & BytesIO
很多時(shí)候讀數(shù)據(jù)不一定是從文件中讀, 還有可能從內(nèi)存中讀. 要讀取StringIO,需要先從io中導(dǎo)入StringIO.
寫入數(shù)據(jù)到StringIO中,需要先創(chuàng)建一個(gè)StringIO.然后像文件一樣寫入即可.調(diào)用getvalue()方法獲得寫入的str
from io import StringIO
f = StringIO()
f.write('Hello World')
print(f.getvalue())
從StringIO中讀數(shù)據(jù).使用str初始化一個(gè)StringIO,然后像讀文件一樣讀取數(shù)據(jù).
from io import StringIO
f = StringIO('Hello World')
f.read()
StringIO只能操作str類型的數(shù)據(jù),如果要操作二進(jìn)制數(shù)據(jù)則需要導(dǎo)入BytesIO
BytesIO實(shí)現(xiàn)了在內(nèi)存中讀寫bytes唧瘾,我們創(chuàng)建一個(gè)BytesIO措译,然后寫入一些bytes
from io import BytesIO
f = BytesIO()
f.write('中文'.encode('utf-8'))
print(f.getvalue())
這里寫入的經(jīng)過encode編碼的二進(jìn)制數(shù)據(jù)
與StringIO類似,可以用一個(gè)bytes初始化BytesIO饰序,然后领虹,像讀文件一樣讀取
from io import BytesIO
f = BytesIO(b'\xe4\xb8\xad\xe6\x96\x87')
f.read()
操作文件和目錄
Python內(nèi)置的os模塊可以直接調(diào)用操作系統(tǒng)提供的接口函數(shù)來實(shí)現(xiàn)文件和目錄的操作,操作文件和目錄的函數(shù)一部分放在os模塊中,一部分放在os.path模塊中.
import os
# 查看當(dāng)前目錄的絕對(duì)路徑:
os.path.abspath('.')
'/Users/joe/Desktop'
# 在某個(gè)目錄下創(chuàng)建一個(gè)新目錄菌羽,首先把新目錄的完整路徑表示出來:
os.path.join(os.path.abspath('.'), 'testdir')
'/Users/joe/Desktop/testdir'
# 然后創(chuàng)建一個(gè)目錄:
os.mkdir('/Users/joe/Desktop/testdir')
# 刪掉一個(gè)目錄:
os.rmdir('/Users/joe/Desktop/testdir')
要拆分路徑時(shí)掠械,也不要直接去拆字符串,而要通過os.path.split()函數(shù)注祖,這樣可以把一個(gè)路徑拆分為兩部分猾蒂,后一部分總是最后級(jí)別的目錄或文件名.
os.path.split(/Users/joe/Desktop/testdir)
os.path.splitext()
可以直接得到文件擴(kuò)展名.
使用rename()對(duì)文件重命名和remove()刪掉文件.
利用Python的特性來過濾文件。比如我們要列出當(dāng)前目錄下的所有目錄是晨,只需要一行代碼:
[x for x in os.listdir('.') if os.path.isdir(x)] ['.lein', '.local', '.m2', '.npm', '.ssh', '.Trash', '.vim', 'Applications', 'Desktop', ...]
要列出所有的.py文件肚菠,也只需一行代碼:
[x for x in os.listdir('.') if os.path.isfile(x) and os.path.splitext(x)[1]=='.py'] ['apis.py', 'config.py', 'models.py', 'pymonitor.py', 'test_db.py', 'urls.py', 'wsgiapp.py']
序列化
我們把變量從內(nèi)存中變成可存儲(chǔ)或傳輸?shù)倪^程稱之為序列化,在Python中叫pickling.序列化之后罩缴,就可以把序列化后的內(nèi)容寫入磁盤蚊逢,或者通過網(wǎng)絡(luò)傳輸?shù)絼e的機(jī)器上.反過來,把變量內(nèi)容從序列化的對(duì)象重新讀到內(nèi)存里稱之為反序列化箫章,即unpickling烙荷。
- 序列化一個(gè)dict
import pickle
d = dict(name = 'joe', age = 24, score = 90)
pickle.dumps(d)
pickle.dumps()方法把任意對(duì)象序列化成一個(gè)bytes,然后檬寂,就可以把這個(gè)bytes寫入文件终抽。或者用另一個(gè)方法pickle.dump()直接把對(duì)象序列化后寫入一個(gè)file-like Object.
import pickle
d = dict(name = 'joe', age = 24, score = 90)
f.open('hhh.py','wb')
pickle.dump(d, f)
f.close()
hhh.py中存儲(chǔ)的就是dict被序列化的內(nèi)容.
當(dāng)我們要把對(duì)象從磁盤讀到內(nèi)存時(shí)桶至,可以先把內(nèi)容讀到一個(gè)bytes昼伴,然后用pickle.loads()方法反序列化出對(duì)象,也可以直接用pickle.load()方法從一個(gè)file-like Object中直接反序列化出對(duì)象镣屹。我們打開另一個(gè)Python命令行來反序列化剛才保存的對(duì)象
f = open('hhh.py', 'rb')
d = pickle.load(f)
f.close()
這樣變量的內(nèi)容又回來,但是這個(gè)變量與之前的只是內(nèi)容相同,并不是一個(gè)變量.
JSON
Python內(nèi)置了Json模塊,將dict轉(zhuǎn)換為json的方法為:
import json
d = dict(name = 'joe', age = 24, score = 90)
json.dumps(d)
dumps()方法返回一個(gè)str圃郊,內(nèi)容就是標(biāo)準(zhǔn)的JSON.
反序列化是調(diào)用loads()方法
import json
json_str = dict(name = 'joe', age = 24, score = 90)
json.laods(json_str)
如果我們?cè)赿umps的可選參數(shù)deault中不傳入任何參數(shù),Python將無法知道怎么將一個(gè)class序列化,這時(shí)需要寫一個(gè)轉(zhuǎn)換函數(shù)來將class實(shí)例轉(zhuǎn)化為json對(duì)象.
同樣的道理,如果需要反序列化一個(gè)class,同樣需要寫一個(gè)轉(zhuǎn)換函數(shù),傳到object_hook參數(shù)中.
import json
class Studnet(object):
def __init__(self, name, age, score):
self.name = name
self.age = age
self.score = score
s = Student('Joe', 24, 90)
#要序列化s
def student2dict(std):
return {'name': std.name, 'age': std.age, 'score': std.score}
json.dumps(s, default= student2dict)
# 序列化的結(jié)果
# '{"name": "Bob", "score": 90, "age": 20}'
# 反序列化
json_str = '{"name": "Bob", "score": 90, "age": 20}'
def dict2Student:(dic):
return Student(dic['name'], dic['age'], dic['score'])
json.loads(json_str, object_hook= dict2Student)
# 反序列化的結(jié)果
#<__main__.Student object at 0x102af07f0>