一、python3 csv 的中文亂碼解決方案
將文件保存為 csv 格式的話抠藕,用記事本打開是沒有問題的饿肺,但用excel 打開就會亂碼,在網(wǎng)上找了些解決方法都是適用python2
這里提供下一個解決方案
>>> import csv
>>> import codecs
>>> data = [
('小河', '25', '1234567'),
('小芳', '18', '789456')
]
>>> csvfile = codecs.open('test.csv', 'w+', 'utf_8_sig')
>>> writer = csv.writer(csvfile)
>>> for i in data:
writer.writerow(i)
>>> csvfile.close()
導(dǎo)入 codecs 在打開文件時加個頭盾似,就能被 excel識別出了敬辣,這樣在 excel 和 記事本中打開都是沒問題的
二、讀取 csv 文件
import csv
import codecs
csvfile = codecs.open('C:/Users/Why Me/Desktop/test.csv', 'r+', 'utf_8_sig')
reader = csv.reader(csvfile)
for line in reader:
print(line)
csvfile.close()
三颜说、新的寫法
在 一 中為了讓 excel 讀取 csv 中文不亂碼购岗,我們加了個頭。其實這個頭是 \ufeff
寫入文件兩次再讀取就能發(fā)現(xiàn)
['小河', '25', '1234567']
['小芳', '18', '789456']
['\ufeff小河', '25', '1234567']
['小芳', '18', '789456']
那么我們就不能用 一 的方法重復(fù)寫入门粪,不然在讀取時就會多出 \ufeff 喊积。
既然 一 為了讓 excel 讀取不亂碼 只是加了個頭,所以我們也可以直接在要寫入文件的第一個加上 \ufeff 就行了
import csv
import codecs
data = [
('\ufeff小河', '25', '1234567'),
('小芳', '18', '789456')
]
csvfile = codecs.open('test.csv', 'w+',encoding='utf-8')
writer = csv.writer(csvfile)
for i in data:
writer.writerow(i)
csvfile.close()
四玄妈、多次寫入
(一)一次性寫入多次
用 一 的代碼重復(fù)運行乾吻,雖然是 w+ 可讀可寫模式髓梅,但還是無法多次追加寫入
只能在一次打開中多次寫入
import csv
import codecs
data = [
('小河', '25', '1234567'),
('小芳', '18', '789456')
]
csvfile = codecs.open('test.csv', 'w+', 'utf_8_sig')
writer = csv.writer(csvfile)
for i in data:
writer.writerow(i)
for i in data:
writer.writerow(i)
for i in data:
writer.writerow(i)
csvfile.close()
(二)多次打開寫入
用 三 新寫法,w+ 模式雖然是可讀可寫绎签,但試了下發(fā)現(xiàn)都是重頭開始寫入枯饿,就算先 read 出里面的內(nèi)容也不行,所以就只能第一次用 w+ 寫入诡必,接著用 r+ 模式奢方,讀出里面的內(nèi)容,在追加上去爸舒。
代碼如下
第一次
import csv
import codecs
data = [
('\ufeff小河', '25', '1234567'),
('小芳', '18', '789456')
]
csvfile = codecs.open('test.csv', 'w+',encoding='utf-8')
writer = csv.writer(csvfile)
for i in data:
writer.writerow(i)
csvfile.close()
以后追加內(nèi)容
import csv
import codecs
data = [
('小河', '25', '1234567'),
('小芳', '18', '789456')
]
csvfile = codecs.open('test.csv', 'r+',encoding='utf-8')
reader = csv.reader(csvfile)
for line in reader:
pass
writer = csv.writer(csvfile)
for i in data:
writer.writerow(i)
csvfile.close()
另一種追加內(nèi)容方法
import csv
import codecs
import os
data = [
('小河', '25', '1234567'),
('小芳', '18', '789456')
]
csvfile = codecs.open('test.csv', 'r+',encoding='utf-8')
csvfile.seek(0, os.SEEK_END)
writer = csv.writer(csvfile)
for i in data:
writer.writerow(i)
csvfile.close()
用 seek 定位到文件尾
五蟋字、寫入 string 被分割
當我們想將一個列表里的元素寫入的時候
發(fā)現(xiàn)一個 string 被分割了
import csv
import codecs
csvfile = codecs.open('test.csv', 'w+','utf_8_sig')
writer = csv.writer(csvfile)
data = ['小明', '小紅', '小華']
for i in data:
writer.writerow(i)
csvfile.close()
在 excel中被分割成不同的單元格
csv 文件中則是被逗號分割
這是因為 writerow 方法是將傳入的字符串當成列表了。
所以只需傳入列表就行
import csv
import codecs
csvfile = codecs.open('test.csv', 'w+','utf_8_sig')
writer = csv.writer(csvfile)
data = ['小明', '小紅', '小華']
for i in data:
writer.writerow([i])
csvfile.close()
ok