一. 從SQL server讀取數(shù)據(jù)出現(xiàn)中文亂碼
【問題描述】: pymmsql連接SQL Server中文出現(xiàn)亂碼【問題分析】:①矢门、默認情況下SQL Server 使用ISO字符集(代碼頁1252)(latin1字符集)盆色;②灰蛙、python的 pymssql模塊默認以'utf8'編碼方式解碼(默認charset='utf8'); ③隔躲、數(shù)據(jù)庫內(nèi)的中文摩梧,被python以二進制的方式讀取后以'utf8'方式解碼顯示為亂碼,其二進制數(shù)據(jù)未改變宣旱。
【解決方案一】:將因'utf8'解碼成亂碼的str以其原正確的編碼方式'latin1'再次encode成正確的bytes然后以'GB2312'編碼方式解碼成正常的中文str: str.encode('latin1').decode('GB2312')
【解決方案二】:最近發(fā)現(xiàn)仅父,可以直接以GB18030讀取得到正常的中文,我的數(shù)據(jù)庫排序規(guī)則排序規(guī)則為“Chinese_PRC_CI_AS”
- 至于為什么不用GB2312呢,因為包含的字符個數(shù):GB2312 < GBK < GB18030笙纤,如果用GB2312耗溜,在可能報錯:“UnicodeDecodeError: 'gb2312' codec can't decode byte 0xa9 in position 0: illegal multibyte sequence”
二. SQL Server 中文顯示為"???"
【問題描述】:SQL Server 2017中新建數(shù)據(jù)庫,用python寫入的中文數(shù)據(jù)顯示為"???"
【解決方案】:建庫的時候選擇排序規(guī)則“Chinese_PRC_CI_AS”后顯示正常省容,參考SQL SERVER建表時collate Chinese_PRC_CI_AS 是什么意思
三. PyQt的table中文bug
【問題描述】:Pyqt的table(widget)在未選中Item時直接輸入中文抖拴,UI界面卡死;
【問題定位】:經(jīng)排查發(fā)現(xiàn)腥椒,與table中使用了self.tableWidget.setCellwidget()有關阿宅;
四.Matplolib中出現(xiàn)中文亂碼
【問題描述】:matplotlib中文軸標簽成亂碼
【問題定位】:matplotlib從V2.0后默認字體僅包含西方字母的字形洒放, 沒有覆蓋中文、韓文或日文滨砍。參考Text properties and layout
【解決方案】:可添加代碼設置中文字體往湿,也可修改matplotlib配置文件,更改默認字體惨好,這里僅介紹前一種方法煌茴,第二種方法請參考:python matplotlib 中文顯示參數(shù)設置
import matplotlib as mpl
mpl.rcParams['font.sans-serif']=['KaiTi','SimHei'] #顯示漢字為 楷體, 漢字不支持 粗體日川,斜體等設置
mpl.rcParams['axes.unicode_minus']=False #用來正常顯示負號
mpl.rcParams['font.size'] = 10
切記字體設置要在style之后蔓腐,否則可能依舊出現(xiàn)中文亂碼(在下被這個整整坑了一天半的時間),錯誤代碼如下
import matplotlib as mpl
mpl.rcParams['font.sans-serif']=['KaiTi','SimHei'] #顯示漢字為 楷體龄句, 漢字不支持 粗體回论,斜體等設置
mpl.rcParams['axes.unicode_minus']=False #用來正常顯示負號
mpl.rcParams['font.size'] = 10
mpl.style.use('seaborn-whitegrid') # 可能導致字體設置失敗
五. windows英文系統(tǒng)顯示中文亂碼
【問題描述】:英文系統(tǒng)下,部分中文程序運行時出現(xiàn)中文亂碼
【問題定位】:中文程序所使用的文字編碼與Windows7英文系統(tǒng)的文字編碼不同分歇,所以會發(fā)生顯示亂碼的情況
【解決方案】:win7系統(tǒng)參考英文系統(tǒng)中文亂碼的解決