字符串問題
在處理字符串的編碼問題的時候们镜,有時候需要對一些字串進(jìn)行精細(xì)化的處理磅轻。如:我有一個字符串是'%C2%FA99%BC%F55'钞速,我想把它替換為'\xc2\xfa99\xbc\xf55'荐虐,看樣子貌似是把'%'替換為'\x',但是因?yàn)椴耄笳叩淖址?\xc2'是一個單位钙蒙,所以使用replace('%','\x')
或者replace('%','\x')
都是不能成功的。
需要使用一些轉(zhuǎn)化的技巧:
def transGbk2Unicode(str_v):
str_s = str_v.replace(r'%', r'\x')
res = eval(repr(str_s).replace('\\\\', '\\'))
return res.decode('gb2312')
tmp_a = r'%C2%FA99%BC%F55'
tmp_a = '%C2%FA99%BC%F55'
m = transGbk2Unicode(tmp_a)
print m
如上處理怠益,才可以將'%'替換為'\x'仪搔。
問題處理
所以可以使用以上的辦法,將雙斜杠替換為單斜杠蜻牢。
例子如下:
a = r'fdf\nfasd'
print a
Out[1]: fdf\nfasd
z = eval(repr(a).replace('\\\\', '\\'))
print z
Out[2]: fdf
fasd
In[3]: a
Out[3]: 'fdf\\nfasd'
In[3]: z
Out[3]: 'fdf\nfasd'