web信息中常會遇到“\u4f60\u597d”類型的字符。首先’\u‘開頭就基本表明是跟unicode編碼相關(guān)的,“\u”后的16進(jìn)制字符串是相應(yīng)漢字的utf-16編碼。python里decode()和encode()為我們提供了解碼和編碼的方法。其中decode('unicode_escape')能將此種字符串解碼為unicode字符串慢哈。
比如:
str1 = '\u4f60\u597d'
print str1.decode('unicode_escape')
你好
有篇講python編碼的文章比較好,http://blog.csdn.net/liuxincumt/article/details/8183391