python json解析注意事項(xiàng)

今天需要解析一個非常長的json字符串,中間碰到了各種問題,總結(jié)了一下所有的注意事項(xiàng)瘦材。
首先我有一個字符串,原本非常長仿畸,我精簡了一下食棕,如下所示:

>>> s="{'product': u'\\u62c9\\u52fe\\u7f51', 'downtime': 3.128, 
'monitors': [{'use': 100, 'monitorurl': u'http://oss.lagou.com','monitorweight': 10L,
'monitorname': u'\\u804c\\u4f4d\\u641c\\u7d22'}]}"

這應(yīng)該不是正規(guī)調(diào)用json.dumps()得到的字符串,而是用str()颁湖,原數(shù)據(jù)結(jié)構(gòu)是由字典宣蠕、列表、字符串甥捺、長整型的數(shù)據(jù)拼接起來的抢蚀,還包含著中文的Unicode字符。即

>>> origin={"product": u"\\u62c9\\u52fe\\u7f51", "downtime": 3.128, 
"monitors": [{"use": 100, "monitorurl": u"http://oss.lagou.com","monitorweight": 10L, 
"monitorname": u"\\u804c\\u4f4d\\u641c\\u7d22"}]}
>>> json.dumps(origin)
'{"product": "\\\\u62c9\\\\u52fe\\\\u7f51", 
"monitors": [{"use": 100, "monitorweight": 10, 
"monitorname": "\\\\u804c\\\\u4f4d\\\\u641c\\\\u7d22", 
"monitorurl": "http://oss.lagou.com/"}], "downtime": 3.1280000000000001}'
>>> str(origin)
"{'product': u'\\\\u62c9\\\\u52fe\\\\u7f51', 
'monitors': [{'use': 100, 'monitorweight': 10L, 
'monitorname': u'\\\\u804c\\\\u4f4d\\\\u641c\\\\u7d22', 
'monitorurl': u'http://oss.lagou.com'}], 'downtime': 3.128}"

如果是json.dumps(s)镰禾,直接就可以用json.loads(s)便可轉(zhuǎn)換為對象皿曲。那么針對這種用str()的,便會出現(xiàn)各種問題吴侦∥菪荩總結(jié)出現(xiàn)的如下幾點(diǎn)問題:

  1. 字符串里的鍵值對必須是用雙引號,不能用單引號备韧。單引號會報:Expecting property name: line 1 column 1 (char 1)
>>> s1="{'a':'a'}";s2='{"a":"a"}'
>>> json.loads(s1)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/lib64/python2.6/json/__init__.py", line 307, in loads
    return _default_decoder.decode(s)
  File "/usr/lib64/python2.6/json/decoder.py", line 319, in decode
    obj, end = self.raw_decode(s, idx=_w(s, 0).end())
  File "/usr/lib64/python2.6/json/decoder.py", line 336, in raw_decode
    obj, end = self._scanner.iterscan(s, **kw).next()
  File "/usr/lib64/python2.6/json/scanner.py", line 55, in iterscan
    rval, next_pos = action(m, context)
  File "/usr/lib64/python2.6/json/decoder.py", line 171, in JSONObject
    raise ValueError(errmsg("Expecting property name", s, end))
ValueError: Expecting property name: line 1 column 1 (char 1)
>>> json.loads(s2)
{u'a': u'a'}
  1. str()后不管原來的鍵值是單引號還是雙引號劫樟,最終都會變成單引號,外層是雙引號织堂。所以需要替換為雙引號
>>> s={"a":"a"};str(s)
"{'a': 'a'}"
>>> s={'a':'a'};str(s)
"{'a': 'a'}"

>>> s={'a':'a'};s1=str(s)
>>> s1
"{'a': 'a'}"
>>> s2=s1.replace('\'','\"')
>>> s2
'{"a": "a"}'
>>> json.loads(s2)
{u'a': u'a'}

  1. unicode字符串叠艳,str()后還會帶u標(biāo)志,需要去掉易阳。
>>> s={'a':u'拉勾網(wǎng)'}
>>> s
{'a': u'\u62c9\u52fe\u7f51'}
>>> s1=str(s)
>>> s1
"{'a': u'\\u62c9\\u52fe\\u7f51'}"
>>> json.loads(s1)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/lib64/python2.6/json/__init__.py", line 307, in loads
    return _default_decoder.decode(s)
  File "/usr/lib64/python2.6/json/decoder.py", line 319, in decode
    obj, end = self.raw_decode(s, idx=_w(s, 0).end())
  File "/usr/lib64/python2.6/json/decoder.py", line 336, in raw_decode
    obj, end = self._scanner.iterscan(s, **kw).next()
  File "/usr/lib64/python2.6/json/scanner.py", line 55, in iterscan
    rval, next_pos = action(m, context)
  File "/usr/lib64/python2.6/json/decoder.py", line 171, in JSONObject
    raise ValueError(errmsg("Expecting property name", s, end))
ValueError: Expecting property name: line 1 column 1 (char 1)
>>> 

4.長整型數(shù)據(jù)附较,str()后還帶有L標(biāo)志,也需要處理潦俺。

>>> s={"a":10L}
>>> s1=str(s)
>>> s1
"{'a': 10L}"
>>> s
>>> s1='{"a":10L}'
>>> json.loads(s1)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/lib64/python2.6/json/__init__.py", line 307, in loads
    return _default_decoder.decode(s)
  File "/usr/lib64/python2.6/json/decoder.py", line 319, in decode
    obj, end = self.raw_decode(s, idx=_w(s, 0).end())
  File "/usr/lib64/python2.6/json/decoder.py", line 336, in raw_decode
    obj, end = self._scanner.iterscan(s, **kw).next()
  File "/usr/lib64/python2.6/json/scanner.py", line 55, in iterscan
    rval, next_pos = action(m, context)
  File "/usr/lib64/python2.6/json/decoder.py", line 193, in JSONObject
    raise ValueError(errmsg("Expecting , delimiter", s, end - 1))
ValueError: Expecting , delimiter: line 1 column 7 (char 7)

最后再回到之前那個復(fù)雜的字符串拒课。

>>> s="{'product': u'\\u62c9\\u52fe\\u7f51', 'downtime': 3.128, 'monitors': [{'use': 100L, 'monitorurl': u'http://oss.lagou.com','monitorweight': 10L,'monitorname': u'\\u804c\\u4f4d\\u641c\\u7d22'}]}"
>>> #替換單引號為雙引號
>>> s1=s.replace('\'','\"')
>>> s1
'{"product": u"\\u62c9\\u52fe\\u7f51", "downtime": 3.128, "monitors": [{"use": 100L, "monitorurl": u"http://oss.lagou.com","monitorweight": 10L,"monitorname": u"\\u804c\\u4f4d\\u641c\\u7d22"}]}'
>>> s2=s1.replace('u\"','\"')
>>> #去掉unicode標(biāo)志u
>>> s2
'{"product": "\\u62c9\\u52fe\\u7f51", "downtime": 3.128, "monitors": [{"use": 100L, "monitorurl": "http://oss.lagou.com","monitorweight": 10L,"monitorname": "\\u804c\\u4f4d\\u641c\\u7d22"}]}'
>>> s3=s2.replace('..L','')
>>> s3
'{"product": "\\u62c9\\u52fe\\u7f51", "downtime": 3.128, "monitors": [{"use": 100L, "monitorurl": "http://oss.lagou.com","monitorweight": 10L,"monitorname": "\\u804c\\u4f4d\\u641c\\u7d22"}]}'
>>> #去掉長整型的L
>>> import re
>>> s3=re.sub(r'(\d+)L','\g<1>',s2)
>>> s3
'{"product": "\\u62c9\\u52fe\\u7f51", "downtime": 3.128, "monitors": [{"use": 100, "monitorurl": "http://oss.lagou.com","monitorweight": 10,"monitorname": "\\u804c\\u4f4d\\u641c\\u7d22"}]}'
>>> #最終可以用json.loads()了徐勃。
>>> json.loads(s3)
{u'product': u'\u62c9\u52fe\u7f51', u'monitors': [{u'use': 100, u'monitorweight': 10, u'monitorname': u'\u804c\u4f4d\u641c\u7d22', u'monitorurl': u'http://oss.lagou.com'}], u'downtime': 3.1280000000000001}
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市早像,隨后出現(xiàn)的幾起案子僻肖,更是在濱河造成了極大的恐慌,老刑警劉巖卢鹦,帶你破解...
    沈念sama閱讀 222,000評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件檐涝,死亡現(xiàn)場離奇詭異,居然都是意外死亡法挨,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,745評論 3 399
  • 文/潘曉璐 我一進(jìn)店門幅聘,熙熙樓的掌柜王于貴愁眉苦臉地迎上來凡纳,“玉大人,你說我怎么就攤上這事帝蒿〖雒樱” “怎么了?”我有些...
    開封第一講書人閱讀 168,561評論 0 360
  • 文/不壞的土叔 我叫張陵葛超,是天一觀的道長暴氏。 經(jīng)常有香客問我,道長绣张,這世上最難降的妖魔是什么答渔? 我笑而不...
    開封第一講書人閱讀 59,782評論 1 298
  • 正文 為了忘掉前任,我火速辦了婚禮侥涵,結(jié)果婚禮上沼撕,老公的妹妹穿的比我還像新娘。我一直安慰自己芜飘,他們只是感情好务豺,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,798評論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著嗦明,像睡著了一般笼沥。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上娶牌,一...
    開封第一講書人閱讀 52,394評論 1 310
  • 那天奔浅,我揣著相機(jī)與錄音,去河邊找鬼裙戏。 笑死乘凸,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的累榜。 我是一名探鬼主播营勤,決...
    沈念sama閱讀 40,952評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼灵嫌,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了葛作?” 一聲冷哼從身側(cè)響起寿羞,我...
    開封第一講書人閱讀 39,852評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎赂蠢,沒想到半個月后绪穆,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,409評論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡虱岂,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,483評論 3 341
  • 正文 我和宋清朗相戀三年玖院,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片第岖。...
    茶點(diǎn)故事閱讀 40,615評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡难菌,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出蔑滓,到底是詐尸還是另有隱情郊酒,我是刑警寧澤,帶...
    沈念sama閱讀 36,303評論 5 350
  • 正文 年R本政府宣布键袱,位于F島的核電站燎窘,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏蹄咖。R本人自食惡果不足惜褐健,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,979評論 3 334
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望比藻。 院中可真熱鬧铝量,春花似錦、人聲如沸银亲。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,470評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽务蝠。三九已至拍谐,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間馏段,已是汗流浹背轩拨。 一陣腳步聲響...
    開封第一講書人閱讀 33,571評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留院喜,地道東北人亡蓉。 一個月前我還...
    沈念sama閱讀 49,041評論 3 377
  • 正文 我出身青樓,卻偏偏與公主長得像喷舀,于是被迫代替她去往敵國和親砍濒。 傳聞我的和親對象是個殘疾皇子淋肾,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,630評論 2 359

推薦閱讀更多精彩內(nèi)容

  • Startup 單元測試的核心價值在于兩點(diǎn): 更加精確地定義某段代碼的作用,從而使代碼的耦合性更低 避免程序員寫出...
    wuwenxiang閱讀 10,104評論 1 27
  • 工欲善其事爸邢,必先利其器樊卓,第一次從頭開始打造自己的vim,特記錄下流程~安裝插件有:bundle, YouCompl...
    tianxinheihei閱讀 1,985評論 0 4
  • 說明本次redis集群安裝在rhel6.8 64位機(jī)器上杠河,redis版本為3.2.8碌尔,redis的gem文件版本為...
    讀或?qū)?/span>閱讀 14,822評論 3 9
  • 霄虹霓影透煙云 匠心憫思意縝沉 月皓當(dāng)空映清薄 彰彌塵凡品仁心
    寂寞時聽雨閱讀 263評論 0 0
  • 按照中國傳統(tǒng)的虛歲來算,我扎扎實(shí)實(shí)的三十歲了券敌。我成長的道路再普通不過唾戚,中等的智商和樣貌,讀了中等的大學(xué)待诅,在“穩(wěn)定的...
    蠟筆小櫻閱讀 216評論 1 2