知識(shí)點(diǎn)

@Unicode

我們知道unicode是一種編碼標(biāo)準(zhǔn),具體的實(shí)現(xiàn)標(biāo)準(zhǔn)可能是utf-8糊秆,utf-16鹏往,gbk ……

python 在內(nèi)部使用兩個(gè)字節(jié)來存儲(chǔ)一個(gè)unicode,使用unicode對(duì)象而不是str的好處覆旱,就是unicode方便于跨平臺(tái)蘸朋。

當(dāng)對(duì)str進(jìn)行編碼時(shí),會(huì)先用默認(rèn)編碼將自己解碼為unicode扣唱,然后在將unicode編碼為你指定編碼,這就引出了python2.x中在處理中文時(shí)藕坯,大多數(shù)出現(xiàn)錯(cuò)誤的原因所在:python的默認(rèn)編碼,defaultencoding是ascii;

如果你在python中進(jìn)行編碼和解碼的時(shí)候噪沙,不指定編碼方式炼彪,那么python就會(huì)使用defaultencoding。默認(rèn)的defaultcoding:ascii是許多錯(cuò)誤的原因正歼,所以早早的設(shè)置defaultencoding是一個(gè)好習(xí)慣辐马。

u = unicode("人生苦短") 等價(jià)于 u = unicode("人生苦短",defaultencoding)

解碼:其他編碼--> unicode

編碼:unicode-->其他編碼

文件頭聲明編碼的作用:頂部的:# -*- coding: utf-8 -*-目前看來有三個(gè)作用。

? ? 1局义、如果代碼中有中文注釋喜爷,就需要此聲明

? ? 2、比較高級(jí)的編輯器(比如我的emacs)會(huì)根據(jù)頭部聲明旭咽,將此作為代碼文件的格式贞奋。

? ? 3、程序會(huì)通過頭部聲明穷绵,解碼初始化 u”人生苦短”轿塔,這樣的unicode對(duì)象,(所以頭部聲明和代碼的存儲(chǔ)格式要一致)

@仲墨、re

pat = ' "nid":(.*?)'

body = response.body.decode("utf-8","ignore")

re.compile(pat).findall(body)或者 re.findall(pat,body) 返回的是列表

如果你的desc是str

? ? desc =sel.xpath('//div[@class="des"]').extract()[0]

? ? item['italy'] = re.search('意大利:(.*?)西班牙',desc,re.S | re.M).group(1)

? ? item['spain'] = re.search('西班牙:(.*?)',desc,re.S | re.M).group(1)

如果你的desc是unicode

? ? desc =sel.xpath('//div[@class="des"]').extract()[0]

? ? item['italy'] = re.search(u'意大利:(.*?)西班牙',desc,re.S | re.M).group(1)

? ? item['spain'] = re.search(u'西班牙:(.*?)',desc,re.S | re.M).group(1)

@勾缭、yield

從控制權(quán)來說。函數(shù)里遇到return時(shí)目养,控制權(quán)交給主線程俩由,然后沒這個(gè)函數(shù)什么事了。如果遇到y(tǒng)ield癌蚁,控制權(quán)只是暫時(shí)交給主線程幻梯,函數(shù)繼續(xù)在那等著。另外努释,函數(shù)里出現(xiàn)yield就自動(dòng)變成生成器碘梢。

@、__future__

Python提供了__future__模塊伐蒂,把下一個(gè)新版本的特性導(dǎo)入到當(dāng)前版本煞躬,于是我們就可以在當(dāng)前版本中測(cè)試一些新版本的特性。舉例說明如下:

為了適應(yīng)Python 3.x的新的字符串的表示方法,在2.7版本的代碼中恩沛,可以通過unicode_literals來使用Python 3.x的新的語(yǔ)法

from__future__importunicode_literals

@在扰、pass

pass就是什么也不做,只是為了防止語(yǔ)法錯(cuò)誤雷客,比如:

if a>1:

? ? ? pass#我這里先不做任何處理芒珠,直接跳過,但是如果不寫pass搅裙,就會(huì)語(yǔ)法錯(cuò)誤

當(dāng)你在編寫一個(gè)程序時(shí)妓局,執(zhí)行語(yǔ)句部分思路還沒有完成,這時(shí)你可以用pass語(yǔ)句來占位呈宇,也可以當(dāng)做是一個(gè)標(biāo)記,是要過后來完成的代碼局雄。比如下面這樣:

>>>defiplaypython():>>>pass

定義一個(gè)函數(shù)iplaypython甥啄,但函數(shù)體部分暫時(shí)還沒有完成,又不能空著不寫內(nèi)容炬搭,因此可以用pass來替代占個(gè)位置蜈漓。

@、append和extend

append和extend針對(duì)python的列表

列表內(nèi)的元素為對(duì)象宫盔,可以為數(shù)字融虽、字符串、列表等等

append添加的是一個(gè)對(duì)象

extend添加一個(gè)列表


append

>>> append_list = []
>>> append_list.append(1)
>>> append_list.append('a')
>>> append_list.append(['ssss'])
>>> append_list
[1, 'a', ['ssss']]

extend

>>> extend_list = []
>>> extend_list.extend(1)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: 'int' object is not iterable
>>> extend_list.extend([1])
>>> extend_list.extend(["a", [3, 4] ])
>>> extend_list
[1, 'a', [3, 4]]
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末灼芭,一起剝皮案震驚了整個(gè)濱河市有额,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌彼绷,老刑警劉巖巍佑,帶你破解...
    沈念sama閱讀 216,372評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異寄悯,居然都是意外死亡萤衰,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門猜旬,熙熙樓的掌柜王于貴愁眉苦臉地迎上來脆栋,“玉大人,你說我怎么就攤上這事洒擦〈徽” “怎么了?”我有些...
    開封第一講書人閱讀 162,415評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵秘遏,是天一觀的道長(zhǎng)丘薛。 經(jīng)常有香客問我,道長(zhǎng)邦危,這世上最難降的妖魔是什么洋侨? 我笑而不...
    開封第一講書人閱讀 58,157評(píng)論 1 292
  • 正文 為了忘掉前任舍扰,我火速辦了婚禮,結(jié)果婚禮上希坚,老公的妹妹穿的比我還像新娘边苹。我一直安慰自己,他們只是感情好裁僧,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評(píng)論 6 388
  • 文/花漫 我一把揭開白布个束。 她就那樣靜靜地躺著,像睡著了一般聊疲。 火紅的嫁衣襯著肌膚如雪茬底。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,125評(píng)論 1 297
  • 那天获洲,我揣著相機(jī)與錄音阱表,去河邊找鬼。 笑死贡珊,一個(gè)胖子當(dāng)著我的面吹牛最爬,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播门岔,決...
    沈念sama閱讀 40,028評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼爱致,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了寒随?” 一聲冷哼從身側(cè)響起糠悯,我...
    開封第一講書人閱讀 38,887評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎妻往,沒想到半個(gè)月后逢防,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,310評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡蒲讯,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評(píng)論 2 332
  • 正文 我和宋清朗相戀三年忘朝,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片判帮。...
    茶點(diǎn)故事閱讀 39,690評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡局嘁,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出晦墙,到底是詐尸還是另有隱情悦昵,我是刑警寧澤,帶...
    沈念sama閱讀 35,411評(píng)論 5 343
  • 正文 年R本政府宣布晌畅,位于F島的核電站但指,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜棋凳,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評(píng)論 3 325
  • 文/蒙蒙 一拦坠、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧剩岳,春花似錦贞滨、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至绰播,卻和暖如春骄噪,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背蠢箩。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評(píng)論 1 268
  • 我被黑心中介騙來泰國(guó)打工腰池, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人忙芒。 一個(gè)月前我還...
    沈念sama閱讀 47,693評(píng)論 2 368
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像讳侨,于是被迫代替她去往敵國(guó)和親呵萨。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容