過濾序列元素

問題

你有一個數(shù)據(jù)序列臀防,想利用一些規(guī)則從中提取出需要的值或者是縮短序列

解決方案

最簡單的過濾序列元素的方法就是使用列表推導(dǎo)衅檀。比如:

>>> mylist = [1, 4, -5, 10, -7, 2, 3, -1]
>>> [n for n in mylist if n > 0]
[1, 4, 10, 2, 3]
>>> [n for n in mylist if n < 0]
[-5, -7, -1]
>>>
使用列表推導(dǎo)的一個潛在缺陷就是如果輸入非常大的時候會產(chǎn)生一個非常大的結(jié)果集梨撞,占用大量內(nèi)存贰剥。 如果你對內(nèi)存比較敏感弹沽,那么你可以使用生成器表達(dá)式迭代產(chǎn)生過濾的元素畴嘶。比如:
>>> pos = (n for n in mylist if n > 0)
>>> pos
<generator object <genexpr> at 0x1006a0eb0>
>>> for x in pos:
... print(x)
...
1
4
10
2
3
>>>
有時候脆荷,過濾規(guī)則比較復(fù)雜凝垛,不能簡單的在列表推導(dǎo)或者生成器表達(dá)式中表達(dá)出來。 比如蜓谋,假設(shè)過濾的時候需要處理一些異趁纹ぃ或者其他復(fù)雜情況。這時候你可以將過濾代碼放到一個函數(shù)中桃焕, 然后使用內(nèi)建的 filter() 函數(shù)剑肯。示例如下:
values = ['1', '2', '-3', '-', '4', 'N/A', '5']
def is_int(val):
    try:
        x = int(val)
        return True
    except ValueError:
        return False
ivals = list(filter(is_int, values))
print(ivals)
# Outputs ['1', '2', '-3', '4', '5']
filter() 函數(shù)創(chuàng)建了一個迭代器,因此如果你想得到一個列表的話观堂,就得像示例那樣使用 list() 去轉(zhuǎn)換让网。

進(jìn)一步思考

列表推導(dǎo)和生成器表達(dá)式通常情況下是過濾數(shù)據(jù)最簡單的方式。 其實它們還能在過濾的時候轉(zhuǎn)換數(shù)據(jù)师痕。比如:
>>> mylist = [1, 4, -5, 10, -7, 2, 3, -1]
>>> import math
>>> [math.sqrt(n) for n in mylist if n > 0]
[1.0, 2.0, 3.1622776601683795, 1.4142135623730951, 1.7320508075688772]
>>>
過濾操作的一個變種就是將不符合條件的值用新的值代替溃睹,而不是丟棄它們。 比如胰坟,在一列數(shù)據(jù)中你可能不僅想找到正數(shù)因篇,而且還想將不是正數(shù)的數(shù)替換成指定的數(shù)。 通過將過濾條件放到條件表達(dá)式中去笔横,可以很容易的解決這個問題竞滓,就像這樣:
>>> clip_neg = [n if n > 0 else 0 for n in mylist]
>>> clip_neg
[1, 4, 0, 10, 0, 2, 3, 0]
>>> clip_pos = [n if n < 0 else 0 for n in mylist]
>>> clip_pos
[0, 0, -5, 0, -7, 0, 0, -1]
>>>
另外一個值得關(guān)注的過濾工具就是 itertools.compress() , 它以一個 iterable 對象和一個相對應(yīng)的 Boolean 選擇器序列作為輸入?yún)?shù)吹缔。 然后輸出 iterable 對象中對應(yīng)選擇器為 True 的元素商佑。 當(dāng)你需要用另外一個相關(guān)聯(lián)的序列來過濾某個序列的時候,這個函數(shù)是非常有用的涛菠。 比如莉御,假如現(xiàn)在你有下面兩列數(shù)據(jù):
addresses = [
    '5412 N CLARK',
    '5148 N CLARK',
    '5800 E 58TH',
    '2122 N CLARK',
    '5645 N RAVENSWOOD',
    '1060 W ADDISON',
    '4801 N BROADWAY',
    '1039 W GRANVILLE',
]
counts = [ 0, 3, 10, 4, 1, 7, 6, 1]
現(xiàn)在你想將那些對應(yīng) count 值大于5的地址全部輸出撇吞,那么你可以這樣做:
>>> from itertools import compress
>>> more5 = [n > 5 for n in counts]
>>> more5
[False, False, True, False, False, True, True, False]
>>> list(compress(addresses, more5))
['5800 E 58TH', '1060 W ADDISON', '4801 N BROADWAY']
>>>
這里的關(guān)鍵點在于先創(chuàng)建一個 Boolean 序列,指示哪些元素符合條件礁叔。 然后 compress() 函數(shù)根據(jù)這個序列去選擇輸出對應(yīng)位置為 True 的元素牍颈。和 filter() 函數(shù)類似, compress() 也是返回的一個迭代器琅关。因此煮岁,如果你需要得到一個列表, 那么你需要使用 list() 來將結(jié)果轉(zhuǎn)換為列表類型涣易。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末画机,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子新症,更是在濱河造成了極大的恐慌步氏,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,376評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件徒爹,死亡現(xiàn)場離奇詭異荚醒,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)隆嗅,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,126評論 2 385
  • 文/潘曉璐 我一進(jìn)店門界阁,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人胖喳,你說我怎么就攤上這事泡躯。” “怎么了丽焊?”我有些...
    開封第一講書人閱讀 156,966評論 0 347
  • 文/不壞的土叔 我叫張陵较剃,是天一觀的道長。 經(jīng)常有香客問我粹懒,道長重付,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,432評論 1 283
  • 正文 為了忘掉前任凫乖,我火速辦了婚禮确垫,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘帽芽。我一直安慰自己删掀,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,519評論 6 385
  • 文/花漫 我一把揭開白布导街。 她就那樣靜靜地躺著披泪,像睡著了一般。 火紅的嫁衣襯著肌膚如雪搬瑰。 梳的紋絲不亂的頭發(fā)上款票,一...
    開封第一講書人閱讀 49,792評論 1 290
  • 那天控硼,我揣著相機(jī)與錄音,去河邊找鬼艾少。 笑死卡乾,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的缚够。 我是一名探鬼主播幔妨,決...
    沈念sama閱讀 38,933評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼谍椅!你這毒婦竟也來了误堡?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,701評論 0 266
  • 序言:老撾萬榮一對情侶失蹤雏吭,失蹤者是張志新(化名)和其女友劉穎锁施,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體思恐,經(jīng)...
    沈念sama閱讀 44,143評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡沾谜,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,488評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了胀莹。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,626評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡婚温,死狀恐怖描焰,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情栅螟,我是刑警寧澤荆秦,帶...
    沈念sama閱讀 34,292評論 4 329
  • 正文 年R本政府宣布,位于F島的核電站力图,受9級特大地震影響步绸,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜吃媒,卻給世界環(huán)境...
    茶點故事閱讀 39,896評論 3 313
  • 文/蒙蒙 一瓤介、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧赘那,春花似錦刑桑、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,742評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至拱礁,卻和暖如春琢锋,著一層夾襖步出監(jiān)牢的瞬間辕漂,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評論 1 265
  • 我被黑心中介騙來泰國打工吴超, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留钮热,地道東北人。 一個月前我還...
    沈念sama閱讀 46,324評論 2 360
  • 正文 我出身青樓烛芬,卻偏偏與公主長得像隧期,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子赘娄,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,494評論 2 348

推薦閱讀更多精彩內(nèi)容

  • 問題 一個數(shù)據(jù)序列仆潮,想利用一些規(guī)則從中提取出需要的值或者是縮短序列。 解決問題 最簡單的過濾序列元素的方法就是使用...
    惑也閱讀 494評論 0 7
  • 與map類似遣臼,filter也是·接受·一個函數(shù)和一個序列做參數(shù)性置。filter()把傳入的函數(shù)依次作用于每個元素,然...
    海闊天空呢閱讀 215評論 0 0
  • 今天又是精力被透支的一天揍堰,從上班忙到下班鹏浅,片刻的空隙也只能和同事調(diào)侃幾句,沒有時間和精力給自己充電屏歹。 回到家隐砸,感覺...
    snailwww閱讀 104評論 0 0
  • 首先 去Mac上的App Store下載Apple Configurator 2。 然后把iphone連接上Mac...
    哎喲丶我去閱讀 3,965評論 0 3
  • 單純一點蝙眶, 簡簡單單的季希, 生活也就沒有那么多煩惱。 同學(xué)說幽纷, 懵懂無知式塌, 說好聽點, 叫單純友浸, 難聽的話峰尝, 那就是...
    發(fā)芽的種子娜閱讀 157評論 6 15