如何給列表降維炸裆?sum()函數(shù)的妙用
例子如下:
oldlist = [[1, 2, 3], [4, 5]]
# 想得到結(jié)果:
newlist = [1, 2, 3, 4, 5]
原始數(shù)據(jù)是一個二維列表垃它,目的是獲取該列表中所有元素的具體值。從抽象一點(diǎn)的角度來理解烹看,也可看作是列表解壓或者列表降維国拇。
這個問題并不難,但是惯殊,怎么寫才比較優(yōu)雅呢贝奇?
# 方法一,粗暴拼接法:
newlist = oldlist[0] + oldlist[1]
這種方法簡單粗暴靠胜,需要拼接什么內(nèi)容,就取出來直接拼接毕源。然而浪漠,如果原列表有很多子列表,則這個方法就會變得繁瑣了霎褐。
我們把原問題升級一下:一個二維列表包含 n 個一維列表元素址愿,如何優(yōu)雅地把這些子列表拼成一個新的一維列表?
方法一的做法需要寫 n 個對象冻璃,以及 n - 1 次拼接操作响谓。當(dāng)然不可行。下面看看方法二:
# 方法二省艳,列表推導(dǎo)式:
newlist = [i for j in range(len(oldlist)) for i in oldlist[j]]
這個表達(dá)式中出現(xiàn)了兩個 for 語句娘纷,在第一個 for 語句中,我們先取出原列表的長度跋炕,然后構(gòu)造 range 對象赖晶,此時 j 的取值范圍是 [0, n-1] 的閉區(qū)間。
在第二個 for 語句中辐烂,oldlist[j] 指的正是原列表的第 j 個子列表遏插,for i in oldlist[j]
則會遍歷取出 j 子列表的元素,由于 j 取值的區(qū)間正對應(yīng)于原列表的全部索引值纠修,所以胳嘲,最終達(dá)到解題目的。
這種方法足夠優(yōu)雅了扣草,而且理解也并不難了牛。
然而颜屠,我們是否就能滿足于此了呢?有沒有其它奇技淫巧白魂,哦不汽纤,是其它高級方法呢?F 同學(xué)貢獻(xiàn)了一個思路:
# 方法三福荸,巧用sum:
newlist = sum(oldlist,[])
說實(shí)話蕴坪,這個方法令我大感意外!sum() 函數(shù)不是用于求和的么敬锐?怎么竟然有此用法背传?
這個寫法利用了什么原理呢?由于我開始時不知道 sum() 函數(shù)可以接收兩個參數(shù)台夺,不清楚它們是怎么用于計(jì)算的径玖,所以一度很困惑。但是颤介,當(dāng)我知道 sum() 的完整用法時梳星,我恍然大悟。
接下來也不賣關(guān)子了滚朵,直接揭曉吧冤灾。
語法: sum(iterable[, start])
,sum() 函數(shù)的第一個參數(shù)是可迭代對象辕近,如列表韵吨、元組或集合等,第二個參數(shù)是起始值移宅,默認(rèn)為 0 归粉。其用途是以 start 值為基礎(chǔ),再與可迭代對象的所有元素相“加”漏峰。
在上例中糠悼,執(zhí)行效果是 oldlist 中的子列表逐一與第二個參數(shù)相加,而列表的加法相當(dāng)于 extend 操作芽狗,所以最終結(jié)果是由 [] 擴(kuò)充成的列表绢掰。
這里有兩個關(guān)鍵點(diǎn):sum() 函數(shù)允許帶兩個參數(shù),且第二個參數(shù)才是起點(diǎn)童擎。 可能 sum() 函數(shù)用于數(shù)值求和比較多滴劲,然而用于作列表的求和,就有奇效顾复。它比列表推導(dǎo)式更加優(yōu)雅簡潔班挖!
至此,前面的升級版問題就得到了很好的回答芯砸。簡單回顧一下萧芙,s 同學(xué)最初的問題可以用三種方法實(shí)現(xiàn)给梅,第一種方法中規(guī)中矩,第二種方法正道進(jìn)階双揪,而第三種方法旁門左道(沒有貶義动羽,只是說它出人意料,卻效果奇佳)渔期。
這道并不算難的問題运吓,在眾人的討論與分享后,竟還引出了很有價值的學(xué)習(xí)內(nèi)容疯趟。前不久拘哨,同樣是群內(nèi)的一個問題,也產(chǎn)生了同樣的學(xué)習(xí)效果信峻,詳見《Python進(jìn)階:如何將字符串常量轉(zhuǎn)為變量倦青?》。
我從中得到了一個啟示:應(yīng)該多角度地思考問題盹舞,設(shè)法尋求更優(yōu)解产镐,同時,基礎(chǔ)知識應(yīng)掌握牢固踢步,并靈活貫通起來磷账。
學(xué)無止境,這里我還想再開拓一下思路贾虽,看看能發(fā)現(xiàn)些什么。
1吼鱼、如果原列表的元素除了列表蓬豁,還有其它類型的元素,怎么把同類的元素歸并在一起呢菇肃?
2地粪、如果是一個三維或更高維的列表,怎么更好地把它們壓縮成一維列表呢琐谤?
3蟆技、sum() 函數(shù)還有什么知識要點(diǎn)呢?
前兩個問題增加了復(fù)雜度斗忌,解決起來似乎沒有“靈丹妙藥”了质礼,只能用笨方法分別拆解,逐一解壓织阳。
第三個思考題是關(guān)于 sum() 函數(shù)本身的用法,我們看看官方文檔是怎么說的:
The iterable’s items are normally numbers, and the start value is not allowed to be a string.
For some use cases, there are good alternatives to
sum()
. The preferred, fast way to concatenate a sequence of strings is by calling''.join(sequence)
. To add floating point values with extended precision, seemath.fsum()
. To concatenate a series of iterables, consider usingitertools.chain()
.
sum() 的第二個參數(shù)不允許是字符串。如果用了枕磁,會報(bào)錯:
TypeError: sum() can't sum strings [use ''.join(seq) instead]
為什么不建議使用 sum() 來拼接字符串呢?哈哈碱璃,文檔中建議使用 join() 方法,因?yàn)樗旆谷搿榱瞬唤o我們使用慢的方法嵌器,它竟特別限定不允許 sum() 的第二個參數(shù)是字符串。
文檔還建議谐丢,在某些使用場景時爽航,不要用 sum() ,例如當(dāng)以擴(kuò)展精度對浮點(diǎn)數(shù)求和時庇谆,推薦使用 math.fsum()
岳掐;當(dāng)要拼接一系列的可迭代對象時,應(yīng)考慮使用 itertools.chain()
饭耳。
浮點(diǎn)數(shù)的計(jì)算是個難題串述,我曾轉(zhuǎn)載過一篇《如何在 Python 里面精確四舍五入?》寞肖,對此有精彩分析纲酗。而itertools.chain()
可以將不同類型的可迭代對象串聯(lián)成一個更大的迭代器,這在舊文《Python進(jìn)階:設(shè)計(jì)模式之迭代器模式》中也有論及新蟆。
不經(jīng)意間觅赊,sum() 函數(shù)的注意事項(xiàng),竟把 Python 其它的進(jìn)階內(nèi)容都聯(lián)系起來了琼稻。小小的函數(shù)吮螺,竟成為學(xué)習(xí)之路上的一個樞紐。