今天學(xué)習(xí)的是第二章Pandas基礎(chǔ)倍阐。
有幾個(gè)函數(shù)我覺(jué)得挺有用的概疆,記錄一下:
-
唯一值函數(shù)unique和nunique
、以及value_counts
-
要觀(guān)察多個(gè)列組合的唯一值峰搪,可使用 drop_duplicates 岔冀。其中的關(guān)鍵參數(shù)是 keep ,默認(rèn)值 first 表示每個(gè)組合保留第一次出現(xiàn)的所在行概耻, last 表示保留最后一次出現(xiàn)的所在行使套, False 表示把所有重復(fù)組合所在的行剔除罐呼。
-
替換函數(shù)。替換操作是針對(duì)某一個(gè)列進(jìn)行的侦高。在 replace 中嫉柴,可以通過(guò)字典構(gòu)造,或者傳入兩個(gè)列表來(lái)進(jìn)行替換:
-
邏輯替換奉呛。邏輯替換包括了 where 和 mask 差凹,這兩個(gè)函數(shù)是完全對(duì)稱(chēng)的: where 函數(shù)在傳入條件為 False 的對(duì)應(yīng)行進(jìn)行替換,而 mask 在傳入條件為 True 的對(duì)應(yīng)行進(jìn)行替換侧馅,當(dāng)不指定替換值時(shí)危尿,替換為缺失值。
-
排序函數(shù)馁痴。排序共有兩種方式谊娇,其一為值排序,其二為索引排序罗晕,對(duì)應(yīng)的函數(shù)是 sort_values 和 sort_index 济欢。
-
對(duì) HP, Attack, Defense, Sp. Atk, Sp. Def, Speed 進(jìn)行加總,驗(yàn)證是否為 Total 值小渊。
-
對(duì)于 # 重復(fù)的妖怪只保留第一條記錄法褥,解決以下問(wèn)題:
a. 求第一屬性的種類(lèi)數(shù)量和前三多數(shù)量對(duì)應(yīng)的種類(lèi)
b. 求第一屬性和第二屬性的組合種類(lèi)
c. 求尚未出現(xiàn)過(guò)的屬性組合
3.按照下述要求,構(gòu)造 Series :
a. 取出物攻酬屉,超過(guò)120的替換為 high 半等,不足50的替換為 low ,否則設(shè)為 mid
b. 取出第一屬性呐萨,分別用 replace 和 apply 替換所有字母為大寫(xiě)
c. 求每個(gè)妖怪六項(xiàng)能力的離差杀饵,即所有能力中偏離中位數(shù)最大的值,添加到 df 并從大到小排序
這道題真的是一點(diǎn)不會(huì)谬擦,只能照著答案抄了切距,太菜了。