0. 用變量產(chǎn)生字符串的方法
f'getNthHighestSalary_{N}'
1. 從列表建立DataFrame
輸入:student_data:[?[1, 15], [2, 11], [3, 11],? [4, 20] ]
pd.DataFrame(student_data, columns=['student_id', 'age'])
2. 改變一列的數(shù)據(jù)類型
students['grade'] = students['grade'].astype(int)
3. 改變dataframe結(jié)構(gòu)
縱向黏貼:pd.concat([df1, df2], ignore_index=True)
輸入三列,一列作為index贴彼,一列作為列名烘浦,一列作為值,輸出橫表:weather.pivot(index='product', columns='quarter', values='sales')
上一個的反操作:pd.melt(report, id_vars=['product'], var_name='quarter', value_name='sales')
4. 按條件提取所需數(shù)據(jù)
# DataFrame的條件放在[]里甲喝,需要提取的列名是個列表。因此[['name','population', 'area']]
world[(world['area'] >= 3000000) | (world['population'] >= 25000000)][['name','population', 'area']]
5. 用merge橫向并表
merged_data = pd.merge(customers, orders, on='customerId', how='left')
6. 去重和排序
ans = ans.drop_duplicates(subset=['id'])
ans = ans.sort_values(by=['id'])
7.?如果 DataFrame 的列是字符串類型,可以使用.str方法來對字符串進行操作鼻由。
以下是一些可以在.str方法下使用的函數(shù):
lower(): 將字符串轉(zhuǎn)換為小寫担钮。
upper(): 將字符串轉(zhuǎn)換為大寫橱赠。
title(): 將字符串中每個單詞的首字母大寫。
capitalize(): 將字符串的第一個字符轉(zhuǎn)換為大寫箫津,其余字符轉(zhuǎn)換為小寫狭姨。
strip(): 去除字符串兩端的空格宰啦。
replace(): 替換字符串中的子串。
split(): 將字符串分割成子串饼拍。
contains(): 判斷字符串是否包含某個子串赡模。
startswith(): 判斷字符串是否以某個子串開頭。
endswith(): 判斷字符串是否以某個子串結(jié)尾师抄。
isdigit(): 判斷字符串是否只包含數(shù)字字符漓柑。
isalpha(): 判斷字符串是否只包含字母字符。
isalnum(): 判斷字符串是否只包含字母和數(shù)字字符叨吮。
len(): 返回字符串的長度辆布。
8. 調(diào)用自定義函數(shù)的方法
apply():允許在 DataFrame 的列上應用自定義的函數(shù),這個函數(shù)會作用于列上的每一個元素茶鉴。
transform():通常用于按組操作锋玲,通常與groupby()結(jié)合使用『#可以返回一個與輸入大小相同的對象(例如 Series 或 DataFrame)惭蹂,且與輸入具有相同的索引。
agg()/aggregate():通常用于聚合數(shù)據(jù)割粮,與groupby()結(jié)合使用盾碗。可以在每個分組上應用一個或多個聚合函數(shù)穆刻≈枚可以用于 DataFrame 或 Series。
常用的聚合函數(shù)有 df.groupby('Group').agg({'Value': ['min', 'median', 'max', 'std', 'var', 'sum', 'count', 'nunique',? 'size', 'first', 'last']})
applymap():類似于apply()氢伟,但只能應用于 DataFrame榜轿,作用于每個元素,相當于map()作用于每一列的每個元素朵锣。
map():只能應用于 Series谬盐,作用于 Series 的每個元素。
9. 產(chǎn)生排名的函數(shù) .rank()
ans['rank'] = ans['score'].rank(method='dense', ascending=False)诚些。method可選參數(shù)還有‘a(chǎn)verage’, ‘min’, ‘max’, ‘first’, ‘dense’
10. agg()函數(shù)的應用?1484. Group Sold Products By The Date