python可以將boolean類型的值做加法運(yùn)算 True + True == 2
pandas與numpy的使用方法類似统台,numpy是array,而pandas是series。
a = pd.Series([1, 2, 3, 4])
b = pd.Series([1, 2, 1, 2])
print a[0]??
print a + b
print a * 2
print a >= 3
print a[a >= 3]
pandas可以將一個(gè)list當(dāng)做另一個(gè)list的索引組成一個(gè)series,如employment = pd.Series(employment_values, index=countries)勿锅,如果不指定帕膜,則默認(rèn)索引是其所在位置0,1,2...
獲取最大值所在的索引employment .argmax(),用employment .loc[employment .argmax()]獲取其value
與numpy array不同溢十,pandas的series的向量運(yùn)算是根據(jù)索引去匹配運(yùn)算的垮刹,如下
s1 = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
s2 = pd.Series([10, 20, 30, 40], index=['b', 'd', 'a', 'c'])
print s1 + s2
s1 = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
s2 = pd.Series([10, 20, 30, 40], index=['c', 'd', 'e', 'f'])
print s1 + s2
可以使用add方法填補(bǔ)缺失值
s1 = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
s2 = pd.Series([10, 20, 30, 40], index=['c', 'd', 'e', 'f'])
print s1.add(s2, fill_value=0)