Python分布隨機(jī)數(shù)的生成和對(duì)數(shù)據(jù)框的逆序排列
(Reverse Pandas Data Frame)
??在網(wǎng)上看到了Erik Marsja博客中提到對(duì)數(shù)據(jù)框進(jìn)行逆序排序的方法,受益匪淺梯醒,于是通過以下筆記記錄了reverse的內(nèi)容和注釋方便查閱,順便簡(jiǎn)單介紹numpy中的兩種生成隨機(jī)數(shù)的方法中贝。
具體參見Erik的博客
生成隨機(jī)數(shù)
??據(jù)過程中使用到的兩種生成隨機(jī)數(shù)的方法烂瘫,分別是normal和binomial扎即,詳情如下醒第。
1.np.random.normal
??np.random.normal
的作用是獲取正態(tài)(高斯)分布上的隨機(jī)樣本點(diǎn)花沉。正態(tài)分布在自然界中經(jīng)常發(fā)生柳爽。例如,它描述了受大量微小碱屁、隨機(jī)干擾影響的樣本的常見分布磷脯,在這里給出正態(tài)分布的密度函數(shù)及其解釋,如下:
為均值娩脾;
為標(biāo)準(zhǔn)差赵誓。
?與正態(tài)分布對(duì)應(yīng),函數(shù)格式為:numpy.random.normal(loc=0.0, scale=1.0, size=None)? 參數(shù)解釋如下:loc:分布的均值(中心);
scale:分布的標(biāo)準(zhǔn)偏差(擴(kuò)展或?qū)挾龋?
size:輸出的個(gè)數(shù)或形態(tài)俩功,e.g., (m, n, k)隘冲。
??代碼示例如下:
import numpy as np # 加載相關(guān)包
mu, sigma = 0, 0.1 # 均值和標(biāo)準(zhǔn)差
s = np.random.normal(mu, sigma, 10) # 生成隨機(jī)數(shù)
s # 展示數(shù)據(jù)
輸出結(jié)果為以0為均值(中心),0.1為標(biāo)準(zhǔn)差绑雄,長(zhǎng)度為10的隨機(jī)數(shù)列。
2.np.random.binomial
??np.random.binomial`的作用是獲取二項(xiàng)分布上的隨機(jī)樣本點(diǎn)奥邮。二項(xiàng)分布的概率密度函數(shù)及其展示如下:
- 為試驗(yàn)數(shù)万牺;
- 為成功的概率;
-
為成功的事件數(shù)洽腺。
??與二項(xiàng)分布對(duì)應(yīng)脚粟,函數(shù)格式為numpy.random.binomial(n, p, size=None),參數(shù)解釋如下: - n:分布參數(shù),值>=0蘸朋;
- p:概率分布參數(shù)核无,值在0-1之間;
- size:輸出的個(gè)數(shù)或形態(tài)藕坯,e.g., (m, n, k)团南。
代碼示例如下:
import numpy as np # 加載相關(guān)包
n, p = 10, .5 # 分布參數(shù)和概率分布參數(shù)
s = np.random.binomial(n, p, 10) # 生成隨機(jī)數(shù)
s # 展示數(shù)據(jù)
??輸出結(jié)果為以10為分布數(shù),0.5為概率分布參數(shù)炼彪,長(zhǎng)度為10的隨機(jī)數(shù)列吐根。
數(shù)據(jù)準(zhǔn)備
通過上述介紹np.random中的normal(正態(tài)分布)和binomial(二項(xiàng)分布)構(gòu)建數(shù)據(jù),并蔣數(shù)據(jù)構(gòu)建成數(shù)據(jù)框的形式辐马。
## 加載相關(guān)模塊
import pandas as pd
import numpy as np
distracted = [1 for i in range(15)] # 構(gòu)建15個(gè)均為1的list
normal_perf = [0 for i in range(15)] # 構(gòu)建15個(gè)均為0的list
sex = ['Male' if i%2 == 0 else 'Female' for i in range(30)] # 通過0/1構(gòu)建性別變量
rt_distracted = np.random.normal(1660, 100, 15) # 生成15個(gè)以1660為均值拷橘,100為標(biāo)準(zhǔn)差的概率分布的隨機(jī)數(shù)
rt_normal_perf = np.random.normal(1054, 97, 15) # 生成15個(gè)以1054為均值,197為標(biāo)準(zhǔn)差的概率分布的隨機(jī)數(shù)
accuracy_distracted = np.random.binomial(1, .79, 15) # 生成15個(gè)以n=1,p=0.75的二項(xiàng)分布隨機(jī)數(shù)
accuracy_normal_perf = np.random.binomial(1, .87, 15) # 生成15個(gè)以n=1,p=0.85的二項(xiàng)分布隨機(jī)數(shù)
rt = np.concatenate((rt_distracted, rt_normal_perf)) # 連接rt_distracted和rt_normal_perf兩序列
acc = np.concatenate((accuracy_distracted, accuracy_normal_perf)) # 連接accuracy_distracted和accuracy_normal_perf兩序列
distracted.extend(normal_perf) # 在末尾添加normal_perf的值
subject_id = [i for i in range(1,31)] # 創(chuàng)建1-30的id序列
data = {'Sub_id':subject_id, 'Condition':distracted, 'RT':rt, # 以字典形式構(gòu)建文件
'Accuracy':acc, 'Gender':sex}
data_frame = pd.DataFrame(data) # 轉(zhuǎn)換為數(shù)據(jù)框
data_frame.head() # 展示前五行數(shù)據(jù)
按列進(jìn)行逆序排列
??首先介紹按列進(jìn)行逆序排列喜爷,內(nèi)容包括了首尾列的對(duì)調(diào)和對(duì)所有列進(jìn)行的逆序排列冗疮。
1. 對(duì)調(diào)換Gender和Accuracy列
columns = data_frame.columns.tolist() # 獲取列名并轉(zhuǎn)換為list
columns = columns[-1:] + columns[:-1] # 對(duì)列名表進(jìn)行首尾調(diào)換
data_frame = data_frame[columns] # 對(duì)數(shù)據(jù)框中的列進(jìn)行調(diào)換
data_frame.head() # 展示前五行數(shù)據(jù)
- 對(duì)數(shù)據(jù)框的列進(jìn)行升序排列。[注:按字母順序排列 ]
data_frame = data_frame.sort_index(axis=1 ,ascending=True) # 按列名的字母進(jìn)行升序排列
data_frame.head() # 展示前五行數(shù)據(jù)
- 通過columns[::-1]或者columns.reverse()對(duì)所有列進(jìn)行逆序排列檩帐。
columns = data_frame.columns.tolist() # 獲取列名并轉(zhuǎn)換為list
columns = columns[::-1] # 對(duì)所有列進(jìn)行逆序排列
#columns.reverse() # 對(duì)所有列進(jìn)行逆序 排列【方法2】
data_frame = data_frame[columns] # 按列對(duì)數(shù)據(jù)框進(jìn)行逆序排列
data_frame.head() # 展示前五行數(shù)據(jù)
按行進(jìn)行逆序排列
數(shù)據(jù)框同樣可以對(duì)行進(jìn)行逆序排列术幔,在操作之前先用先前的方法對(duì)重新排列數(shù)據(jù)。
data_frame = data_frame.sort_index(axis=1 ,ascending=True) # 按列名的字母進(jìn)行升序排列
data_frame.head() # 展示前五行數(shù)據(jù)
??數(shù)據(jù)框同樣可以對(duì)行進(jìn)行逆序排列轿塔,在操作之前先用先前的方法對(duì)重新排列數(shù)據(jù)特愿。
- 通過iloc對(duì)數(shù)據(jù)框進(jìn)行逆序排序。
data_frame = data_frame.iloc[::-1] # 通過iloc索引對(duì)行進(jìn)行逆序排列
data_frame.head() # 展示前五行數(shù)據(jù)
- 也可以通過設(shè)置df.sort_index中的axis=0對(duì)行進(jìn)行逆序排列勾缭,此時(shí)的逆序操作恢復(fù)了數(shù)據(jù)框的排列揍障。
data_frame = data_frame.sort_index(ascending=True, axis=0) # 通過sort_index對(duì)行進(jìn)行逆序排列
data_frame.head() # 展示前五行數(shù)據(jù)
- 最后可通過reindex對(duì)數(shù)據(jù)框進(jìn)行重索引,以達(dá)到對(duì)行逆序排列的效果俩由。
data_frame = data_frame.reindex(index=data_frame.index[::-1]) # 通過reindex對(duì)行進(jìn)行逆序排列
data_frame.head() # 展示前五行數(shù)據(jù)
總結(jié)
在本文中大致介紹了兩種分布的隨機(jī)數(shù)建立的方法毒嫡,和對(duì)數(shù)據(jù)框的行和列進(jìn)行逆序排列的方法。第一次在該博客寫文,多有不足還望大家多多指教兜畸,有任何疑問請(qǐng)給我留言努释,我會(huì)盡力解答。
Escher
2018/9/15