numpy和pandas的作用
numpy簡(jiǎn)單來說,就是用來做矩陣運(yùn)算的python包换途,pandas是基于numpy進(jìn)一步封裝的包
1.numpy基礎(chǔ)
# numpy運(yùn)行速度很快[注:%time是jupyter的寫法,ipython環(huán)境不支持]
# 普通數(shù)組
normal_list = range(10000)
%timeit [i**2 for i in normal_list]
#numpy數(shù)組 運(yùn)算速度快了一個(gè)量級(jí)
import numpy as np
np_list = np.arange(10000)
%timeit np_list**2
# numpy 是將*3 應(yīng)用到每一個(gè)元素上
np_list = np.ones(5)
np_list*3
# 初始化操作
np.zeros(5)
# 3*2的 0矩陣
print(np.zeros((3,2)))
# 5*5的 1矩陣
print(np.ones((5,5)))
# 6*6的 對(duì)角矩陣
print(np.eye(6))
# 普通轉(zhuǎn)numpy
normal_array = [[1,2,3],[4,5,6]]
np_array = np.array(normal_array)
print(np_array)
# linspace 等間距生成數(shù)
np.linspace(0,1,10)
2.numpy的復(fù)雜應(yīng)用
- 生成模擬股票的數(shù)據(jù) 200只股票写穴,兩年交易日 252*2
- 對(duì)股票數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析
# 生成服從正態(tài)分布的模擬數(shù)據(jù)币喧,這里指的是漲跌數(shù)據(jù)
stock_cnt = 200
view_days = 504
stock_day_change = np.random.standard_normal((stock_cnt,view_days))
print(stock_day_change)
# 獲取矩陣的寬高
print(stock_day_change.shape)
# 打印出前兩只股票前五天的漲跌情況
print(stock_day_change[0:2,:5])
# 打印最后兩只股票的最后五天漲跌情況
print(stock_day_change[-2:,-5:])
# 交換 上面的兩組數(shù)據(jù)淮逊,必須使用copy,拷貝源數(shù)據(jù),numpy是引用類型的
tmp = stock_day_change[:2,:5].copy()
stock_day_change[:2,:5] = stock_day_change[-2:,-5:]
stock_day_change[-2:,-5:] = tmp
print(stock_day_change[:2,:5])
print(stock_day_change[-2:,-5:])
print('類型轉(zhuǎn)換,小數(shù)轉(zhuǎn)int')
print(stock_day_change[-2:,-5:].astype(int))
print('保留兩位小數(shù):')
print(np.around(stock_day_change[-2:,-5:],2))
# numpy 中 np.nan代表空
test = stock_day_change[0:2,:5].copy()
test[0][0] = np.nan
print(test)
print('獲取每只股票前10個(gè)交易日最大漲幅 axis=1 代表掃描x軸 axis=0代表掃描y軸')
print(np.max(stock_day_change[:5,:10],axis=1))
print()
print('如果要獲取前10個(gè)交易日中每天 5只股票中的最大漲幅,axis=0')
m1 = np.max(stock_day_change[:5,:10],axis=0)
print(m1)
print('獲取10個(gè)交易日中每天 5只股票中的最大漲幅的是哪一只股票,使用argmax函數(shù)蚁趁,axis=0')
m2 = np.argmax(stock_day_change[:5,:10],axis=0)
print(m2)
print("第2天下標(biāo)為{}的股票漲幅最大裙盾,為:{}".format(m2[1],m1[1]))
print('求期望,標(biāo)準(zhǔn)差他嫡,方差')
tmp = stock_day_change[:5,:10].copy()
print('平均值:',np.mean(tmp,axis=1))
print('標(biāo)準(zhǔn)差:',np.std(tmp,axis=1))
print('方差:',np.var(tmp,axis=1))
3.pandas基礎(chǔ)
簡(jiǎn)單說明:pandas是基于numpy的封裝
import pandas as pd
frame = pd.DataFrame(stock_day_change)
# 顯示前五只股票的數(shù)據(jù)
frame.head(5)
# 顯示后五只股票的數(shù)據(jù)
frame.tail(5)
# 先來看一段精簡(jiǎn)版的代碼番官,代碼段 1
stock_symbols = ['股票'+str(x) for x in range(stock_day_change.shape[0])]
# stock_symbols
# 這段代碼是的意思如下, 代碼段2
stock_symbols_tmp = range(stock_day_change.shape[0])
res = []
for i in stock_symbols_tmp:
res.append('股票'+str(i))
print(res)
# 上面代碼段1的寫法叫鏈表推導(dǎo)式
# 生成從2017-1-1 后504天的日期
days = pd.date_range('2017-1-1',periods=stock_day_change.shape[1],freq='1d')
# 把數(shù)據(jù)的列名改成對(duì)應(yīng)的日期
frame = pd.DataFrame(stock_day_change,index=res,columns=days)
frame.head(3)
# 換個(gè)維度看數(shù)據(jù) 轉(zhuǎn)置操作
frame_t = frame.T
frame_t.head(3)
# 采樣 每21天求平均值
frame_21 = frame_t.resample('21d').mean()
frame_21.head(5)
# 獲取某一只股票的數(shù)據(jù)
stock0 = frame_t['股票0']
stock0.head(5)
%matplotlib inline
# 想要繪制圖片在jupyter(現(xiàn)在這個(gè)編輯器叫jupyter)顯示钢属,需要加上%matplotlib inline
# 繪制股票漲跌徘熔,首先要將 舉個(gè)栗子:第一天 漲了0.5 第二天跌了0.3 繪制時(shí) 第一天繪制0.5 第二天繪制0.2(0.5-0.3)
# 因此需要將單只股票做 前一天加法
stock0.cumsum().plot()
學(xué)會(huì)股票類相關(guān)的操作,其他的數(shù)據(jù)就so easy啦
接下來介紹一個(gè)獲取真實(shí)股票數(shù)據(jù)的包 tushare
import tushare as ts
# 獲取所有的股票列表
all_stock = ts.get_stock_basics()
# 取前五個(gè)淆党,第一列code就是股票代碼
all_stock.head(5)
%matplotlib inline
# 獲取黑牛食品(002387)的數(shù)據(jù)酷师,并取開盤價(jià)讶凉,繪圖
ts.get_k_data('002387')['open'].plot()
# 這個(gè)數(shù)據(jù)就介紹到這里,之后會(huì)進(jìn)行時(shí)間序列數(shù)據(jù)分析預(yù)測(cè)還會(huì)用到