1. 說明
直方圖(Histogram)又稱質量分布圖。是一種統(tǒng)計報告圖源武,由一系列高度不等的縱向條紋或線段表示數(shù)據(jù)分布的情況(見下圖)副瀑。
直方圖是統(tǒng)計中的常用工具,在圖像處理中胰默,經(jīng)常通過邊緣或者顏色統(tǒng)計計算直方圖场斑,并通過直方圖匹配實現(xiàn)圖像識別;也可以據(jù)此判斷顏色分布牵署,以調節(jié)色彩均衡漏隐;還可以篩選出感興趣的區(qū)域,并做進一步處理奴迅。
在股票數(shù)據(jù)處理中青责,也同理,統(tǒng)計出直方圖后取具,可利用它和以往數(shù)據(jù)匹配脖隶,尋找近似的情況;統(tǒng)計有效數(shù)據(jù)集中區(qū)域者填,并聚焦于該區(qū)域進一步處理浩村。
下面是一個最簡單的實例:每天我們能看出大盤的整體漲跌,但并不了解各股漲跌情況的分布(比如:是普漲還是二八行情)占哟,下例分析并顯示了昨天各股漲跌幅主要分布在哪些區(qū)間內心墅。
2. 程序
1) 代碼
# -*- coding:utf-8 -*-
import tushare as ts
import numpy as np
import matplotlib.pyplot as plt
e = ts.get_today_all()
cc = e[u'changepercent']# 漲跌幅
plt.hist(cc,int(np.sqrt(len(cc))+0.5))
plt.show()
2) 運行結果
(此處直方圖主要分布在0附近酿矢,提供的信息并不多,下篇:《數(shù)據(jù)預處理》將對直方圖結果進行進一步的處理)