世界高峰數(shù)據(jù)可視化

世界高峰數(shù)據(jù)可視化 (World's Highest Mountains)

import pandas as pd
import matplotlib.pyplot as plt
from matplotlib import style
%matplotlib inline
style.use('ggplot')     # 設(shè)置圖片顯示的主題樣式

# 解決matplotlib顯示中文問題
plt.rcParams['font.sans-serif'] = ['SimHei']  # 指定默認字體
plt.rcParams['axes.unicode_minus'] = False  # 解決保存圖像是負號'-'顯示為方塊的問題

dataset_path = './dataset/Mountains.csv'

定義一會要用的一些函數(shù)

def preview_data(data):
    """
        數(shù)據(jù)預(yù)覽
    """
    # 數(shù)據(jù)預(yù)覽
    print(data.head())

    # 數(shù)據(jù)信息
    print(data.info())


def proc_success(val):
    """
        處理 'Ascents bef. 2004' 列中的數(shù)據(jù)
    """
    if '>' in str(val):
        return 200
    elif 'Many' in str(val):
        return 160
    else:
        return val


data = pd.read_csv(dataset_path)
preview_data(data)
   Rank                                  Mountain  Height (m)  Height (ft)  \
0     1  Mount Everest / Sagarmatha / Chomolungma        8848        29029   
1     2                K2 / Qogir / Godwin Austen        8611        28251   
2     3                             Kangchenjunga        8586        28169   
3     4                                    Lhotse        8516        27940   
4     5                                    Makalu        8485        27838   

   Prominence (m)                   Range              Coordinates  \
0            8848     Mahalangur Himalaya  27°59′17″N 86°55′31″E    
1            4017       Baltoro Karakoram  35°52′53″N 76°30′48″E    
2            3922  Kangchenjunga Himalaya  27°42′12″N 88°08′51″E    
3             610     Mahalangur Himalaya  27°57′42″N 86°55′59″E    
4            2386     Mahalangur Himalaya  27°53′23″N 87°05′20″E    

  Parent mountain First ascent Ascents bef. 2004  Failed attempts bef. 2004  
0             NaN         1953            >>145                       121.0  
1   Mount Everest         1954                45                       44.0  
2   Mount Everest         1955                38                       24.0  
3   Mount Everest         1956                26                       26.0  
4   Mount Everest         1955                45                       52.0  
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 118 entries, 0 to 117
Data columns (total 11 columns):
Rank                         118 non-null int64
Mountain                     118 non-null object
Height (m)                   118 non-null int64
Height (ft)                  118 non-null int64
Prominence (m)               118 non-null int64
Range                        118 non-null object
Coordinates                  118 non-null object
Parent mountain              117 non-null object
First ascent                 118 non-null object
Ascents bef. 2004            116 non-null object
Failed attempts bef. 2004    115 non-null float64
dtypes: float64(1), int64(4), object(6)
memory usage: 10.2+ KB
None

數(shù)據(jù)重構(gòu)

重命名列名

data.rename(columns={'Height (m)': 'Height', 'Ascents bef. 2004': 'Success',
                         'Failed attempts bef. 2004': 'Failed'}, inplace=True)

數(shù)據(jù)清洗

data['Failed'] = data['Failed'].fillna(0).astype(int)
data['Success'] = data['Success'].apply(proc_success)
data['Success'] = data['Success'].fillna(0).astype(int)
data = data[data['First ascent'] != 'unclimbed']
data['First ascent'] = data['First ascent'].astype(int)

可視化數(shù)據(jù)

1. 登頂次數(shù) vs 年份

plt.hist(data['First ascent'].astype(int), bins=20)
plt.ylabel('高峰數(shù)量')
plt.xlabel('年份')
plt.title('登頂次數(shù)')
plt.savefig('./first_ascent_vs_year.png')
plt.show()
output_11_0.png

首次登頂

data['Attempts'] = data['Failed'] + data['Success']  # 攀登嘗試次數(shù)
fig = plt.figure(figsize=(13, 7))
fig.add_subplot(211)
plt.scatter(data['First ascent'], data['Height'], c=data['Attempts'], alpha=0.8, s=50)
plt.ylabel('海拔')
plt.xlabel('登頂')

fig.add_subplot(212)
plt.scatter(data['First ascent'], data['Rank'].max() - data['Rank'], c=data['Attempts'], alpha=0.8, s=50)
plt.ylabel('排名')
plt.xlabel('登頂')
plt.savefig('./mountain_vs_attempts.png')
plt.show()
output_13_0.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子谓罗,更是在濱河造成了極大的恐慌甘耿,老刑警劉巖,帶你破解...
    沈念sama閱讀 207,113評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件醋界,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機涧尿,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,644評論 2 381
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來檬贰,“玉大人姑廉,你說我怎么就攤上這事∥痰樱” “怎么了桥言?”我有些...
    開封第一講書人閱讀 153,340評論 0 344
  • 文/不壞的土叔 我叫張陵萌踱,是天一觀的道長。 經(jīng)常有香客問我号阿,道長并鸵,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,449評論 1 279
  • 正文 為了忘掉前任扔涧,我火速辦了婚禮园担,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘枯夜。我一直安慰自己弯汰,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 64,445評論 5 374
  • 文/花漫 我一把揭開白布湖雹。 她就那樣靜靜地躺著咏闪,像睡著了一般。 火紅的嫁衣襯著肌膚如雪劝枣。 梳的紋絲不亂的頭發(fā)上汤踏,一...
    開封第一講書人閱讀 49,166評論 1 284
  • 那天,我揣著相機與錄音舔腾,去河邊找鬼溪胶。 笑死,一個胖子當(dāng)著我的面吹牛稳诚,可吹牛的內(nèi)容都是我干的哗脖。 我是一名探鬼主播,決...
    沈念sama閱讀 38,442評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼扳还,長吁一口氣:“原來是場噩夢啊……” “哼才避!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起氨距,我...
    開封第一講書人閱讀 37,105評論 0 261
  • 序言:老撾萬榮一對情侶失蹤桑逝,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后俏让,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體楞遏,經(jīng)...
    沈念sama閱讀 43,601評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,066評論 2 325
  • 正文 我和宋清朗相戀三年首昔,在試婚紗的時候發(fā)現(xiàn)自己被綠了寡喝。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,161評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡勒奇,死狀恐怖预鬓,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情赊颠,我是刑警寧澤格二,帶...
    沈念sama閱讀 33,792評論 4 323
  • 正文 年R本政府宣布劈彪,位于F島的核電站,受9級特大地震影響蟋定,放射性物質(zhì)發(fā)生泄漏粉臊。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,351評論 3 307
  • 文/蒙蒙 一驶兜、第九天 我趴在偏房一處隱蔽的房頂上張望扼仲。 院中可真熱鬧,春花似錦抄淑、人聲如沸屠凶。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,352評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽矗愧。三九已至,卻和暖如春郑原,著一層夾襖步出監(jiān)牢的瞬間唉韭,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,584評論 1 261
  • 我被黑心中介騙來泰國打工犯犁, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留属愤,地道東北人。 一個月前我還...
    沈念sama閱讀 45,618評論 2 355
  • 正文 我出身青樓酸役,卻偏偏與公主長得像住诸,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子涣澡,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,916評論 2 344

推薦閱讀更多精彩內(nèi)容