轉(zhuǎn)發(fā)是對(duì)小編的最大支持
本文轉(zhuǎn)自網(wǎng)絡(luò)
2017年時(shí)間飛逝,轉(zhuǎn)眼間距離2018年春節(jié)還有不到兩個(gè)月的時(shí)間准颓,離家在外的人們也已將購(gòu)買回家車票的事宜提上日程。近日嘴办,中國(guó)交通報(bào)發(fā)布《2018年春運(yùn)大數(shù)據(jù)》,數(shù)據(jù)顯示涧郊,2018年春運(yùn)旅客人數(shù)預(yù)計(jì)突破30億人次,較上年有所增長(zhǎng)妆艘。
...
難以想象的數(shù)據(jù),
預(yù)示著今年春運(yùn)回程和返程車票
購(gòu)買難度將進(jìn)一步加大...
搶購(gòu)車票怕是比李白跨越“蜀道”的難度還大哦~
今天是2018年1月3日批旺,已經(jīng)可以購(gòu)買春運(yùn)第一天(2月1日)的火車票了。當(dāng)你想查詢一下火車票信息的時(shí)候汽煮,還在為打開無響應(yīng)的12306官網(wǎng)和廣告n秒的APP嗎而懊惱嗎搏熄?
不如用 Python 寫一個(gè)命令行版的火車票查看器暇赤, 只要在命令行敲一行命令就能獲得你想要的火車票信息!
效果截圖
接口設(shè)計(jì)
讓我們先給這個(gè)小應(yīng)用起個(gè)名字吧鞋囊,既然及查詢票務(wù)信息,那就叫它tickets好了。我們希望用戶只要輸入出發(fā)站译株,到達(dá)站以及日期就讓就能獲得想要的信息,所以tickets應(yīng)該這樣被使用:
$ tickets from to date
另外歉糜,火車有各種類型,高鐵现恼、動(dòng)車肃续、特快叉袍、快速和直達(dá)始锚,我們希望可以提供選項(xiàng)只查詢特定的一種或幾種的火車喳逛,所以瞧捌,我們應(yīng)該有下面這些選項(xiàng):
-g 高鐵
-d 動(dòng)車
-t 特快
-k 快速
-z 直達(dá)
這幾個(gè)選項(xiàng)應(yīng)該能被組合使用润文,所以,最終我們的接口應(yīng)該是這個(gè)樣子的:
$ tickets [-gdtkz] from to date
接口已經(jīng)確定好了典蝌,剩下的就是實(shí)現(xiàn)它了曙砂。
代碼實(shí)現(xiàn)
寫Python程序的一個(gè)良好實(shí)踐是使用virtualenv這個(gè)工具建一個(gè)虛擬的環(huán)境骏掀。我們的程序使用Python3開發(fā)鸠澈,下面在你的工作目錄下建一個(gè)文件夾tickets截驮,進(jìn)去創(chuàng)建一個(gè)虛擬環(huán)境并激活它:
$ virtualenv -p /usr/bin/python3 venv$ . venv/bin/activate
安裝一下實(shí)驗(yàn)需要用到的庫:
$ sodo pip install requests prettytable docopt
requests, 不用不多介紹了吧,使用 Python 訪問 HTTP 資源的必備庫葵袭。
docopt, Python3 命令行參數(shù)解析工具涵妥。
prettytable, 格式化信息打印工具坡锡,能讓你像 MySQL 那樣打印數(shù)據(jù)蓬网。
1 解析參數(shù)
Python有很多寫命令行參數(shù)解析工具鹉勒,如 argparse, docopt, click,這里我們選用的是 docopt 這個(gè)簡(jiǎn)單易用的工具贸弥。
docopt 可以按我們?cè)谖臋n字符串中定義的格式來解析參數(shù),比如我們?cè)?tickets.py:
# coding: utf-8
"""Train tickets query via command-line.
Usage:
tickets [-gdtkz]
Options:
-h,--help 顯示幫助菜單
-g 高鐵
-d 動(dòng)車
-t 特快
-k 快速
-z 直達(dá)
Example:
tickets 上海 北京 2017-12-05
""
from docopt import docopt
def cli():
"""command-line interface"""
arguments = docopt(__doc__)
print(arguments)
if __name__ == '__main__':
cli()
下面我們運(yùn)行一下這個(gè)程序:
$ python3 tickets.py 上海 北京 2017-12-05
我們得到下面的結(jié)果:
{'-d': False, '-g': False, '-k': False, '-t': False, '-z': False, '': '2017-12-05', '': '上海', '': '北京'}
2 獲取數(shù)據(jù)
參數(shù)已經(jīng)解析好了绵疲,下面就是如何獲取數(shù)據(jù)了哲鸳,這也是最主要的部分盔憨。首先我們打開12306徙菠,進(jìn)入余票查詢頁面郁岩,如果你使用 Chrome婿奔,那么按 F12 打開開發(fā)者工具问慎,選中 Network 一欄萍摊,在查詢框鐘我們輸入 上海 到 北京如叼,日期 2017-12-05, 點(diǎn)擊查詢,我們?cè)谡{(diào)試工具發(fā)現(xiàn)笼恰,查詢系統(tǒng)實(shí)際上請(qǐng)求了這個(gè)URL:
https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate=2017-12-05&from_station=SHH&to_station=BJP
并且返回的是JSON格式的數(shù)據(jù)踊沸!
接下來問題就簡(jiǎn)單了社证,我們只需要構(gòu)建請(qǐng)求URL然后解析返回的Json數(shù)據(jù)就可以了逼龟。但是我們發(fā)現(xiàn)追葡,URL里面 from_station 和 to_station 并不是漢字或者拼音,而是一個(gè)代號(hào)辽俗,而我們想要輸入的是漢字或者拼音疾渣,我們要如何獲取代號(hào)呢崖飘?我們打開網(wǎng)頁源碼看看有沒有什么發(fā)現(xiàn)榴捡。
果然朱浴,我們?cè)诰W(wǎng)頁里面找到了這個(gè)鏈接:https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.8955 這里面貌似是包含了所有車站的中文名吊圾,拼音翰蠢,簡(jiǎn)寫和代號(hào)等信息。但是這些信息擠在一起梁沧,而我們只想要車站的拼音和大寫字母的代號(hào)信息檀何,怎么辦呢?
正則表達(dá)式就是答案频鉴,我們寫個(gè)小腳本來匹配提取出想要的信息吧, 在parse_station.py中:
# coding: utf-8import reimport requestsfrom pprint import pprinturl = 'https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.8955'text = requests.get(url, verify=False)stations = re.findall(r'([A-Z]+)\|([a-z]+)', text)stations = dict(stations)stations = dict(zip(stations.values(), stations.keys()))pprint(stations, indent=4)
注意,上面的正則表達(dá)式匹配出的結(jié)果轉(zhuǎn)為字典后垛孔,字典的鍵是大寫字母大號(hào),這顯然不是我們想要的結(jié)果周荐,于是狭莱,我們通過一個(gè)變換將鍵值反過來概作。
我們運(yùn)行這個(gè)腳本腋妙,它將以字典的形式返回所有車站和它的大寫字母代號(hào), 我們將結(jié)果重定向到 stations.py 中仆嗦,
$ python3 parse_station.py > stations.py
我們?yōu)檫@個(gè)字典加名字,stations瘩扼,然后輸入車站的中文名谆甜,我們就可以直接從這個(gè)字典中獲取它的字母代碼了:
...
from stations import stations
def cli():
arguments = docopt(__doc__)
from_staion = stations.get(arguments[''])
to_station = stations.get(arguments[''])
date = arguments['']
# 構(gòu)建URL
url = 'https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate={}&from_station={}&to_station={}'.format(
date, from_staion, to_station
)
萬事俱備集绰,下面我們來請(qǐng)求這個(gè)URL獲取數(shù)據(jù)吧!這里我們使用 requests 這個(gè)庫, 它提供了非常簡(jiǎn)單易用的接口栽燕,
...
import requests
def cli():
...
# 添加verify=False參數(shù)不驗(yàn)證證書
r = requests.get(url, verify=False)
print(r.json())
從結(jié)果中罕袋,我們可以觀察到碍岔,與車票有關(guān)的信息需要進(jìn)一步提仍⊙丁:def cli():
...
r = requsets.get(url);
rows = r.json()['data']['datas']
3 解析數(shù)據(jù)
我們封裝一個(gè)簡(jiǎn)單的類來解析數(shù)據(jù):
from prettytable import PrettyTableclass TrainCollection(object): # 顯示車次蔼啦、出發(fā)/到達(dá)站、 出發(fā)/到達(dá)時(shí)間捏肢、歷時(shí)奈籽、一等坐鸵赫、二等坐、軟臥辩棒、硬臥狼忱、硬座 header = 'train station time duration first second softsleep hardsleep hardsit'.split() def __init__(self, rows): self.rows = rows def _get_duration(self.row): """ 獲取車次運(yùn)行時(shí)間 """ duration = row.get('lishi').replace(':', 'h') + 'm' if duration.startswith('00'): return duration[4:] if duration.startswith('0'): return duration[1:] return duration @property def trains(self): for row in self.rows: train = [ # 車次 row['station_train_code'], # 出發(fā)、到達(dá)站 '\n'.join([row['from_staion_name'], row['to_station_name']]), # 出發(fā)钻弄、到達(dá)時(shí)間 '\n'.join([row['start_time'], row['arrive']]), # 歷時(shí) self._get_duration(row), # 一等坐 row['zy_num'], # 二等坐 row['ze_num'], # 軟臥 row['rw_num'], # 軟坐 row['yw_num'], # 硬坐 row['yz_num'] ] yield train def pretty_print(self): """ 數(shù)據(jù)已經(jīng)獲取到了,剩下的就是提取我們要的信息并將它顯示出來斧蜕。 `prettytable`這個(gè)庫可以讓我們它像MySQL數(shù)據(jù)庫那樣格式化顯示數(shù)據(jù)砚偶。 """ pt = PrettyTable() # 設(shè)置每一列的標(biāo)題 pt._set_field_names(self.header) for train in self.trains: pt.add_row(train) print(pt)
4 顯示結(jié)果
最后批销,我們將上述過程進(jìn)行匯總并將結(jié)果輸出到屏幕上:
...class TrainCollection: ... ... def cli(): arguments = docopt(__doc__) from_staion = stations.get(arguments['']) to_station = stations.get(arguments['']) date = arguments[''] # 構(gòu)建URL url = 'https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate={}&from_station={}&to_station={}'.format( date, from_staion, to_station ) r = requests.get(url, verify=False) rows = r.json()['data']['datas'] trains = TrainCollection(rows) trains.pretty_print()if __name__ == '__main__': cli()
5 最后一米
至此染坯, 程序的主體已經(jīng)完成了均芽, 但是上面打印出的結(jié)果是黑白的单鹿,很是乏味掀宋,我們來給它添加顏色吧:
def colored(color, text):
table = {
'red': '\033[91m',
'green': '\033[92m',
# no color
'nc': '\033[0'
}
cv = table.get(color)
nc = table.get('nv')
return ''.join([cv, text, nc])
修改一下程序仲锄,將出發(fā)車站與出發(fā)時(shí)間顯示為紅色劲妙, 將到達(dá)車站與到達(dá)時(shí)間顯示為綠色:
...
'\n'.join([colored('green', row['from_staion_name'])
colored('red', row['to_station_name'])]),
'\n'.join([colored('green', row['start_time'])
colored('red', row['arrive_time'])]),
...
over儒喊,各位同學(xué)可以自己試一試喲~
春節(jié)將近镣奋,小安希望大家能成功搶票開心回家過年~
另送上搶票日歷↘