作者 protream
原文:http://www.jianshu.com/p/f411d7e10c41
說明:本文編輯protream 和marvin的文章成篇
首先看看如何快速檢視剩餘火車票?
當你想查詢一下火車票資訊的時候,你還在上12306官網嗎?或是開啟你手機裡的APP?下麵讓我們來用Python寫一個命令列版的火車票檢視器, 只要在命令列敲一行命令就能獲得你想要的火車票資訊!如果你剛掌握了Python基礎,這將是個不錯的小練習。
介面設計
一個應用寫出來最終是要給人使用的,哪怕只是給你自己使用。所以,首先應該想想你希望怎麼使用它?讓我們先給這個小應用起個名字吧,既然及查詢票務資訊,那就叫它tickets
好了。我們希望使用者只要輸入出發站,到達站以及日期就讓就能獲得想要的資訊,所以tickets
應該這樣被使用:
$ tickets from to date
另外,火車有各種型別,高鐵、動車、特快、快速和直達,我們希望可以提供選項只查詢特定的一種或幾種的火車,所以,我們應該有下麵這些選項:
-
-g 高鐵
-
-d 動車
-
-t 特快
-
-k 快速
-
-z 直達
這幾個選項應該能被組合使用,所以,最終我們的介面應該是這個樣子的:
$ tickets [-gdtkz] from to date
介面已經確定好了,剩下的就是實現它了。
開發環境
寫Python程式的一個良好實踐是使用virtualenv
這個工具建一個虛擬的環境。我們的程式使用Python3開發,下麵在你的工作目錄下建一個檔案夾tickets
,進去建立一個虛擬環境:
$ virtualenv -p /usr/bin/python3 venv
透過下麵的命令啟用它:
$ . venv/bin/activate
解析引數
Python有很多寫命令列應用的工具,如argparse, docopt, options…這裡,我們選用docopt這個簡單易用的工具,我們先安裝它:
$ pip3 install docopt
docopt可以按我們在檔案字串中定義的格式來解析引數,在tickets.py
中:
# coding: utf-8
"""Train tickets query via command-line.
Usage:
tickets [-gdtkz]
Options:
-h,--help 顯示幫助選單
-g 高鐵
-d 動車
-t 特快
-k 快速
-z 直達
Example:
tickets 南京 北京 2016-07-01
tickets -dg 南京 北京 2016-07-01
"""
from docopt import docopt
def cli():
"""command-line interface"""
arguments = docopt(__doc__)
print(arguments)
if __name__ == '__main__':
cli()
下麵我們執行一下這個程式:
$ python3 tickets.py 上海 北京 2016-07-01
我們得到下麵的引數解析結果:
{'-d': False, '-g': False, '-k': False, '-t': False, '-z': False, '' : '2016-07-01', '' : '上海', '' : '北京'}
獲取資料
引數已經解析好了,下麵就是如何獲取資料了,這也是最主要的部分。首先我們開啟12306,進入餘票查詢頁面,如果你使用chrome,那麼按F12
開啟開發者工具,選中Network
一欄,在查詢框鐘我們輸入上海
到北京
,日期2016-07-01
, 點選查詢,我們在除錯工具發現,查詢系統實際上請求了這個URL
https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate;=2016-07-01&from;_station=SHH&to;_station=BJP
並且傳回的是Json
格式的資料!接下來問題就簡單了,我們只需要構建請求URL然後解析傳回的Json資料就可以了。但是我們發現,URL裡面from_station
和to_station
並不是漢字,而是一個代號,而使用者輸入的是漢字,我們要如何獲取代號呢?我們開啟網頁原始碼看看有沒有什麼發現。
啊哈!果然,我們在網頁裡面找到了這個連結:https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.8955。這裡面貌似是包含了所有車站的中文名,拼音,簡寫和代號等資訊, 我們在專案目錄下將它儲存為stations.html
。但是這些資訊擠在一起,而我們只想要中文名和大寫字母的代號資訊,怎麼辦呢?
BINGO!正則運算式,我們寫個小指令碼來匹配提取出想要的資訊吧, 在parse.py中:
# coding: utf-8
import re
from pprint import pprint
with open('stations.html', 'r') as f:
text = f.read()
stations = re.findall(u'([\u4e00-\u9fa5]+)\|([A-Z]+)', text)
pprint(dict(stations), indent=4)
我們執行這個指令碼,它將以字典的形式傳回所有車站和它的大寫字母代號, 我們將結果重定向到stations.py
中,
$ python3 parse.py > stations.py
我們為這個字典加名字,stations
, 最終,stations.py
檔案是這樣的:
stations = {
'一間堡': 'YJT', '一面坡': 'YPB',
...
'龍鎮': 'LZA', '龍骨甸': 'LGM'
}
現在,使用者輸入車站的中文名,我們就可以直接從這個字典中獲取它的字母程式碼了:
...
from stations import stations
def cli():
arguments = docopt(__doc__)
from_staion = stations.get(arguments['' ])
to_station = stations.get(arguments['' ])
date = arguments['' ] # 構建URL
url = 'https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate;={}&from;_station={}&to;_station={}'.format(
date, from_staion, to_station
)
萬事俱備,下麵我們來請求這個URL獲取資料吧!這裡我們使用requests
這個庫, 先安裝它:
$ pip3 install requests
它提供了非常簡單易用的介面,
...
import requests
def cli():
... # 新增verify=False引數, 不驗證證書
r = requests.get(url, verify=False)
print(r.json())
從結果中,我們可以觀察到,與車票有關的資訊需要進一步提取:
def cli():
...
r = requsets.get(url);
rows = r.json()['data']['datas']
顯示結果
資料已經獲取到了,剩下的就是提取我們要的資訊並將它顯示出來。prettytable
這個庫可以讓我們它像MySQL資料庫那樣格式化顯示資料。
$ pip3 install prettytable
這樣使用它:
...
from prettytable import PrettyTable
def cli():
...
essay-headers = '車次 車站 時間 歷時 商務 一等 二等 軟臥 硬臥 軟座 硬座 無座'.split()
pt = PrettyTable()
pt._set_field_names(essay-headers)
for row in rows:
# 從row中根據essay-headers過濾資訊, 然後呼叫pt.add_row()新增到表中
...
print(pt)
其次我們看看如何自動搶:
來自:Python中文社群(微訊號:python-china)
作者:marvin,網際網路從業者,現居上海張江
使用Python+Splinter自動掃清搶票,可以成功搶到。(依賴自己的網路環境太厲害,還有機器的好壞)
Splinter是一個使用Python開發的開源Web應用測試工具,它可以幫你實現自動瀏覽站點和與其進行互動,Splinter執行的時候會自動開啟你指定的瀏覽器,訪問指定的URL。然後你所開發的模擬的任何行為,都會自動完成,你只需要坐在電腦面前,像看電影一樣看著螢幕上各種動作自動完成然後收集結果即可。
12306搶票Python程式碼片段
1、實現自動登入的函式:
2、開始購票的函式
原始碼地址下載:https://pan.baidu.com/s/1eSClOXW
●本文編號317,以後想閱讀這篇文章直接輸入317即可
●輸入m獲取到文章目錄
Web開發
更多推薦《18個技術類公眾微信》
涵蓋:程式人生、演演算法與資料結構、駭客技術與網路安全、大資料技術、前端開發、Java、Python、Web開發、安卓開發、iOS開發、C/C++、.NET、Linux、資料庫、運維等。