導讀:有人用大資料“殺熟”,她們卻用大資料做了軌道交通客流分析,運用自己設計的演演算法,對軌道交通出站人數的預測平均精準率達到了93%。4月15日,在第33屆重慶市青少年科技創新大賽上,南開中學三位高二女生的研究專案獲得了一等獎。
01 擠地鐵,擠出來這個課題
譚婧懿、韋沐汐、唐睿詩是南開中學高二年級的學生,雖然三人不在同一班上,但她們都有一個共同的愛好,參加科技創新活動。說起這次參加重慶市科技創新大賽,譚婧懿有些不好意思,“這個選題,還是我們上學放學擠地鐵擠出來的。”
原來,三位女生經常坐1號線。
“每天早上上學和放學回家乘坐軌道交通會這麼擁擠?根本就擠不進去啊!”“如果有方法能夠迅速疏散客流,為市民提供快捷、舒適的出行服務,那該多好!”
三個人你一言,我一語,就把選題給定了下來。
02 找資料,一站就是3小時
確定了選題,就開始找資料。“她們用了最笨但也是最實在的辦法,就是高峰、平峰兩個時間段,到地鐵站數人。”指導老師楊夢寧說。
“我們三個人,一人數出站人數,一人數進站人數,一人看車廂的擁擠程度。”唐睿詩說,雖然大家有分工,但一天數下來,“是真累,好想帶個小板凳坐下,好想吃個麵包充饑。那段時間真是太累了,回去就不想動,放空自己。”放學後、假期裡,在地鐵1號線的沙坪壩站,三位小女生成了常客。還因為長時間站在那裡,不少人以為她們是志願者,“好多來問路的。”
付出總是有回報,數了一段日子後,孩子們在自己整理的記錄上,發現了一些規律,“我們透過這些數字中的規律,再找到負責部門要了一些資料,做後期的研究。”
03 做分析,手算一個月才處理兩個星期資料
拿到了海量資料,就要做分析找規律。因為之前沒有做過類似的課題,三位女生又用到了最原始的方法,把資料錄入到Excel裡“手算”。“因為資料要錄入,還要排版,這樣‘手算’了一個月,才處理兩個星期的資料,這樣不是辦法。”楊夢寧說。
於是孩子們運用多種演演算法對資料進行計算,“最開始,預測精準率只有60%,後來加入其他演演算法,提升到70%以上。但她們拿著這樣的結果給運營部門看時,他們說精準率在80%以上,才算有點意義。”在加入深度學習演演算法後,“我們再把空間特徵轉化為時間特性來進行計算,平均精準率就達到了93%。”譚婧懿說。
“我們的創新主要是將軌道交通的空間資訊引入到客流預測中,同時引入了兩種不同的時間資訊,即歷史同期序列與順序時間序列,並將其結合,形成新的特徵組。除此之外,還將時空特徵進行結合引入到客流預測中,將空間特徵以及時間特徵歷史共同結合來建立模型,能更準確全面地進行客流預測。”三個女生的這一專案不僅獲得了一等獎,目前也正在申請相關的專利。
來源:重慶晨報
記者:羅薛梅
推薦閱讀
日本老爺爺堅持17年用Excel作畫,我可能用了假的Excel···
看完此文再不懂區塊鏈算我輸:手把手教你用Python從零開始建立區塊鏈
Q: 你高中時都幹了些啥?
歡迎留言與大家分享
覺得不錯,請把這篇文章分享給你的朋友
轉載 / 投稿請聯絡:baiyu@hzbook.com
更多精彩文章,請在公眾號後臺點選“歷史文章”檢視