全球數(shù)億人的日常通勤都依靠公共交通工具,其中超過半數(shù)在出行時會選擇乘坐公交車。隨著全球城市的不斷發(fā)展,通勤一族希望了解公共交通工具尤其是公交車可能出現(xiàn)的延誤時間,以便提前安排出行計劃。因為公交車往往會遇到交通擁堵。Google 地圖的公交路線實時數(shù)據由眾多公共交通運營機構提供,但因技術和資源限制,仍有許多公共交通運營機構無法提供這些信息。
近日,Google 地圖為全球數(shù)百個城市(包括亞特蘭大、薩格勒布、伊斯坦布爾、馬尼拉等),推出了基于機器學習的實時公交延誤預測服務。如此一來,六千多萬人便能更準確地把握出行時間。這套系統(tǒng)于三周前率先在印度發(fā)布,系統(tǒng)采用機器學習模型,整合了實時汽車交通預測與公交路線和站臺數(shù)據,以便更準確地預測公交出行的時間。
模型初探
許多城市的公共交通運營機構并不提供實時預測數(shù)據,在對這類城市的用戶進行調查后,我們發(fā)現(xiàn),他們借助一種巧妙方法來粗略估計公交車的延誤時間:使用 Google 地圖的駕駛路線功能。然而,公交車并非只是大型汽車。公交車在站臺???,加速、減速和轉彎都需要更長時間,有時甚至擁有專屬道路特權(如公交專用車道)。
舉個例子,我們于周三下午在悉尼測試了一次公交車之旅。相較于公交時刻表(黑點),公交車的實際行駛時間(藍點)會晚幾分鐘。汽車行駛速度(紅點)確實會對公交車造成影響,例如行駛至 2000 米處的減速情形。但與汽車相比,公交車在 800 米標記處的長時間停靠也會大大減慢自身的速度。
為了開發(fā)模型,我們從公共交通運營機構的實時反饋中獲得了公交車位置序列,從中提取訓練數(shù)據,并將其與汽車在公交行駛路線上的行駛速度進行調整。我們將該模型劃分為時間線單元(表示在街區(qū)和站臺??浚總€單元對應一段公交車的時間線,并預測持續(xù)時間。由于報告頻率低、再加上公交車行駛速度較快、街區(qū)和站臺??繒r間較短,相鄰的觀測數(shù)據可能會跨越多個單元。
此結構非常適合于神經序列模型,如近期在語音處理和機器翻譯等領域成功實現(xiàn)應用的模型。而我們的模型更加簡單。每個單元會獨立預測其持續(xù)時間,最終的輸出結果為每單元預測時間的總和。
與許多序列模型不同,我們的模型并不需要學習組合單元輸出,也無需通過單元序列傳遞狀態(tài)。相反,序列結構讓我們能夠共同:(1) 訓練一個單元持續(xù)時間的模型,(2) 優(yōu)化“線性系統(tǒng)”,其中每條觀測到的軌跡會將總持續(xù)時間分配給其跨越的所有單元。
為模擬從藍色站臺開始的公交車行程 (a),模型 (b) 將藍色站臺、三個路段和白色站臺等各處的時間線單元延誤預測進行相加
構建“地點”模型
除了因交通擁堵導致的延誤之外,我們在訓練模型時還詳細考慮了公交車路線,以及行程中各地點與時段的交通信號燈。
即便是在小區(qū)內,該模型也需根據各個街道的路況,以不同方式將汽車速度預測轉化為公交車速度。如下方左圖所示,模型預測了公交車行程中汽車與公交車速度之比,我們用不同顏色對其進行標記。
紅色(表示車速較慢)的部分符合公交車在站臺附近減速的實況。針對突出顯示的綠色路段(表示車速較快),我們查看了相關街景,了解到該模型發(fā)現(xiàn)了一條公交車專用的轉彎車道。順便一提,這條路線位于澳大利亞,該國右轉車速低于左轉車速,而這也是不考慮地點特殊性的模型會忽略的另一方面。
為獲取特定街道、街區(qū)和城市的獨特屬性,我們讓該模型學習不同大小區(qū)域的表示層次結構,通過地區(qū)位置的總嵌入,在模型中按不同比例表示時間線單元的地理位置(即道路或站臺的精確定位)。
我們首先訓練模型,對特殊情況下的細粒度位置進行逐漸加重的處罰,并使用結果進行特征選擇。這樣就可以確??紤]到百米影響公交行為的復雜區(qū)域中的細粒度特征,而不像開放的鄉(xiāng)村那樣細致的特征很少。
訓練期間,我們還模擬了訓練數(shù)據以外地區(qū)可能的后續(xù)查詢。在每個訓練批次中,我們會隨機抽取一些示例,隨機選取某一比例并丟棄地理特征。某些示例擁有準確的公交路線和街道信息,某些僅包含街區(qū)或城市位置,還有一些則沒有任何地理環(huán)境信息。如此一來,模型便能做好充足準備,從而在后續(xù)查詢訓練數(shù)據不足的地區(qū)。我們通過匿名用戶的公交行程,并使用與 Google 地圖在商業(yè)繁忙、停車難度及其他特征的相同數(shù)據集,來擴展我們的培訓語料庫覆蓋范圍。然而,即使是這類數(shù)據也無法涵蓋全球大部分公交路線,因此我們必須大幅提升模型的泛化能力,使其適應更多新地區(qū)。
學習地方性節(jié)奏
不同城市和街區(qū)的運轉節(jié)奏各有差異,因此我們讓模型將其位置表示與時間信號進行結合。
公交車對時間的依賴包含不同情形:周二下午 6:30 至 6:45,一些街區(qū)的下班高峰可能已逐漸淡去,另一些街區(qū)可能在忙于用餐,而冷清的小鎮(zhèn)可能已是萬籟俱寂。我們的模型學習嵌入了局部地區(qū)的當日時間與星期信號,當此類信號與地點表示相結合時,模型便可獲取顯著的局部地區(qū)變化(如上下班高峰期在公交站臺等候的人群),而我們無法通過交通情況觀測這類變化。
這種嵌入會向一天的時間分配四維向量。與大多數(shù)神經網絡內部架構不同,四維空間幾乎無法實現(xiàn)可視化。因此,讓我們以如下所示的藝術渲染圖為例,向您展示此模型如何在其中的三個維度內安排一天的時間。此模型確實知道時間具有周期性,因而會將其放在“循環(huán)”內。但此循環(huán)并非只是時鐘表面的平面圓環(huán)。
此模型學習了大量彎曲 (wide bends),讓其他神經元組成簡單的規(guī)則,以輕松區(qū)分“午夜”或“傍午”等概念。而在此類概念中,公交車的行駛狀態(tài)不會產生太大變化。另一方面,不同街區(qū)和城市的夜間通勤模式差異甚大。針對下午 4 點至晚上 9 點之間的時段,模型似乎創(chuàng)建了更復雜的“折皺”模式,從而能對每個城市的高峰時間進行更復雜的推理。
效果圖作者:Will Cassella,所用貼圖來源:textures.com,所用 HERI 來源:hdrihaven。模型的時間表示(四維空間中的三個維度)形成循環(huán),在此處您可以將其重新想象成手表的表盤。越依賴位置的時間窗口(如下午 4 點至 9 點,上午 7 點至 9 點)會獲得更復雜的“折皺”,而沒有特征的大窗口(如凌晨 2 點至 5點)則會發(fā)生平面彎曲,進而生成更簡單的規(guī)則。
借助此時間表示與其他信號,我們可在車速恒定的情況下預測復雜模式。例如,在乘坐公交車完成新澤西州的 10 公里行程時,我們的模型能夠了解午餐時間的人群狀況以及工作日的高峰時段:
全面整合
在對模型進行充分訓練后,讓我們看看它對上例中悉尼公交車之旅的了解程度。
如果基于當日的車輛交通數(shù)據運行模型,我們會得到如下所示的綠色預測點(該模型無法獲取所有信息,例如,模型檢測到公交車在 800 米僅??苛?10 秒,而實際的??繒r間為 31 秒多)。與公交時刻表和汽車行駛時間相比,我們的預測與公交車實際運行時間的差異相對較小,為 1.5 分鐘。
未來行程
目前,我們的模型尚缺一類數(shù)據,即公交時刻表。截止目前,經試驗證明,官方機構提供的公交車時刻表尚無法對我們的預測做出顯著改進。在某些城市,變化無常的交通狀況可能會打亂出行計劃。而在其他城市,公交車時刻表則非常精準,這或許是因為當?shù)毓步煌ㄟ\營機構仔細考慮了本地的交通狀況。而我們可以從數(shù)據中推斷出這些。
我們將繼續(xù)進行實驗,更好地考慮行程限制和其他影響因素,從而推動更精確的預測,為用戶的出行計劃提供便利。此外,我們希望能為您的出行計劃提供幫助。祝您旅途愉快!
-
Google
+關注
關注
5文章
1789瀏覽量
59029 -
機器學習
+關注
關注
66文章
8503瀏覽量
134601
原文標題:使用機器學習預測公交車延誤
文章出處:【微信號:tensorflowers,微信公眾號:Tensorflowers】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
天雙科技高集成多功能AI一體機破局公交車駕駛困境
工業(yè)4G路由器IR5000公交站臺物聯(lián)網應用解決方案

簡儀科技新能源公交車電池模組短路測試解決方案
4G工業(yè)路由器在公交充電樁中的應用與優(yōu)勢

中車鯨典客車批量交付1032輛
億緯鋰能與遠程新能源商用車合作共塑杭州綠色公交新風貌
城市公交充電站設計策略與綜合解決方案探討

評論