★北方工業(yè)大學(xué)鄭國榮,張尊棟,劉小明,張巍,周天翼
摘要:在公共交通中,公交專(zhuān)用道作為重要的交通設施,能夠在保證高速、高效、高質(zhì)量的同時(shí),減少城市交通擁堵,提高公共交通的服務(wù)質(zhì)量和運營(yíng)效率。本文針對間歇式公交專(zhuān)用道與下游信號交叉口的信號控制協(xié)調優(yōu)化需求,提出了涵蓋公交專(zhuān)用道Agent、公交車(chē)Agent和交通信號燈Agent的多類(lèi)型多智能體(Multi-TypeMulti-Agent)混合控制模型,并采用Q學(xué)習和SARSA兩種強化學(xué)習方法對傳統間歇式公交專(zhuān)用道、移動(dòng)間歇式公交專(zhuān)用道兩種控制場(chǎng)景進(jìn)行了參數設計,提出了TLS-IBL-QL、TLS-IBL-SARSA、TLS-MBL-QL和TLS-MBL-SARSA優(yōu)化模型。實(shí)驗結果表明,TLS-IBL-SARSA算法的性能優(yōu)于TLS-IBL-QL算法,TLS-MBL-QL的性能優(yōu)于TLS-MBL-SARSA算法,兩類(lèi)控制算法均明顯優(yōu)于傳統的TLS-DBL公交專(zhuān)用道控制。
關(guān)鍵詞:強化學(xué)習;移動(dòng)間歇式;公交專(zhuān)用道;協(xié)調控制
在線(xiàn)預覽:基于強化學(xué)習的間歇式公交專(zhuān)用道協(xié)調控制方法.pdf
摘自《自動(dòng)化博覽》2023年12月刊