泰国国立法政大学发明基于李雅普诺夫感知的量子强化学习框架 可实现稳定的连续时间车辆控制
盖世汽车讯 安全高效地控制车辆是自主系统面临的一项重大挑战,研究人员正日益探索强化学习作为一种潜在的解决方案。
据外媒报道,来自泰国国立法政大学(Thammasat University)的Nutkritta Kraipatthanapong、Natthaphat Thathong和Pannita Suksawas及其同事,展示了一种将强化学习与成熟的稳定性分析原理相结合的新方法。他们的研究引入了一个基于李雅普诺夫的强化学习框架(Lyapunov-based reinforcement learning framework),该框架将策略优化与李雅普诺夫稳定性约束相结合,确保车辆即使在动态环境中也能保持安全可预测的行为。这项研究是开发可证明安全的自主车辆控制系统的关键一步,并为将经典控制理论与现代机器学习技术相结合开辟了新的途径。

图片来源:arXiv预印本服务器
责任编辑:枯川

网友评论