WAP手机版 RSS订阅 加入收藏  设为首页
888澳门集团娱乐网址

888澳门集团娱乐网址:研究团队针对这两个阶段设计了解决方案

时间:2021/9/12 23:26:53   作者:   来源:   阅读:0   评论:0
内容摘要:提出了,在开车,其他车辆的策略是未知的,和控制代理没有知觉的策略之前,和他们的行动也有些随意,不是一个完整的“确定性”(确定性)控制车辆的动态过程实际上来”,也就是说,从现在的时间点开始,即使被控制车辆始终采取相同的行动,未来国家的整个道路形势仍然是不确定的。为了解决这个问题,我们设计的是预测未来的状态分布,而不是单一...

提出了,在开车,其他车辆的策略是未知的,和控制代理没有知觉的策略之前,和他们的行动也有些随意,不是一个完整的“确定性”(确定性)控制车辆的动态过程实际上来”,也就是说,从现在的时间点开始,即使被控制车辆始终采取相同的行动,未来国家的整个道路形势仍然是不确定的。


为了解决这个问题,我们设计的是预测未来的状态分布,而不是单一的可能性。但从根本上说,该方法存在模型遗忘和有限数据抽样难以预测分布的问题。这还不够好,需要进一步改进。”曹金坤反思道利用预测结果选择自动驾驶策略在具备了预测未来情景和车辆状态的能力之后,研究团队还需要解决驾驶行为的采样和评估问题。


研究团队针对这两个阶段设计了解决方案。第一个困难是在连续的动作空间中取样(例如,踩油门的力和方向盘的角度都是连续的数字)。为此,研究小组设计了一个“指导网络”,它首先可在连续操作空间,选择一个决策次区域在离散空间中通过观察当前和过去的场景,然后执行统一抽样选择较小的行动区域得到最后的行动信息。


评估采样动作的困难主要来自于预测未来其他车辆状态时的高噪声,而这种噪声来自于前面提到的“多重假设未来”。针对这一问题,研究小组设计了两阶段代价函数计算和候选滤波概率。在第一阶段,通过计算与其他车辆没有直接关联的未来状态造成的损失,过滤掉一部分抽样的候选动作。然后在第二阶段,s * p * c的损失价值纯粹是为了。


获得与其他车辆相撞的可能性在未来,s是一个折扣系数,目的是使未来状态远离当前决策的影响越小,车辆可以先关注迫在眉睫的危险,P为状态预测的置信度估计,c为与目标车辆碰撞的概率估计。通过这种实例感知的损失计算,代理最终选择要执行的驱动动作。



相关评论

本类更新

本类推荐

本类排行

本站所有站内信息仅供娱乐参考,不作任何商业用途,不以营利为目的,专注分享快乐,欢迎收藏本站!
所有信息均来自:百度一下 (888大发真人)
琼ICP备09002077号-7