加州大学伯克利分校提出社会感知方案规划自动驾驶
来源:腾讯网 | 作者:chinacaw | 发布时间: 2019-05-28 | 944 次浏览 | 分享到:

为了在动态环境中导航,自动驾驶汽车必须处理所有可用信息,并利用这些信息生成有效的驾驶策略。据外媒报道,加州大学伯克利分校的研究人员提出了一种社会感知方案,用于规划自动驾驶汽车的行为,有助于自动驾驶汽车更好地应对周围环境中的不确定性因素。

(图片来源:techxplore.com)

该研究项目的一名研究员Sun Liting表示,“我的研究专注于为自动驾驶汽车设计类似人类的驾驶行为。我们的目标是使自动驾驶汽车不仅能理解人类行为,而且在感知、推理和行动等多个方面都能与人类类似。”
    
Sun和她的同事观察到,人类驾驶员倾向于把其他汽车视为动态障碍物,并从它们在路上的行为推断出额外的信息。这些信息通常是闭塞的环境信息或物理无法检测到的社会信息。Sun说,“如果自动驾驶汽车能以同样的方式行驶,将非常重要、非常有益,因为这将使它们更智能、更像人类、更安全。进行研究时,我们让自动驾驶汽车将所有其他道路参与者视为动态分布式传感器。”
    
这一社会感知方案,本质上是将道路上的所有汽车和障碍物视为分布在传感器网络中的传感器。这使得自动驾驶汽车可以同时观察个体行为和群体行为,并利用观察到的信息更新“信念空间”(belief space)中各种类型的不确定性。该方案特别关注物理状态的不确定性(如环境闭塞或传感器范围有限带来的不确定性)和社会行为的不确定性(如当地驾驶偏好)。
    
该方案将更新后的社会感知信念与模型预测控制(MPC)概率规划框架相结合,该框架的代价函数通过逆强化学习(IRL)得来。概率规划模块与社会强化感知相结合,使汽车可以产生与社会相容的防御行为,因此不会过于严格。Sun解释说,“自动驾驶汽车通过观察他人的行为,并将其与之前的行为模型进行比较,用自己的传感器就可以推断出无法检测到的变量的可能状态。这可以帮助自动驾驶汽车减少感知不确定性。与其他现有方法相比,这一想法能有效扩展自动驾驶汽车的感知能力,从而更安全、更高效的行驶,并且不需要任何额外的硬件。
   
 研究人员在一系列传感器被遮挡的模拟场景中评估了这一框架。他们发现,通过模仿人类的社会感知机制,感知模块检测到的不确定性减少,最终通过非保守的防御计划生成更安全、更高效的自动驾驶行为。他们表示,“实际上,该功能可以使自动驾驶汽车在有遮挡的情况下更高效、更能适应新的驾驶环境,因为他们可以快速地推断和学习周围无法物理探测到的社会信息。
    
未来,该方案可以为自动驾驶汽车的发展提供信息,使其更有效地适应不断变化的环境。研究人员计划进一步开发他们的框架,改变一些假设,使其更容易应用于现实环境。Sun还解释说,“为了从其他道路参与者的行为中推断出更多的不确定信息,自动驾驶汽车应该具备与其他参与者实际行为类似的先前行为模型。在目前的研究中,我们假设所有其他道路参与者都是理性的,并通过奖励函数来接近他们的行为生成模型。未来我们将放宽理性假设,使这种近似方法更加实际。”