博士科研启动基金(52002011200708)
- 作品数:2 被引量:7H指数:2
- 相关作者:韩光胜左国玉张红卫张洪亮樊瑞元更多>>
- 相关机构:北京工业大学更多>>
- 发文基金:博士科研启动基金北京市教委科技发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于动态目标点的行为分解编队算法被引量:3
- 2010年
- 多机器人编队可以分解为队形形成和队形保持控制两部分。针对多机器人编队控制任务中的队形形成问题,提出了一种基于动态目标点的行为分解编队算法。此算法是一种改进的基于行为的编队控制方法,这种控制方法的思路为,首先要求各机器人在每一时刻确定一个运动目标点,此运动目标点是根据运动过程中机器人实时的位置运算出来的,是一个动态的目标点。根据此目标点进而产生一个运动需求。再将此运动需求按照有限状态机(FSM)原理分解为不同的子行为,然后给这些子行为分别赋予不同的权值,并求出一组控制变量,最终对这组控制变量加权平均产生一个综合控制变量。仿真实验表明,该方法能快速有效地实现多机器人的编队控制。此编队算法可以有效应用于军事搜索、围捕或机器搬运等多个领域。
- 左国玉张洪亮韩光胜樊瑞元
- 关键词:多机器人目标点
- 基于多智能体强化学习的新强化函数设计被引量:4
- 2009年
- 为了提高强化学习算法在多智能体系统中的性能表现,针对典型的多智能体系统-Keepaway平台总是以失败告终的特点,受与之有相同特点的单智能体系统杆平衡系统所采用强化函数的启发,重新设计一种新的惩罚式的强化函数。新的强化函数在系统成功状态时设零值奖赏,失败状态时给与负值惩罚。基于新设计的强化函数的Sarsa(λ)算法成功应用在Keepaway平台上。仿真结果表明,新设计的强化函数在一定参数条件下有效提高了强化学习算法载Keepaway平台的性能表现,其最终的学习效果更好。
- 左国玉张红卫韩光胜
- 关键词:多智能体系统ROBOCUP