张振文
- 作品数:3 被引量:1H指数:1
- 供职机构:江苏大学计算机科学与通信工程学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于惩罚函数NPGA的多目标路径规划
- 2008年
- 通过分析传统的机器人路径规划方法,将足球机器人路径规划归结为一个多目标优化问题,利用基于惩罚函数的小生境遗传算法建立动态目标路径规划的运动模型。仿真表明,与传统的路径规划方法相比,该方法在保证机器人较高体力值的前提下,规划出合理的路径。
- 张振文程显毅
- 关键词:小生境遗传算法多目标优化惩罚函数路径规划
- 基于个性的协同强化学习模型
- 2007年
- 将个性行为绑定到信息Agent上,提出了一种基于个性的协同强化学习算法,让不同个性的Agent充当合适的角色.基于共同的目标和相同的信息,Agent可能产生共同的意图,规划出共同的行为,使得MAS可以适用于动态、实时、有干扰、对抗的环境中.
- 严耀华程显毅张振文杨长隅
- 关键词:智能体
- 分布式强化学习在RoboCup中的应用被引量:1
- 2007年
- 强化学习理论由于其自学习性和自适应性的优点而得到了广泛关注。基于主Agent的概念改进了传统的群体强化学习算法,应用于机器人足球(Robocup)仿真实验中,取得了初步结果。
- 张振文程显毅李明
- 关键词:分布式强化学习AGENTROBOCUP