黄炳强
- 作品数:10 被引量:142H指数:5
- 供职机构:上海交通大学电子信息与电气工程学院自动化系更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术经济管理电子电信理学更多>>
- 基于模糊人工势场的移动机器人路径规划被引量:25
- 2006年
- 针对在传统的人工势场法中对机器人进行路径规划时,容易产生局部极小点问题,提出了一种模糊人工势场方法.对排斥力函数作了改进,引入了障碍物对机器人影响大小的斥力增益系数,通过构建的模糊系统,动态地调节斥力增益系数,从而有效地克服了局部极小点问题.仿真结果表明,该方法具有较强的环境适应能力,能够快速有效地规划出一条光滑的路径.
- 黄炳强曹广益
- 关键词:避障路径规划
- 基于模糊控制器的机器人路径规划研究被引量:14
- 2007年
- 针对复杂环境下移动机器人路径规划实际问题,提出了一种基于行为的移动机器人控制体系结构,设计了一种基于模糊控制器的移动机器人实时路径规划算法,为移动机器人在未知环境中的导航提出了一种新的思路。仿真结果表明,移动机器人能够克服环境中的不确定性,可靠地完成复杂任务,该算法有计算量小,效率高,鲁棒性好等优点。
- 黄炳强曹广益费燕琼李建华
- 关键词:移动机器人路径规划模糊控制避碰
- 基于平均报酬模型的强化学习算法研究被引量:4
- 2006年
- 对于有吸收目标状态的循环任务,比较合理的方法是采用基于平均报酬模型的强化学习.平均报酬模型强化学习具有收敛速度快、鲁棒性强等优点.本文介绍了平均报酬模型强化学习的3个主要算法:R学习、H学习和LC学习,并给出了平均报酬模型强化学习的主要应用及研究方向.
- 黄炳强曹广益费燕琼王占全
- 关键词:R学习
- 强化学习原理、算法及应用被引量:21
- 2006年
- 强化学习(ReinforcementLearningRL)是从动物学习理论发展而来的,它不需要有先验知识,通过不断与环境交互来获得知识,自主的进行动作选择,具有自主学习能力,在自主机器人行为学习中受到广泛重视.本文综述了强化学习的基本原理,各种算法,包括TD算法、Q-学习和R学习等,最后介绍了强化学习的应用及其在多机器人系统中的研究热点问题.
- 黄炳强曹广益王占全
- 关键词:Q-学习
- 强化学习方法及其应用研究
- 强化学习是一种重要的机器学习方法。强化学习通过感知环境状态信息来学习动态系统的最优策略,通过试错法不断与环境交互来改善自己的行为,并具有对环境的先验知识要求低的优点,是一种可以应用到实时环境中的在线学习方式,因此在智能控...
- 黄炳强
- 关键词:函数逼近模糊控制递阶遗传算法神经网络
- 管状直接甲醇燃料电池的建模和仿真被引量:4
- 2007年
- 通过对管状DMFC的电化学反应机理分析,采用活塞流反应模型建立了甲醇、氧气和气态水的浓度分布模型;依据列管式换热器原理,建立了甲醇溶液、膜电极和空气的温度分布模型,并对电流密度、进料参数对浓度分布以及电池温度影响进行仿真,为管状直接燃料电池选择合理的控制变量和控制策略提供依据;仿真结果表明,对于液相进料的DMFC,甲醇溶液的温度是影响整个电池温度的主要因素;根据燃料电池的热力学数据,对电池的效率进行了分析。
- 于如军刘秀清曹广益朱新坚黄炳强吴秋轩
- 关键词:仿真
- 基于人工势场法的移动机器人路径规划研究被引量:52
- 2006年
- 人工势场法是机器人局部路径规划常用的一种方法,具有反应速度快、计算量小和实时性等优点。但这种方法容易产生局部极点,导致机器人停止移动,达不到目标。文章利用传统的人工势场法对移动机器人避障行为进行了仿真实验并成功地规划出一条光滑路径,并对人工势场法研究现状进行了分析讨论。
- 黄炳强曹广益
- 关键词:人工势场避障路径规划
- 平均报酬模型强化学习理论、算法及应用被引量:5
- 2007年
- 折扣报酬模型强化学习是目前强化学习研究的主流,但折扣因子的选取使得近期期望报酬的影响大于远期期望报酬的影响,而有时候较大远期期望报酬的策略有可能是最优的,因此比较合理的方法是采用平均报酬模型强化学习。该文介绍了平均报酬模型强化学习的两个主要算法以及主要应用。
- 黄炳强曹广益李建华
- 关键词:R学习