国家自然科学基金(60375017)
- 作品数:34 被引量:156H指数:7
- 相关作者:阮晓钢孙亮郝冬梅乔俊飞李明爱更多>>
- 相关机构:北京工业大学更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金北京市人才强教计划项目更多>>
- 相关领域:自动化与计算机技术医药卫生生物学理学更多>>
- 一个室内清洁机器人的区域遍历与地图绘制被引量:8
- 2006年
- 本文针对室内清洁机器人的区域遍历问题,提出了一种地图绘制的方法;该方法基于栅格地图表示环境,对环境地图进行分区,通过自由区域联结图广度优先搜索及深度优先遍历(WSDC)形成方形区域遍历顺序,对机器人探测环境的路线进行导航。实验研究表明栅格地图表示环境对于区域划分与区域遍历更有效;采用WSDC算法产生的区域遍历顺序导航机器人运动,可以减少机器人的运动距离,提高工作效率。
- 阮晓钢徐绍敏
- 关键词:清洁机器人地图绘制栅格地图导航
- 用连续Hopfield网络实现无限时域上的最优控制
- 2006年
- 为避免直接采用Riccati方程求解时变系统无限域最优控制问题时的计算困难,本文提出一种基于时间连续状态连续型Hopfield网络(CTCSHNN)实现无限域动态最优控制的方法.该方法通过建立CTCSHNN能量函数与移动域控制指标间的等价关系,可在线构建CTCSHNN.理论分析表明,依据该方法设计的CTCSHNN具有稳定性,而且移动域控制量可由网络稳态输出直接产生.将该方法与滚动优化策略相结合,可实现无限时域上的闭环最优控制.仿真实验验证了理论设计的正确性与采用基于CTCSHNN的移动域控制实现无限域闭环最优控制的可行性.
- 李明爱乔俊飞阮晓钢
- 关键词:HOPFIELD网络动态最优控制无限域
- 机械手轨迹规划的神经网络逆模控制被引量:6
- 2008年
- 针对二自由度机械手动力学模型的非线性和参数的不确定性,提出了一种神经网络与逆模控制相结合的控制策略。针对传统BP算法在神经网络训练后期收敛速度慢且容易陷入局部极小的缺点,提出一种快速启发式学习算法。采用所提出的快速启发式网络学习算法训练多层前馈神经网络,建立机械手的逆动力学模型,实现对机械手的非线性控制。仿真结果表明了所提出控制策略的有效性和快速启发式网络学习算法的快速收敛性。
- 于乃功李明李建更
- 关键词:逆模控制机械手神经网络
- 基于强化学习的二级倒立摆控制被引量:4
- 2006年
- 在模型未知和没有先验经验的条件下,采用一种改进的强化学习算法实现二级倒立摆系统的平衡控制。该学习算法不需要预测和辨识模型,能通过网络自身的联想和记忆,在线寻求最优策略。该学习算法采用基于神经网络的值函数逼近,并用直接梯度和适合度轨迹修正权值,有效实现对连续状态和行为空间任务的控制。计算机仿真证明了该强化学习算法在较短的时间内即可成功地学会控制直线二级倒立摆系统。
- 王瑞霞孙亮阮晓钢
- 关键词:倒立摆
- 基于双闭环的液压伺服系统控制被引量:11
- 2007年
- 为了使液压振动试验台具有良好的运动特性,提出了一种双闭环控制结构.内环采用模拟控制器调节电液伺服阀,外环采用基于DSP的数字控制器用以调节液压伺服作动器.将此控制方案应用于对专用汽车减震器进行性能测试的液压振动试验台的工业现场,其实时监控结果表明:设计的模拟、数字相结合的双闭环控制器的方案正确,参数选择合理,系统的各项性能指标都达到了预期目标.
- 于建均陈千平孙亮李建更阮晓钢
- 关键词:闭环控制系统数字信号处理器
- 基于神经网络的强化学习在避障中的应用被引量:30
- 2008年
- 为了提高移动机器人的自学习能力,在基于行为控制结构的基础上设计了智能控制结构,该结构引入了强化学习模块。神经网络具有很好的泛化能力,该文提出了基于神经网络的强化Q学习算法,克服了表格式Q学习算法只能应用到离散的状态中并需要大量存储空间的不足,最后结合智能控制结构应用到移动机器人的避障中。实验结果表明,该方法能够使移动机器人通过自学习实现自主避障。
- 乔俊飞侯占军阮晓钢
- 关键词:移动机器人神经网络避障
- 基于内部回归神经网络的强化学习被引量:5
- 2005年
- 在强化学习和动态规划算法的基础上,提出一种不需要预测模型的改进的强化学习算法。该学习算法在模型未知和没有先验经验的条件下,能通过自身神经网络的在线学习,有效控制不稳定的非线性系统。该学习算法的网络结构采用内部回归神经网络,这样可以增强网络本身处理动态信息的能力,使其更适合复杂系统的稳定控制。应用到一级倒立摆物理实体的控制,实验结果表明了该学习算法在性能上优于其他同类强化学习算法。
- 王瑞霞孙亮阮晓刚
- 关键词:倒立摆动态规划算法
- 基于尖峰神经元的条件反射模型及其认知行为的研究被引量:3
- 2005年
- 一种具有经典条件反射行为的认知模型(CMSPK),该模型以尖锋神经元为基本元素,互联形成具有反射弧结构的神经网络,能充分表现经典条件反射对时间的依赖性。基于有衰减项的Hebb规则设计了反映“刺激-响应-强化”特征的强化学习算法,使CMSPK具有经典条件反射行为和认知行为。应用CMSPK模型成功地模拟了习得、刺激间隔效应、遗忘、阻止和二阶条件反射等现象。
- 杨贝贝阮晓钢
- 关键词:HEBB规则
- 嵌入式移动机器人控制器设计被引量:4
- 2007年
- 提出了一种基于数字信号处理器和嵌入式实时操作系统的移动机器人控制器设计方案。本方案通过在TMS320F2812型DSP上移植一个uC/OS-Ⅱ实时内核的方式,在增强系统的实时性和提高性价比的基础上提高了控制器的开放性,简化了应用程序的开发。
- 孙亮常青阮晓钢
- 关键词:DSP移动机器人控制器
- 一种基于递归神经网络的自适应控制方法研究被引量:6
- 2005年
- 本文针对快速、多变量、强非线性的复杂系统的控制问题,在强化学习方式的基础上,提出一种新的自适应控制方法。该方法在没有先验知识的条件下,基于递归神经网络并结合强化学习的自调节能力,通过自身神经网络的在线学习,有效控制不稳定的非线性系统。本文以一级倒立摆系统为实验对象,仿真实验结果表明:所提出的控制方法具有非常好的控制效果和稳定精度,抗干扰能力强。
- 钱征孙亮阮晓钢
- 关键词:OIFELMAN网络BP网络