您的位置: 专家智库 > >

王国芳

作品数:1 被引量:3H指数:1
供职机构:浙江大学航空航天学院更多>>
发文基金:浙江省自然科学基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇递归最小二乘
  • 1篇自然梯度

机构

  • 1篇浙江大学

作者

  • 1篇方舟
  • 1篇李平
  • 1篇王国芳

传媒

  • 1篇浙江大学学报...

年份

  • 1篇2015
1 条 记 录,以下是 1-1
排序方式:
基于批量递归最小二乘的自然Actor-Critic算法被引量:3
2015年
为了减轻Actor-Critic结构中智能体用最小二乘法估计自然梯度时的在线运算负担,提高运算实时性,提出新的学习算法:NAC-BRLS.该算法在Critic中利用批量递归最小二乘法估计自然梯度,根据估计得到的梯度乐观地更新策略.批量递归最小二乘法的引入使得智能体能根据自身运算能力自由调整各批次运算的数据量,即每次策略估计时使用的数据量,在全乐观和部分乐观之间进行权衡,大大提高了NAC-LSTD算法的灵活性.山地车仿真实验表明,与NAC-LSTD算法相比,NAC-BRLS算法在保证一定收敛性能的前提下,能够明显降低智能体的单步平均运算负担.
王国芳方舟李平
关键词:自然梯度递归最小二乘
共1页<1>
聚类工具0