2024年11月26日
星期二
|
欢迎来到维普•公共文化服务平台
登录
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
王国芳
作品数:
1
被引量:3
H指数:1
供职机构:
浙江大学航空航天学院
更多>>
发文基金:
浙江省自然科学基金
国家自然科学基金
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
李平
浙江大学航空航天学院
方舟
浙江大学航空航天学院
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
中文期刊文章
领域
1篇
自动化与计算...
主题
1篇
递归最小二乘
1篇
自然梯度
机构
1篇
浙江大学
作者
1篇
方舟
1篇
李平
1篇
王国芳
传媒
1篇
浙江大学学报...
年份
1篇
2015
共
1
条 记 录,以下是 1-1
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于批量递归最小二乘的自然Actor-Critic算法
被引量:3
2015年
为了减轻Actor-Critic结构中智能体用最小二乘法估计自然梯度时的在线运算负担,提高运算实时性,提出新的学习算法:NAC-BRLS.该算法在Critic中利用批量递归最小二乘法估计自然梯度,根据估计得到的梯度乐观地更新策略.批量递归最小二乘法的引入使得智能体能根据自身运算能力自由调整各批次运算的数据量,即每次策略估计时使用的数据量,在全乐观和部分乐观之间进行权衡,大大提高了NAC-LSTD算法的灵活性.山地车仿真实验表明,与NAC-LSTD算法相比,NAC-BRLS算法在保证一定收敛性能的前提下,能够明显降低智能体的单步平均运算负担.
王国芳
方舟
李平
关键词:
自然梯度
递归最小二乘
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张