公共文化服务平台

2024年7月15日星期一

|

欢迎来到维普•公共文化服务平台

登录 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

教育部“新世纪优秀人才支持计划”(NCET-10-0901): 作品数：2 被引量：26H指数：2; 相关作者：徐昕王凯沈栋李兆斌黄振华更多>>; 相关机构：国防科学技术大学亚利桑那大学中国科学院自动化研究所更多>>; 发文基金：教育部“新世纪优秀人才支持计划”国家自然科学基金霍英东青年教师基金更多>>; 相关领域：自动化与计算机技术更多>>

相关作品
相关人物
相关机构
相关资助
相关领域

文献类型

2篇中文期刊文章

领域

2篇自动化与计算...

主题

1篇导航方法
1篇动态系统
1篇移动机器人
1篇自适应控制
1篇近似动态规划
1篇机器人
1篇反应式
1篇MARKOV...

机构

2篇国防科学技术...
1篇中国科学院自...
1篇亚利桑那大学

作者

2篇徐昕
1篇刘春明
1篇吴军
1篇左磊
1篇黄振华
1篇沈栋
1篇李兆斌
1篇王凯

传媒

1篇自动化学报
1篇中南大学学报...

年份

1篇2013
1篇2012

共 2 条记录，以下是 1-2

全选清除导出

排序方式：

基于LSPI和滚动窗口的移动机器人反应式导航方法被引量：6: 2013年; 结合最小二乘策略迭代(Least-squares policy iteration,LSPI)的算法特性和基于滚动窗口的实时重规划,提出一种新的基于LSPI和滚动窗口的反应式导航学习控制方法。仿真和实验结果表明:该方法对移动机器人在未知环境中的运动控制有效,并且对未知环境具有自适应性。; 刘春明李兆斌黄振华左磊吴军徐昕; 关键词：移动机器人

基于马氏决策过程模型的动态系统学习控制:研究前沿与展望被引量：20: 2012年; 基于马氏决策过程(Markov decision process,MDP)的动态系统学习控制是近年来一个涉及机器学习、控制理论和运筹学等多个学科的交叉研究方向,其主要目标是实现系统在模型复杂或者不确定等条件下基于数据驱动的多阶段优化控制.本文对基于MDP的动态系统学习控制理论、算法与应用的发展前沿进行综述,重点讨论增强学习(Reinforcement learning,RL)与近似动态规划(Approximate dynamic programming,ADP)理论与方法的研究进展,其中包括时域差值学习理论、求解连续状态与行为空间MDP的值函数逼近方法、直接策略搜索与近似策略迭代、自适应评价设计算法等,最后对相关研究领域的应用及发展趋势进行分析和探讨。; 徐昕沈栋高岩青王凯; 关键词：MARKOV决策过程近似动态规划自适应控制

全选清除导出

共1页<1>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有 @ 渝北区图书馆 2016－2018 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张