公共文化服务平台

2024年7月6日星期六

|

欢迎来到维普•公共文化服务平台

登录 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

程晓北: 作品数：5 被引量：12H指数：2; 供职机构：哈尔滨工程大学计算机科学与技术学院更多>>; 发文基金：中国博士后科学基金中央高校基本科研业务费专项资金国家教育部博士点基金更多>>; 相关领域：自动化与计算机技术更多>>

合作作者

沈晶哈尔滨工程大学计算机科学与技术...
刘海波哈尔滨工程大学计算机科学与技术...
顾国昌哈尔滨工程大学计算机科学与技术...
张国印哈尔滨工程大学计算机科学与技术...
吴艳霞哈尔滨工程大学计算机科学与技术...

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

4篇期刊文章
1篇会议论文

领域

5篇自动化与计算...

主题

4篇分层强化学习
3篇智能体
3篇多智能
3篇多智能体
2篇维数
2篇维数灾
2篇维数灾难
1篇动态环境
1篇多机器人
1篇智能体系统
1篇人工智能
1篇机器人
1篇多智能体强化...
1篇多智能体系
1篇多智能体系统
1篇OPTION

机构

5篇哈尔滨工程大...

作者

5篇程晓北
4篇顾国昌
4篇刘海波
4篇沈晶
3篇张国印
1篇吴艳霞

传媒

1篇控制理论与应...
1篇计算机工程与...
1篇山东大学学报...
1篇边疆经济与文...
1篇中国人工智能...

年份

1篇2010
2篇2008
2篇2007

共 5 条记录，以下是 1-5

全选清除导出

排序方式：

一种多智能体分层强化学习方法: 现有的多智能体强化学习方法不能很好地解决维数灾难问题。本文将融合Option和MAXQ的分层强化学习方法并推广到多智能体领域,形成一种新的多智能体分层强化学习方法,以多出租车问题为任务背景进行了仿真实验,结果表明该方法行...; 沈晶程晓北刘海波张国印顾国昌; 关键词：人工智能多智能体维数灾难; 文献传递

分层强化学习研究进展被引量：1: 2008年; 强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支。但强化学习方法一直被维数灾难所困扰。近年来,分层强化学习方法在解决维数灾问题中取得了显著成果,并逐渐开始向多智能体系统推广,论文归纳分析这一领域目前的研究进展,并对迫切需要解决的一些问题和进一步的发展趋势作出探讨和展望。; 程晓北沈晶刘海波顾国昌张国印; 关键词：分层强化学习多智能体系统维数灾难

多智能体分层强化学习研究进展: 2007年; 强化学习(RL)通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支。多智能体强化学习(MARL)和分层强化学习(HRL)是该领域近年的两个研究热点,二者融合形成的多智能体分层强化学习(MAHRL)则是当前一个新的研究方向。MARL、HRL和MAHRL虽已取得了研究成果,但也要指出MAHRL研究中尚未解决的问题及其研究思路。; 程晓北顾国昌; 关键词：多智能体强化学习分层强化学习

基于半马尔可夫对策的多机器人分层强化学习被引量：7: 2010年; 在多智能体分层强化学习研究成果的基础上,考虑多机器人系统经常面临的通信困难问题(如水下环境),提出一种基于半马尔可夫对策的多机器人分层强化学习方法,通过引入对策论方法解决通信困难情况下多机器人学习问题。仿真实验结果表明了该方法的有效性。; 沈晶刘海波张汝波吴艳霞程晓北; 关键词：多机器人分层强化学习

动态环境中的分层强化学习被引量：5: 2008年; 现有的强化学习方法都不能很好地处理动态环境中的学习问题,当环境变化时需要重新学习最优策略,若环境变化的时间间隔小于策略收敛时间,学习算法则不能收敛.本文在Option分层强化学习方法的基础上提出一种适应动态环境的分层强化学习方法,该方法利用学习的分层特性,仅关注分层任务子目标状态及当前Option内部环境状态的变化,将策略更新过程限制在规模较小的局部空间或维数较低的高层空间上,从而加快学习速度.以二维动态栅格空间内两点间最短路径规划为背景进行了仿真实验,实验结果表明,该方法策略学习速度明显高于以往的方法,且学习算法收敛性对环境变化频率的依赖性有所降低.; 沈晶程晓北刘海波顾国昌张国印; 关键词：分层强化学习动态环境 OPTION

全选清除导出

共1页<1>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有 @ 渝北区图书馆 2016－2018 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张