公共文化服务平台

2024年7月19日星期五

|

欢迎来到维普•公共文化服务平台

登录 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

刘博: 作品数：2 被引量：1H指数：1; 供职机构：中国矿业大学信息与电气工程学院更多>>; 发文基金：中国博士后科学基金教育部“新世纪优秀人才支持计划”国家教育部博士点基金更多>>; 相关领域：自动化与计算机技术更多>>

合作作者

雷汝海中国矿业大学信息与电气工程学院
程玉虎中国矿业大学信息与电气工程学院
王雪松中国矿业大学信息与电气工程学院

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

2篇中文期刊文章

领域

2篇自动化与计算...

主题

1篇知识
1篇知识迁移
1篇数据流
1篇迁移
1篇分析模型
1篇高斯
1篇高斯函数
1篇Q值

机构

2篇中国矿业大学

作者

2篇刘博
1篇雷汝海
1篇王雪松
1篇程玉虎

传媒

1篇控制与决策
1篇中国科技论文...

年份

2篇2010

共 2 条记录，以下是 1-2

全选清除导出

排序方式：

基于径向基统计网络的数据流分析模型: 2010年; 在传统径向基函数网络的基础上,提出一种用于数据流分析的径向基统计网络,采用复合多维高斯函数来拟合输入空间中不同区域的概率密度.基于数理统计方法的径向基统计网络学习算法的时间和空间复杂度,均与输入变量维数和隐层节点个数的乘积成线性关系,而与数据流规模无关,能够满足数据流分析的实时性要求.仿真结果表明,径向基统计网络能够有效解决数据流的回归和分类问题.; 程玉虎刘博王雪松; 关键词：数据流高斯函数

异质Agent间的知识迁移强化学习被引量：1: 2010年; 针对现有知识迁移方法仅适用于同质强化学习Agent的问题,提出一种能够在具有不同状态动作空间的异质Agent间迁移知识的Q学习算法。该算法的主要思想是通过新旧Agent共同学习过的任务,利用神经网络离线学习两Agent间的Q值函数映射关系,利用构造的Q值函数映射器把旧Agent学过而新Agent没有学过的任务的Q值映射到新Agent上,从而可以减少新Agent的学习尝试次数,提高学习速度。10×10格子世界仿真结果验证了所提知识迁移Q学习算法的有效性。; 刘博雷汝海; 关键词：知识迁移 Q值

全选清除导出

共1页<1>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有 @ 渝北区图书馆 2016－2018 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张