您的位置: 专家智库 > >

刘博

作品数:2 被引量:1H指数:1
供职机构:中国矿业大学信息与电气工程学院更多>>
发文基金:中国博士后科学基金教育部“新世纪优秀人才支持计划”国家教育部博士点基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇知识
  • 1篇知识迁移
  • 1篇数据流
  • 1篇迁移
  • 1篇分析模型
  • 1篇高斯
  • 1篇高斯函数
  • 1篇Q值

机构

  • 2篇中国矿业大学

作者

  • 2篇刘博
  • 1篇雷汝海
  • 1篇王雪松
  • 1篇程玉虎

传媒

  • 1篇控制与决策
  • 1篇中国科技论文...

年份

  • 2篇2010
2 条 记 录,以下是 1-2
排序方式:
基于径向基统计网络的数据流分析模型
2010年
在传统径向基函数网络的基础上,提出一种用于数据流分析的径向基统计网络,采用复合多维高斯函数来拟合输入空间中不同区域的概率密度.基于数理统计方法的径向基统计网络学习算法的时间和空间复杂度,均与输入变量维数和隐层节点个数的乘积成线性关系,而与数据流规模无关,能够满足数据流分析的实时性要求.仿真结果表明,径向基统计网络能够有效解决数据流的回归和分类问题.
程玉虎刘博王雪松
关键词:数据流高斯函数
异质Agent间的知识迁移强化学习被引量:1
2010年
针对现有知识迁移方法仅适用于同质强化学习Agent的问题,提出一种能够在具有不同状态动作空间的异质Agent间迁移知识的Q学习算法。该算法的主要思想是通过新旧Agent共同学习过的任务,利用神经网络离线学习两Agent间的Q值函数映射关系,利用构造的Q值函数映射器把旧Agent学过而新Agent没有学过的任务的Q值映射到新Agent上,从而可以减少新Agent的学习尝试次数,提高学习速度。10×10格子世界仿真结果验证了所提知识迁移Q学习算法的有效性。
刘博雷汝海
关键词:知识迁移Q值
共1页<1>
聚类工具0