李春贵
- 作品数:6 被引量:54H指数:4
- 供职机构:北京理工大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 决策过程的有效强化学习方法研究
- 该文主要研究基于动态规划的强化学习算法,在已有的学习结构和学习算法的基础上,提出了几种改进的学习结构和学习算法,主要成果可概括如下: 无模型多步截断即时差分学习算法 将多步截断差分学习预测和适合迹相结合,通过定义相应的迹...
- 李春贵
- 关键词:MARKOV决策过程动态规划Q学习
- 文献传递
- 复杂背景图像中检测动目标的一种方法被引量:22
- 2002年
- 该文研究了基于Kalman滤波理论的渐消记忆递归最小二乘法,探讨了渐消记忆递归最小二乘法在重建图像背景中的应用,并用于实现在复杂背景下视频图像动目标的检测。首先用该算法对复杂背景进行更新预测,然后用当前帧图像与预测背景差分提取动目标,最后用灰度投影算法计算出目标的质心。整个目标检测方法简单、有效,便于用硬件快速实现。文中给出了实验结果。
- 刘永信魏平侯朝桢李春贵潘秀琴
- 关键词:复杂背景图像动目标KALMAN滤波数字图像处理
- 一种集成规划的SARSA(λ)强化学习算法被引量:4
- 2002年
- 提出一种新的集成规划的 SARSA(λ)强化学习算法 .该算法的主要思想是充分利用已有的经验数据 ,在无模型学习的同时估计系统模型 ,每进行一次无模型学习的试验后 ,利用模型在所记忆的状态 /行动对组成的表中进行规划 ,同时利用该表给出了在学习和规划之间的量化折中参考 .实验结果表明 ,本算法比单纯的无模型学习SARSA(λ)
- 李春贵吴沧浦刘永信
- 关键词:MARKOV决策过程
- 一种基于状态聚类的SARSA(λ)强化学习算法被引量:6
- 2003年
- 为求解大状态空间的强化学习问题,提出了一种基于状态聚类的SARSA(λ)强化学习算法,其基本思想是利用先验知识或事先训练控制器,对状态空间进行聚类,分为不同的簇,然后在簇空间上进行SARSA(λ)学习。若能进行适当的状态聚类,算法将可得到一个相对好的近似值函数.
- 李春贵吴沧浦刘永信
- 关键词:人工神经网络
- 复杂背景中视频图像目标的检测被引量:21
- 2001年
- 研究带有运动景物的复杂背景中视频图像运动目标的检测 .用图像差分法提取运动目标信息 ;针对运动景物在差分图像中产生强脉冲干扰的特点 ,提出 K邻域自适应滤波算法 ;采用二维熵准则选择最佳二值化阈值 ;最后用图像形态学运算处理目标的分割碎块 .
- 刘永信魏平侯朝桢李春贵
- 关键词:运动目标检测图像滤波图像形态学视频图像
- 一种状态集结因子化SARSA(λ)强化学习算法被引量:1
- 2001年
- 提出了一种自适应状态集结因子化 SARSA(λ)强化学习算法 ,在学习的过程中利用Bellman余留数进行状态集结 ,通过集结 ,大大减少了状态空间搜索与计算的复杂度 ,有利于求解大状态空间的 MDPs问题 ,而且 ,本算法不需要有关状态特征的先验知识 。
- 李春贵刘永信
- 关键词:因子化