陈沈轶
- 作品数:9 被引量:32H指数:2
- 供职机构:浙江大学计算机科学与技术学院更多>>
- 发文基金:航天支撑技术基金国家自然科学基金浙江省科技厅重点资助项目更多>>
- 相关领域:自动化与计算机技术自然科学总论更多>>
- 模板图像匹配中互相关的一种快速算法被引量:26
- 2007年
- 基于归一化互相关系数的算法在模板匹配和特征跟踪中运用十分广泛,但缺点是其计算量很大.为此提出了一种在空间域利用盒形基简化互相关的快速算法,在不修改归一化互相关匹配原理的前提下,用原模板图像在一组正交盒形基张成的子空间上的投影取代原图像来进行互相关计算,以降低图像精度来缩减计算复杂度.实验说明,当搜索窗口大小较小时,此快速算法计算量明显小于传统的频域快速归一化互相关算法.
- 陈沈轶钱徽吴铮朱淼良
- 关键词:归一化互相关系数子空间分解
- 基于图分割与Hausdorff距离的多分辨率影像匹配被引量:3
- 2008年
- 针对具有复杂场景的航拍图像提出了一种基于图分割理论与Hausdorff距离的多分辨率影像匹配方法。在高斯金字塔图像模型中,低分辨率的图像通过图分割方法,充分考虑图像中的局部和全局的信息,提取到稳定和完整的图像区域边界,并以区域边界作为待匹配的曲线。再通过计算曲线的统计特性作为图像间待匹配特征,并由信号相关的度量方法粗估计出图像间全局仿射变换参数。利用粗估计的参数在高分辨率层次上进一步通过基于Hausdorff距离的匹配方法搜索到精确的变换参数。实验结果表明,该方法在较大变形和强噪音干扰的情况下对复杂场景的图像也能有效地完成匹配。
- 陈沈轶钱徽吴铮潘莉莉朱淼良
- 关键词:图分割HAUSDORFF距离
- 基于回报函数逼近的学徒学习综述被引量:1
- 2008年
- 回顾了基于回报函数逼近的学徒学习的发展历史,介绍了目前的主要工作,总结了学徒学习的一般方法,讨论了线性和非线性假设条件下的回报函数求解,比较了逆向增强学习(IRL)和边际最大化(MMP)两类逼近方法.基于IRL的学徒学习是一种通过迭代的方法用基回报函数的线性组合来逼近真实回报函数的过程.MMP方法可以看作是一类基于梯度下降的最优化方法.综合采用滤波及将策略函数概率化等方法可以降低对专家演示的最优要求.最后指出了该领域存在的问题,提出了未来的研究方向,如在部分可观察马尔可夫决策过程框架下的学徒学习及对不确定策略的学习等.
- 金卓军钱徽陈沈轶朱淼良
- 基于Web的自主式移动机器人的调试仿真环境
- 2005年
- 提出了一种采用浏览器/服务端和客户端/服务端混合结构的机器人调试与仿真环境,该环境部分采用了网页技术,适用于调试和仿真多智能主体系统结构的自主移动机器人.在介绍其组成结构的基础上,详细分析了自主移动机器人调试和仿真的结构,讨论了在实时在线监控、离线数据回放、模拟仿真、真实数据仿真等几种情况下的工作模式及作用.实验结果表明,该调试仿真环境能有效地对自主移动机器人进行监控、跟踪、记录、调试、仿真,在实际项目开发中提高了系统的开发效率,缩短了开发周期.
- 许少君钱徽陈沈轶朱淼良
- 关键词:多智能主体自主移动机器人系统仿真
- 用面向Agent的多层Petri网方法实现对自主移动机器人建模分析
- 自主移动机器人是一个典型的多Agent系统.本文在面相对象的Petri网的基础上,提出了面向Agent的多层Petri网(AgentOrientedHierarchicalPetriNet)模型,我们试图将Agent作为...
- 张其前郭晔朱淼良钱徽陈沈轶
- 关键词:自主移动机器人AGENT系统PETRI网
- 文献传递
- 基于AMDP-Q的自主车辆行驶策略求解
- 结合增广马尔可夫决策过程(AMDP),蒙特卡罗一部分可观察马尔可夫决策过程(MC—POMDP)以及Q学习,提出了AMDP—Q学习(AMDP—Q)算法。算法的主要思想是:首先用一个低维充分统计量表示原信念状态空间,通常使用...
- 夏林锋钱徽陈沈轶金卓军
- 关键词:自主车辆Q学习算法
- 基于AMDP-Q的自主车辆行驶策略求解
- 2011年
- 结合增广马尔可夫决策过程(AMDP),蒙特卡罗-部分可观察马尔可夫决策过程(MC-POMDP)以及Q学习,提出了AMDP-Q学习(AMDP-Q)算法.算法的主要思想是:首先用一个低维充分统计量表示原信念状态空间,通常使用最大似然状态和信念状态的信息熵作为充分统计量,其组成的空间称为增广状态空间;然后应用参考状态集离散化该空间,并利用Q学习和Shepard插值得到连续状态的转移函数和回报函数;最后使用具有知识探索性质的ε-贪婪策略进行策略选择.实验结果表明:AMDP-Q比MC-POMDP收敛速度更快.
- 夏林锋钱徽陈沈轶金卓军
- 关键词:自主汽车Q学习
- 多机器人监控系统覆盖问题的评价模型
- 本文把多机器人监控系统和无线传感器网络联系起来,提出对网络覆盖问题的统一的评价模型.该模型基于概率论,对联合置信度采用加权叠加求平均的方法,然后计算某个置信度阈值,得到满足条件的区域面积和总面积的比值,从而对系统进行定量...
- 陈沈轶钱徽朱淼良秦志斌
- 关键词:多机器人无线传感器网络置信度监控系统
- 文献传递
- 回报函数学习的学徒学习综述被引量:2
- 2009年
- 通过研究基于回报函数学习的学徒学习的发展历史和目前的主要工作,概述了基于回报函数学习的学徒学习方法.分别在回报函数为线性和非线性条件下讨论,并且在线性条件下比较了2类方法——基于逆向增强学习(IRL)和最大化边际规划(MMP)的学徒学习.前者有较为快速的近似算法,但对于演示的最优性作了较强的假设;后者形式上更易于扩展,但计算量大.最后,提出了该领域现在还存在的问题和未来的研究方向,如把学徒学习应用于POMDP环境下,用PBVI等近似算法或者通过PCA等降维方法对数据进行学习特征的提取,从而减少高维度带来的大计算量问题.
- 金卓军钱徽陈沈轶朱淼良