国家自然科学基金(60121302) 作品数:13 被引量:240 H指数:8 相关作者: 胡包钢 王泳 胡占义 卢汉清 蒋田仔 更多>> 相关机构: 中国科学院自动化研究所 中国科学院研究生院 北京理工大学 更多>> 发文基金: 国家自然科学基金 国家重点基础研究发展计划 山西省自然科学基金 更多>> 相关领域: 自动化与计算机技术 医药卫生 电子电信 更多>>
基于Fourier-Mellin变换的图像配准方法及应用拓展 被引量:68 2006年 从两个方面拓展了基于Fourier-Mellin变换的图像配准方法的应用范围.首先是全景图像的拼接.不同于传统的方法,该方法不需要准确控制相机的运动,不需要知道相机的焦距等内部参数,也不需要检测图像特征,在配准精度要求不是很高的情况下,直接生成的全景图像可以满足很多实际应用的需要;同时,实验也表明,该方法应用于弱透视图像的配准,也具有很好的配准效果.另一个拓展是图像曲线的匹配.传统的曲线匹配方法一般通过曲线特征点(如角点、曲率极值点等)之间的对应求得曲线间的变换参数.一种新的思想是先将图像曲线转化为二值图像,然后应用Fourier-Mellin变换对这些二值图像进行配准,从而达到对两条曲线的匹配.大量实验表明,该方法对射影畸变不是十分显著且摄像机为一般运动下获得的图像之间的配准问题(如手持数码相机获取的图像之间的配准问题)均能取得比较好的配准效果. 李晓明 赵训坡 郑链 胡占义关键词:傅立叶变换 FOURIER-MELLIN变换 图像配准 图像拼接 单幅图像测量的一种新方法(英文) 被引量:11 2004年 本文方法表明,由一空间平面(参考平面)与其图像间的单应性矩阵(Homography)不仅此参考平面上的距离可以测量,而且可以测量与此参考平面垂直的平面上的距离.同时,分别位于两平面上的点间的距离也可以测量.这样就可以得到关于场景的更多的几何信息,此结果是在前人的基础上又向前跨了一步.另外,本文提出一种新的基于平面单应性矩阵的摄像机标定方法.模拟和真实图像试验均表明本文方法是可行的,并得到了令人满意的结果. 黄凤荣 胡占义 吴毅红关键词:单应性矩阵 摄像机标定 汉语大词汇量连续语音识别系统研究进展 被引量:46 2009年 大词汇量连续语音识别(LVCSR)技术近年来发展迅速,并在许多领域得到了广泛的应用,国内外许多大公司加大了对语音识别技术的研究,不少商业化的语音识别系统已经面世,并得到较为广泛的使用。该文综述了近年来大词汇量连续语音识别技术的研究进展,描述了汉语大词汇量连续语音识别系统,主要是基于统计方法的语音识别系统的框架与设计方法,对语音识别系统的一些关键技术和原理进行了分析,并对近年来国内外对语音识别研究发展动向进行了讨论。 倪崇嘉 刘文举 徐波关键词:中文信息处理 语音识别 模型自适应 搜索技术 A Note on Polynomials Based Image Registration 被引量:2 2005年 It is shown that the polynomials based image registration, which is widely used in remote sensing field, does not have a sound mathematical basis. In fact, there seems no theoretical basis for the polynomials based transform to outperform the affine transformation, a much simpler one,in image registration. If the transformation functions are polynomials of order n, the corresponding scene is shown to be in general the intersection of two curved surfaces of order n + 1, in other words,a space curve. In some special cases, the scene is approaching to a plane. To our knowledge, such results did not appear in the literature previously. 黄凤荣 胡占义关键词:单应性 转换函数 Evaluation Criteria Based on Mutual Information for Classifications Including Rejected Class 被引量:6 2008年 与用表演措施的常规评估标准不同,信息理论基于在场的标准在机器学习的应用的一个唯一的有益的特征。然而,我们仍然远非正在拥有熵类型标准的深入的理解,说,在与常规基于表演的标准的关系。这份报纸学习通用分类问题,它包括一拒绝,或未知,班。我们在场基本公式和分类基于信息学习的图解的图理论。一个靠近形式的方程为通用分类问题在规范的相互的信息和扩充混乱矩阵之间被导出。敏感方程的三个定理和定理集合为学习在相互的信息和常规表演索引之间的关系被给。我们也与常规标准比较举与相互的信息标准的优点和限制有关的数字例子和几讨论。 HU Bao-Gang WANG Yong关键词:信息分类 自动化技术 应用统计方法综合评估核函数分类能力的研究 被引量:30 2008年 应用统计方法对支持向量机方法中核函数选择问题进行了研究.文中将"纠正重复取样t测试"引入到核函数选择中,通过其与k-折交叉验证、配对t测试等多种统计方法的综合应用,对9个常用核函数的分类能力进行了定量研究.同时,文中还提出了基于信息增益的评估核函数模式识别能力的定量评估准则,证明了该准则是传统评估准则的非线性函数.数值实验表明,不同模型评估准则之间存在差异,但应用统计方法可以从这些差异中发现一些规律.同时,不同统计方法之间也存在显著差异,且这种差异对模型评估的影响要大于由于评估准则的不同而产生的影响.因此,只有应用综合的评估方法和准则才能对不同核函数的分类能力进行客观评估. 王泳 胡包钢关键词:模式识别 信息增益 非线性函数 Sinusoidal+All-Pole Modification Based Spectral Smoothing for Concatenative Speech Synthesis <正>The conventional LPC spectral smoothing algorithm causes an evident degradation in the speech quality when ... Heng KANG文献传递 基于奇Gabor滤波器与Rayleigh分布的边缘检测 被引量:6 2005年 为了自适应地更好地进行边缘检测,提出了一个基于奇Gabor滤波器与Rayle igh分布的边缘检测方法。在边缘响应获取中,由于该方法改进了原有的基于奇Gabor滤波器的边缘响应获取方法,从而提高了计算效率,并且避免了原算法对初始梯度方向估计的依赖。同时根据奇Gabor滤波器的一阶微分属性,可对其边缘输出响应利用Rayle igh分布进行拟合。为克服已有算法中阈值选择的局限性,还提出了一种基于Rayle igh分布的非线性自适应阈值选择方法。实验结果表明,所提出的边缘检测方法具有较好的检测性能和自适应性。 朱振峰 卢汉清关键词:边缘检测 GABOR滤波器 RAYLEIGH分布 自适应阈值 汉英统计翻译系统中未登录词的处理方法 在统计机器翻译系统的解码过程中,经常会出现训练语料中没有的“未登录词”,这些词的出现严重地影响了解码器的速度和整个系统的性能,为此,本文通过对未登录词现象及其同义词的分析,提出并实现了一种针对统计翻译系统中未登录词的处理... 周可艳 宗成庆关键词:统计机器翻译 同义词 文献传递 基于“松弛尺度”的短语翻译对抽取方法 短语对抽取是基于短语统计机器翻译方法的关键技术。当前广泛使用的 Och 提出的短语对抽取方法,过于依赖词对齐结果,因而只能抽取与词对齐完全相容的短语对。本文给出一种基于“松弛尺度”的短语抽取方法, 对不能完全相容的短语对... 何彦青 周玉 宗成庆关键词:统计机器翻译 文献传递