燕继坤
- 作品数:11 被引量:44H指数:4
- 供职机构:西南电子电信技术研究所更多>>
- 发文基金:国防科技技术预先研究基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 变形网格及其在图像识别中的应用被引量:4
- 2004年
- 网格特征是图像识别中一类重要特征,而变形模板对于复杂的图像识别问题如字符识别、数字识别、图标识别等表现出很好的性能,但变形模板很费时.该文针对网格特征提出了变形网格,并分析了变形模板与变形网格之间的近似等价性.所提方法对网格进行变形而不是对图像变形,因而速度比变形模板快得多,而且性能相差不大.把这种方法分别应用于图标识别和脱机手写汉字识别.图标识别实验中变形模板使识别率提高了7.5%,而变形网格使识别率提高了7.3%.手写汉字识别实验中变形模板使识别率提高了6.1%,而变形网格使识别率提高了5.8%.考虑到变形网格比变形模板快得多,所以这种方法是有优势的.
- 燕继坤张震郑辉
- 关键词:图像识别图标识别汉字识别
- 基于Adaboost的文本隐写分析
- 本文通过对自然文本统计模型和特性的分析,指出隐藏消息后可能对文本统计特性带来的变化,并提出了基于AdaBoost的通用检测算法。文章抽取文本的5个基本统计特征量为分类特征,对自然文本和载密文本进行有效分类检测。实验证明该...
- 眭新光沈蕾燕继坤朱中梁
- 文献传递
- 低质量文档图像中图标的定位
- 2004年
- 针对二值图像提出了基于金字塔模型的目标定位方法 ,该方法适合于构成目标的连通区互相之间距离较小 ,而与其他连通区之间距离较大的情形 首先生成图像的金字塔模型 ,构成目标的连通区会在金字塔模型的某一层合并为一个连通区 ,根据金字塔模型各层中连通区的指示在原始图像中确定一块区域 ,用C4 5作粗分类 ,再用模板匹配判定是否含有目标 把这种方法应用于低质量文档图像中图标的定位 用含 30 0个图标的图标库进行实验 ,得到 88 7%的定位查全率 ,70 4 2
- 燕继坤席建民周密郑辉
- 关键词:金字塔模型C4.5
- 一种自适应的视频帧中字幕检测定位方法被引量:15
- 2004年
- 视频帧中的字幕往往包含当前视频的高层语意内容 ,对视频内容的自动理解、索引和检索有重要意义。文中提出了一种视频帧中字幕的自适应检测定位方法 ,与以往根据经验设定阈值的方法相比 ,该方法简单 ,对视频帧的复杂变化的适应能力更强 ,检测定位更快速、准确。大量实验结果显示该方法是有效的。
- 王勇燕继坤郑辉
- 关键词:视频字幕文字检测文字定位边缘检测
- 基于单边抽样的LPU
- 2006年
- 提出结合单边抽样Bagging与LPU的基本思想对不平衡数据进行分类。主要步骤是:将未标注实例全标为反类,和正例一起训练单边抽样Bagging学习器,将得到的学习器对未标注实例分类得到可靠的反例(RN),再用正例和RN训练SSBagging学习器。使用Rocchio和EM进行分类是Liu等提出的一种有代表性的LPU。比较了这种LPU和该文提出的方法,发现当数据的不平衡性很明显时,后者要优于前者。
- 沈蕾石盛平燕继坤
- 关键词:BAGGINGEM
- 基于相似性和新奇度从音乐中提取代表性摘录
- 2007年
- 提出了基于相似性和新奇度提取音乐代表性摘录的方法。最大化片段与整个作品的相似性来找到最相似的摘录,最大化片段的新奇度来找到意义最丰富的摘录,并把这两个参数结合起来寻找最具代表性的摘录,同时引入数学形态滤波对音频信号预处理,消除信号中的非主要分量。实验结果表明,该方法能够找到重要的最具代表性的摘录,并且对音乐源只作了很少的假设。
- 吕波李建彬贺苏宁燕继坤
- 关键词:自相似性
- 少数类的集成学习被引量:2
- 2009年
- 传统机器学习中研究的分类问题通常假定各类别是平衡的,但在很多场合各类别的出现概率相差很大,而且很多应用中需要区分重要而稀少的少数类。本文比较了3种基于AdaBoost集成学习方法,并推导出他们的精度几何平均(GMA)的下界。分析表明:类别越不平衡,这3种方法越难以通过提高基分类器准确率来提高GMA。在此结论的基础上,以Bagging为基础提出了单边Bagging算法,该算法只对多数类抽样,而保留所有少数类,因而每轮的训练集是类别平衡的,并通过UC I数据集验证了其有效性。
- 潘志松燕继坤
- 样本错误加权的支持向量数据描述及应用1
- SVDD是一种有效的数据描述方法,但SVDD对目标集的所有训练样本等同看待,这在一些需要对不同训练样本区别对待的应用中并不适用.例如目标集可能由几个子类构成,某些子类的错误损失比较大,希望对这些子类的分类准确率更高.WS...
- 张震胡捍英燕继坤
- 关键词:数据描述SVDD
- 文献传递
- 基于可信度的投票法被引量:13
- 2005年
- 可信度投票法不仅使用了基分类器输出的类别,还使用了输出的可信度.推导了该方法训练错误率的界以及期望错误率的界.发现为了最小化期望错误率的界,应该使用错误独立的基分类器,如果基分类器的错误率不是很高,这个界以指数级速度随着基分类器错误率的降低而降低,而且这个界随着投票次数的增加也会下降.在最小化训练错误率的界的意义下,得到了一种权值分配方法.把这个方法应用于一种Bagging算法:AB,得到了综合分类算法CAB.使用UCI机器学习数据集中的数据,通过实验验证了CAB的有效性.
- 燕继坤郑辉王艳曾立君
- 关键词:BAGGING
- 相似文本的快速搜索被引量:6
- 2004年
- 相似文本的快速搜索是大规模文本处理需要解决的基本问题。从两方面改进了Udi的相似文本搜索方法,通过Hash把集合映射成ID,从而得到更快的集合比较算法,重新定义了相似关系,能够减少误判,同时对有固定格式的文本也有更好的效果。
- 燕继坤郑辉席建民