华为科技基金项目(HITC2011023) 作品数:4 被引量:13 H指数:3 相关作者: 李静 卢朝阳 许亚美 姜维 刘晓佩 更多>> 相关机构: 西安电子科技大学 更多>> 发文基金: 中央高校基本科研业务费专项资金 国家自然科学基金 华为科技基金项目 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
手写维文字符分割中的多信息融合路径寻优方法 被引量:2 2013年 针对维吾尔词书写粘连和手写笔画漂移等问题,提出一种基于多信息融合路径寻优的字符分割算法。利用笔画提取、切分和聚类,过分割单词图像得到主体和附加字段,通过字段模糊匹配获得鲁棒的字根序列描述,以抑制笔画漂移造成的干扰;由建立的匹配位置高斯模型来估算字段匹配信息,经对单字分类器输出进行置信度转换,从而得到字符识别信息,再运用数据统计获取单词语义信息;由构建的字符序列二阶Markov语言模型,基于Bayes准则,提出了单词后验概率的多信息加权融合计算方法,通过字段匹配及字根合并的路径寻优,可得到最佳字符分割结果。在手写维文样本库上的实验表明,所提算法能有效提升字符分割的准确率和稳定性。 许亚美 卢朝阳 李静 姚超关键词:信息处理技术 字符分割 维吾尔语 基于角点类别特征和边缘幅值方向梯度直方图统计特征的复杂场景文字定位算法 被引量:4 2013年 针对复杂场景中纹理丰富的非文字区对文字定位算法的干扰,提出了基于光度不变量的角点类别特征和边缘幅值方向梯度直方图(Histogram of oriented gradients of edge magnitude,HOG-EM)统计特征两种新特征,并据此设计了一种两级多层复杂场景文字定位算法。首先获取边缘图像并提取根据HSL颜色空间特性划分的8层二值化图像,将其组成9层子图并做连通域分析提取文字候选区。然后提取文字候选区的角点类别特征和HOG-EM统计特征,将二者分别用于剔除非文字候选区和获取文字。实验表明:本文算法可以较为准确地剔除纹理丰富的非文字区,有效地降低复杂场景文字定位算法的虚警率,取得比较理想的准确率和召回率。 姜维 卢朝阳 李静 刘晓佩关键词:文字定位 方向梯度直方图 多部件自适应融合的手写体阿拉伯字符识别 被引量:4 2012年 针对手写阿拉伯文100类变体字符中相似字多、书写粘连等识别难点,提出一种基于部件分解和自适应融合的识别算法.首先,根据结构规则建立字符的部件模型,将字符分解为主体、附加和点三类部件,并结合连笔分析获得较鲁棒性的部件描述;然后,针对各类部件的不同特点设计相应的特征抽取和分类器,通过部件匹配来检测和辨识相似字间的微小差异;最后,利用并改进D-S证据理论对多个部件进行融合,通过分析部件的匹配度分布建立一种实时的融合权重计算方法,并基于所得权重提出证据的折扣方案,从而实现自适应融合,以提升字符识别效果.实验证明该算法较现有经典算法在识别率和稳定性方面均有明显提高. 许亚美 卢朝阳 李静关键词:阿拉伯语 信息融合 自适应 证据理论 部件字典结合时分方向特征的手写维吾尔字符识别 被引量:3 2013年 针对联机手写维吾尔128类变体字符,提出了一种基于部件字典和时分方向特征的识别算法。该算法首先结合连笔分析,将字符分解为主体、附加和点三类部件,建立手写维吾尔字符的部件字典,有效解决联机手写维吾尔字符的笔顺连笔自由问题;然后,为减轻手写字符拓扑变形造成的干扰,对单个部件提取一种新的联机特征-时分方向特征,该特征在模糊域提取方向链码然后按时序划分统计,并通过检测和调整短时变动进行抖动校正;最后,设计不同分类器对各部件进行匹配,利用匹配测度分布估计各部件权重,并通过加权朴素贝叶斯融合得到字符识别结果。实验结果表明,该算法能有效地识别128类无约束手写维吾尔字符,在包含13 056个样本的手写体维吾尔字符数据库上的平均识别率为93.15%。 许亚美 卢朝阳 李静关键词:手写字符识别 维吾尔语 朴素贝叶斯