蔡李
- 作品数:3 被引量:3H指数:1
- 供职机构:中国科学院研究生院更多>>
- 发文基金:新疆维吾尔自治区重大科技专项新疆维吾尔自治区自然科学基金电子信息产业发展基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 维哈柯文字库标准符合性检测
- 2011年
- 依据维哈柯文信息技术标准和True Type字库文件规格说明书,确定了维哈柯文字库标准符合性检测的内容,提出了维哈柯文字库标准符合性检测方案,研发了相应的工具软件,实现了检测的自动化。实验结果表明本文的研究思路能较好地解决维哈柯文字库标准符合性检测问题。
- 单艳蔡李董军李晓
- 关键词:TTF标准符合性
- 维吾尔文网页正文抽取系统的研究与实现被引量:3
- 2012年
- 从构建大规模维吾尔文语料库的角度出发,归纳总结各类网页正文抽取技术,提出一种基于文本句长特征的网页正文抽取方法。该方法定义一系列过滤和替换规则对网页源码进行预处理,根据文本句长特征来判断文本段是否为网页正文。整个处理过程不依赖DOM树型结构,克服了基于DOM树结构进行正文抽取方法的性能缺陷。实验结果表明,对于维文各类型的网页正文提取,该方法均具有较高的准确度度和较好通用性。
- 蔡李单艳薛化建苏国平
- 关键词:维吾尔文语料库WEB文本挖掘
- 维哈柯文字库标准符合性检测研究
- 2012年
- 在调查和分析维哈柯文字库存在问题的基础上,依据国家制定的维哈柯文字符集标准与字形标准,明确了维哈柯文字库标准符合性检测的含义与内容,结合对TrueType字形技术,TrueType字库文件基本构成的详细研究,提出了完整的维哈柯文字库标准符合性检测的方案与算法,并实现了维哈柯文字库标准符合性检测工具的开发。实验结果表明检测方案完整、可行,能较好地解决维哈柯文字库标准符合性检测问题,对其它文字的字库标准符合性检测也具有一定的借鉴意义。
- 单艳蔡李董军李晓
- 关键词:信息处理TRUETYPE字库标准符合性