何晓明
- 作品数:2 被引量:2H指数:1
- 供职机构:福建师范大学更多>>
- 发文基金:福建省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于n-gram中英文字符串分割算法实现被引量:2
- 2012年
- 相似字符串的模糊查询是信息检索的重要组成部分,一直是人们研究的热点。目前基于关键词的查询技术都是前缀匹配,无法查找到与搜索字符串相似的结果。该文提出一种基于n-gram的中英文字符串分割技术的算法,该技术主要是对字符串进行中英文识别,然后基于n-gram按照指定长度进行分割,该技术是实现基于关键词的模糊查询技术的基础。该技术在数据清洗以及学位论文TMLC系统和垃圾邮件过滤等方面也有重要的应用前景。
- 何晓明洪亲蔡坚勇林鸿
- 关键词:模糊查询N-GRAM数据挖掘
- 一种改进型字符串相似连接算法的研究
- 进入二十一世纪,信息技术的快速发展,计算机的普及,互联网的广泛应用,全球信息共享日益加大,信息量爆炸式的增长。在大量的信息面前,如何准确地、快速地找到我们需要的信息。这一直是计算机科学研究的热点问题。字符串的相似连接技术...
- 何晓明
- 关键词:倒排索引
- 文献传递