安徽省教育厅重点科研项目(2006kj013A)
- 作品数:2 被引量:4H指数:1
- 相关作者:吴建国刘政怡李炜樊庆林更多>>
- 相关机构:安徽大学更多>>
- 发文基金:安徽省教育厅重点科研项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于交叉覆盖算法的中文分词被引量:4
- 2010年
- 中文分词是自然语言处理的前提和基础,利用分类效果较好的交叉覆盖算法实现中文分词。将中文分词想象成字的分类过程,把字放入向前向后相邻两个字这样一个语境下判断该字所属的类别,是自己独立,或是跟前一字结合,或是跟后一字结合,或是跟前后的字结合。对人民日报熟语料库进行训练,不需要词典,可以较好地解决中文分词中的交叉歧义问题,分词正确率达90.6%。
- 刘政怡吴建国李炜
- 关键词:中文分词交叉覆盖算法互信息
- 基于输入法的通用存储结构
- 2008年
- 输入法的实现具有递增解码的特性,因此设计一种存储结构来描述这种特性。随着用户的输入,插入对应的节点来构造整个空间,由遍历算法可无一遗漏的将所有的可能均记录下来,等待后期的处理,而当用户进行删除时,无需重构状态空间,只需删除对应的相关节点。整个空间随用户输入和删除操作不断变化,且变化均匀。该结构空间在手写笔画输入法、整句输入法、歧义音节切分等应用中体现出其描述问题状态空间的清晰性、解决问题的方便性和针对输入法领域的通用性。
- 刘政怡樊庆林吴建国李炜
- 关键词:输入法手写输入