您的位置: 专家智库 > >

辽宁省教育厅高等学校科学研究项目(2007T139)

作品数:1 被引量:17H指数:1
相关作者:苗雪雷张桂平尹宝生徐立军刘东生更多>>
相关机构:沈阳航空工业学院更多>>
发文基金:辽宁省教育厅高等学校科学研究项目国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇信息处理
  • 1篇上下文
  • 1篇上下文信息
  • 1篇中文
  • 1篇中文分词
  • 1篇中文分词技术
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇计算机
  • 1篇计算机应用
  • 1篇分词
  • 1篇分词技术

机构

  • 1篇沈阳航空工业...

作者

  • 1篇刘东生
  • 1篇徐立军
  • 1篇尹宝生
  • 1篇张桂平
  • 1篇苗雪雷

传媒

  • 1篇中文信息学报

年份

  • 1篇2010
1 条 记 录,以下是 1-1
排序方式:
面向专利文献的中文分词技术的研究被引量:17
2010年
针对专利文献的特点,该文提出了一种基于统计和规则相结合的多策略分词方法。该方法利用文献中潜在的切分标记,结合切分文本的上下文信息进行最大概率分词,并利用术语前后缀规律进行后处理。该方法充分利用了从大规模语料中获取的全局信息和切分文本的上下文信息,有效地解决了专利分词中未登录词难以识别问题。实验结果表明,该文方法在封闭和开放测试下分别取得了较好的结果,对未登录词的识别也有很好的效果。
张桂平刘东生尹宝生徐立军苗雪雷
关键词:计算机应用中文信息处理中文分词上下文信息
共1页<1>
聚类工具0