您的位置: 专家智库 > >

刘东生

作品数:3 被引量:16H指数:1
供职机构:沈阳航空工业学院更多>>
发文基金:辽宁省教育厅高等学校科学研究项目国家自然科学基金更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 2篇会议论文
  • 1篇期刊文章

领域

  • 3篇自动化与计算...
  • 1篇文化科学

主题

  • 3篇上下文
  • 3篇上下文信息
  • 3篇中文
  • 3篇中文分词
  • 3篇中文分词技术
  • 3篇分词
  • 3篇分词技术
  • 1篇信息处理
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇计算机
  • 1篇计算机应用

机构

  • 3篇沈阳航空工业...

作者

  • 3篇刘东生
  • 3篇徐立军
  • 3篇尹宝生
  • 3篇张桂平
  • 3篇苗雪雷

传媒

  • 1篇中文信息学报
  • 1篇第五届全国信...
  • 1篇第五届全国信...

年份

  • 1篇2010
  • 2篇2009
3 条 记 录,以下是 1-3
排序方式:
面向专利文献的中文分词技术的研究
针对专利文献的特点,本文提出了一种基于统计和规则相结合的多策略分词方法。该方法利用文献中潜在的切分标记,结合切分文本的上下文信息进行最大概率分词,并利用术语前后缀规律进行后处理。该方法充分利用了从大规模语料中获取的全局信...
刘东生尹宝生张桂平徐立军苗雪雷
关键词:中文分词上下文信息
文献传递
面向专利文献的中文分词技术的研究
针对专利文献的特点,本文提出了一种基于统计和规则相结合的多策略分词方法。该方法利用文献中潜在的切分标记,结合切分文本的上下文信息进行最大概率分词,并利用术语前后缀规律进行后处理。该方法充分利用了从大规模语料中获取的全局信...
刘东生尹宝生张桂平徐立军苗雪雷
关键词:中文分词技术上下文信息
文献传递
面向专利文献的中文分词技术的研究被引量:16
2010年
针对专利文献的特点,该文提出了一种基于统计和规则相结合的多策略分词方法。该方法利用文献中潜在的切分标记,结合切分文本的上下文信息进行最大概率分词,并利用术语前后缀规律进行后处理。该方法充分利用了从大规模语料中获取的全局信息和切分文本的上下文信息,有效地解决了专利分词中未登录词难以识别问题。实验结果表明,该文方法在封闭和开放测试下分别取得了较好的结果,对未登录词的识别也有很好的效果。
张桂平刘东生尹宝生徐立军苗雪雷
关键词:计算机应用中文信息处理中文分词上下文信息
共1页<1>
聚类工具0