您的位置: 专家智库 > >

陈贞

作品数:1 被引量:1H指数:1
供职机构:重庆大学计算机学院更多>>
发文基金:重庆市自然科学基金中央高校基本科研业务费专项资金中国博士后科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇知识管理
  • 1篇中文
  • 1篇中文分词
  • 1篇中文分词算法
  • 1篇自适
  • 1篇自适应
  • 1篇自适应算法
  • 1篇文本
  • 1篇文本处理
  • 1篇分词
  • 1篇分词算法

机构

  • 1篇重庆大学

作者

  • 1篇冯永
  • 1篇陈显勇
  • 1篇贺迅
  • 1篇陈贞
  • 1篇唐黎

传媒

  • 1篇重庆大学学报...

年份

  • 1篇2010
1 条 记 录,以下是 1-1
排序方式:
面向文本知识管理的自适应中文分词算法被引量:1
2010年
针对传统字典匹配分词法在识别新词和特殊词处理方面的不足,结合2元统计模型提出了面向文本知识管理的自适应中文分词算法——SACWSA。SACWSA在预处理阶段结合应用有限状态机理论、基于连词的分隔方法和分治策略对输入文本进行子句划分,从而有效降低了分词算法的复杂度;在分词阶段应用2元统计模型,结合局部概率和全局概率,完成子句的切分,从而有效地提升了新词的识别率并消除了歧义;在后处理阶段,通过建立词性搭配规则来进一步消除2元分词结果的歧义。SACWSA主要的特色在于利用'分而治之'的思想来处理长句和长词,用局部概率与全局概率相结合来识别生词和消歧。通过在不同领域语料库的实验表明,SACWSA能准确、高效地自动适应不同行业领域的文本知识管理要求。
冯永贺迅唐黎陈显勇陈贞
关键词:知识管理文本处理自适应算法
共1页<1>
聚类工具0