您的位置: 专家智库 > >

曹自强

作品数:1 被引量:2H指数:1
供职机构:北京大学更多>>
发文基金:国家自然科学基金国家社会科学基金国家科技支撑计划更多>>
相关领域:自动化与计算机技术更多>>

合作作者

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇中文
  • 1篇息相
  • 1篇互信
  • 1篇互信息
  • 1篇分词

机构

  • 1篇北京大学

作者

  • 1篇李素建
  • 1篇曹自强

传媒

  • 1篇中文信息学报

年份

  • 1篇2013
1 条 记 录,以下是 1-1
排序方式:
HDP与互信息相结合的中文无指导分词被引量:2
2013年
该文探讨了无指导条件下的中文分词,这对构建语言无关的健壮分词系统大有裨益。互信息与HDP(Hierarchical Dirichlet Process)是无指导情况下常用的分词模型,该文将两者结合,并改进了采样算法。不考虑标点符号,在两份大小不同的测试语料上获得的F值为0.693与0.741,相比baseline的HDP分别提升了5.8%和3.9%。该文还用该模型进行了半指导分词,实验结果比常用的CRF有指导分词提升了2.6%。
曹自强李素建
关键词:互信息
共1页<1>
聚类工具0