您的位置: 专家智库 > >

李双龙

作品数:4 被引量:20H指数:1
供职机构:北京科技大学更多>>
发文基金:国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇会议论文
  • 1篇期刊文章
  • 1篇学位论文

领域

  • 3篇自动化与计算...

主题

  • 4篇汉语分词
  • 4篇分词
  • 2篇单字
  • 2篇登录
  • 2篇随机场
  • 2篇条件随机场
  • 2篇未登录词
  • 1篇语言模型
  • 1篇统计学
  • 1篇基于统计
  • 1篇分词系统
  • 1篇分词研究
  • 1篇感知
  • 1篇感知机

机构

  • 3篇北京科技大学
  • 3篇中国科学院

作者

  • 4篇李双龙
  • 1篇王成耀
  • 1篇刘群
  • 1篇刘乐中

传媒

  • 1篇微计算机信息
  • 1篇第二届全国信...

年份

  • 2篇2006
  • 2篇2005
4 条 记 录,以下是 1-4
排序方式:
利用单字碎片过滤改进汉语分词性能
对于一般的分词系统,由于数据稀疏而识别失败的未登录词往往被切分成单字串.这里将切分结果中连续的单字串称之为'单字碎片'.本文提出的一种碎片过滤方法的基本思想就是重新检测出单字碎片中识别失败的未登录词,并将此方法作为'后处...
李双龙刘乐中刘群
关键词:汉语分词未登录词分词系统
文献传递
利用单字碎片过滤改进汉语分词性能
对于一般的分词系统,由于数据稀疏而识别失败的未登录词往往被切分成单字串。这里将切分结果中连续的单字串称之为“单字碎片”。本文提出的一种碎片过滤方法的基本思想就是重新检测出单字碎片中识别失败的未登录词,并将此方法作为“后处...
李双龙刘乐中刘群
关键词:汉语分词未登录词
文献传递
基于条件随机场的汉语分词系统被引量:20
2006年
汉语分词是自然语言处理的首要的基本工作。本文提出了一个基于条件随机场(简称CRF)的汉语分词模型,CRF模型作为一个判别模型,可以容纳任意的非独立的特征信息。我们首先将分词看作是一个标记的过程,然后利用CRF模型对每个汉字进行标记,最后转换为相应的分词结果。系统采用感知机(Perceptron)算法进行参数训练。跟以前利用CRF进行分词的模型相比,本系统定义并使用了不同的特征函数,取得了更好的切分结果。在1st SIGHAN分词比赛PK测试集上封闭测试,F值为95.2%。
李双龙刘群王成耀
关键词:汉语分词条件随机场感知机
基于统计的汉语分词研究
李双龙
关键词:汉语分词统计学语言模型条件随机场
共1页<1>
聚类工具0