您的位置: 专家智库 > >

刘盈盈

作品数:3 被引量:17H指数:3
供职机构:北京理工大学信息与电子学院更多>>
发文基金:国家242信息安全计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...

主题

  • 2篇语料
  • 2篇语料库
  • 2篇语言处理
  • 2篇语义标注
  • 2篇自然语言
  • 2篇自然语言处理
  • 2篇BF
  • 2篇CTC
  • 2篇标注语料库
  • 1篇信息处理
  • 1篇义学
  • 1篇语义
  • 1篇语义分析
  • 1篇语义学
  • 1篇提问
  • 1篇中文
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇句义
  • 1篇汉语

机构

  • 3篇北京理工大学

作者

  • 3篇罗森林
  • 3篇冯扬
  • 3篇韩磊
  • 3篇刘盈盈
  • 2篇陈功
  • 2篇王倩
  • 1篇潘丽敏

传媒

  • 2篇北京理工大学...
  • 1篇中文信息学报

年份

  • 2篇2013
  • 1篇2012
3 条 记 录,以下是 1-3
排序方式:
BFS-CTC汉语句义结构标注语料库被引量:5
2013年
句义结构分析是汉语语义分析中不可逾越的重要环节,为了满足汉语句义结构分析的需要,基于现代汉语语义学理论构建了一种层次化的汉语句义结构模型,定义了标注规范和标记形式,建设了一个汉语句义结构标注语料库BFS-CTC(Beijing Forest Studio-Chinese Tagged Corpus)。标注内容方面,基于句义结构模型的定义标注了句义结构句型层、描述层、对象层和细节层中所包含的各个要素及其组合关系,包括句义类型、谓词及其时态、语义格类型等信息,并且提供了词法和短语结构句法信息,便于词法、句法、句义的对照分析研究;语料库组织结构方面,该语料库包括四个部分,即原始句子库、词法标注库、句法标注库和句义结构标注库,可根据研究的需要,在词法、句法、句义结构标注的基础上进行深加工,在核心标注库的基础上添加更多具有针对性的扩展标注库,利用句子的唯一ID号进行识别和使用;语料来源和规模方面,语料全部来自新闻语料,经过人工收集、整理,合理覆盖了主谓句、非主谓句、把字句等六种主要句式类型,规模已达到10 000句。同其他语义标注库相比,BFS-CTC基于现代汉语语义学,提供了多层次的句义结构标注信息,兼容进行了词法和语法标注,各类标注既可以单独使用也可综合使用进行横向分析,可用于自然语言处理多方面的研究,进一步推动汉语语义分析的研究和发展。
刘盈盈罗森林冯扬韩磊陈功王倩
关键词:自然语言处理语义标注语料库
汉语句义结构模型及其验证被引量:10
2013年
为解决计算机理解和表达汉语句义的问题,以现代汉语语义学理论为基础,探索和创建了一种计算机可计算、可扩展的汉语句义结构模型,该模型从句义层次上描述构成句子的词、子句、分句在句义中承担的句义任务,句子描述对象的时空特征、谓词的时态以及不同句义成分之间的组合关系等,形成了一种抽象句义的结构化表达形式;同时,提出了一种基于反向提问的句义结构模型验证方法,用疑问词替换语义格迭代构成问句,再对问句进行评价.实验结果表明,对简单句义、复杂句义和多重句义的反向提问正确率达到92.07%,充分说明句义结构模型的合理性.
罗森林韩磊潘丽敏冯扬刘盈盈
关键词:语义分析自然语言处理
BFS-CTC汉语句义结构标注语料库构建方法被引量:10
2012年
根据现代汉语语义学,构建了一种层次化的句义结构模型.基于该模型构建了汉语句义结构标注语料库(Beijing forest studio-Chinese tagged corpus,BFS-CTC).利用自行开发的标注和管理工具,对模型中各个句义成分及其组合关系进行快速标注,降低培训工作量和标注成本.BFS-CTC涵盖了6种句式类型,约1万句,提供了符合现有规范的词法和句法标注信息与自定义规范的句义结构标注信息,便于词法、句法和句义的对照分析研究,以及语料的综合使用和横向分析.此外,BFS-CTC还具有较强的可扩展性,可在核心标注库基础上扩展生成其它扩展库和标注资源.
罗森林刘盈盈冯扬韩磊陈功王倩
关键词:中文信息处理语义标注语料库
共1页<1>
聚类工具0