您的位置: 专家智库 > >

安娜

作品数:4 被引量:9H指数:1
供职机构:北京广播学院文学院应用语言学系更多>>
发文基金:国家广电总局部级社科研究项目更多>>
相关领域:语言文字自动化与计算机技术更多>>

文献类型

  • 3篇会议论文
  • 1篇期刊文章

领域

  • 3篇语言文字
  • 1篇自动化与计算...

主题

  • 4篇语料
  • 4篇语料库
  • 4篇熟语
  • 1篇定语
  • 1篇英汉
  • 1篇语言
  • 1篇语言标记
  • 1篇语言处理
  • 1篇语言文字
  • 1篇语义标注
  • 1篇人工智能
  • 1篇自然语言
  • 1篇自然语言处理
  • 1篇文字
  • 1篇基于语料
  • 1篇基于语料库
  • 1篇固定语
  • 1篇汉语
  • 1篇汉语语言
  • 1篇词性

机构

  • 4篇北京广播学院

作者

  • 4篇安娜
  • 3篇侯敏
  • 3篇刘海涛

传媒

  • 1篇中文信息学报
  • 1篇第三届全国语...
  • 1篇第三届全国语...

年份

  • 3篇2004
  • 1篇2003
4 条 记 录,以下是 1-4
排序方式:
基于语料库的英汉熟语标注研究
熟语是自然语言中存在的普遍现象,所有的语料库在标注阶段都要处理熟语。为了把熟语问题处理好,本文以英汉熟语为例,在英汉熟语对比研究的基础上,介绍并分析了国内外现有语料库对英汉熟语的标注方式,发现并解决了一些汉语熟语在词性标...
安娜
关键词:语料库熟语词性标注语义标注
文献传递
语料库中熟语的标记问题被引量:9
2004年
熟语是自然语言中普遍存在的语言现象。本文分析了国内现有语料库对熟语的标注方式 ,发现这种方式对语料库的进一步加工是有问题的。为了在语料库标注阶段把熟语问题处理好 ,本文从信息处理的角度将熟语中的成语、惯用语、歇后语、习用语、专门语以及缩略语归为固定语的范畴 ,进而提出根据固定语的语法功能给定词性标记 ,再根据它们的词汇特征给定词汇范畴标记的双层标记法 ,这样在一定程度上解决了熟语的语料库标注问题。
安娜刘海涛侯敏
关键词:人工智能自然语言处理熟语固定语语料库
语料库中熟语的标记问题
一引言在建设传媒语言语料库的过程中,我们根据对语料库加工的通行做法,先对原始语料作词性标注。词性标注之后,当我们开始进行句法层次的加工时,发现目前的熟语标记存在一定的问题。我们在对生语料做词性标注时,采用的是北京大学计算...
安娜刘海涛侯敏
文献传递
语料库中熟语的标记问题
本文对语料库中熟语的标记问题进行了探讨。文章围绕熟语的本质与信息处理用“语”的要求、固定语的标注等进行了阐述。
安娜刘海涛侯敏
关键词:汉语语言语言文字语言标记
文献传递
共1页<1>
聚类工具0