安娜
- 作品数:4 被引量:9H指数:1
- 供职机构:北京广播学院文学院应用语言学系更多>>
- 发文基金:国家广电总局部级社科研究项目更多>>
- 相关领域:语言文字自动化与计算机技术更多>>
- 基于语料库的英汉熟语标注研究
- 熟语是自然语言中存在的普遍现象,所有的语料库在标注阶段都要处理熟语。为了把熟语问题处理好,本文以英汉熟语为例,在英汉熟语对比研究的基础上,介绍并分析了国内外现有语料库对英汉熟语的标注方式,发现并解决了一些汉语熟语在词性标...
- 安娜
- 关键词:语料库熟语词性标注语义标注
- 文献传递
- 语料库中熟语的标记问题被引量:9
- 2004年
- 熟语是自然语言中普遍存在的语言现象。本文分析了国内现有语料库对熟语的标注方式 ,发现这种方式对语料库的进一步加工是有问题的。为了在语料库标注阶段把熟语问题处理好 ,本文从信息处理的角度将熟语中的成语、惯用语、歇后语、习用语、专门语以及缩略语归为固定语的范畴 ,进而提出根据固定语的语法功能给定词性标记 ,再根据它们的词汇特征给定词汇范畴标记的双层标记法 ,这样在一定程度上解决了熟语的语料库标注问题。
- 安娜刘海涛侯敏
- 关键词:人工智能自然语言处理熟语固定语语料库
- 语料库中熟语的标记问题
- 一引言在建设传媒语言语料库的过程中,我们根据对语料库加工的通行做法,先对原始语料作词性标注。词性标注之后,当我们开始进行句法层次的加工时,发现目前的熟语标记存在一定的问题。我们在对生语料做词性标注时,采用的是北京大学计算...
- 安娜刘海涛侯敏
- 文献传递
- 语料库中熟语的标记问题
- 本文对语料库中熟语的标记问题进行了探讨。文章围绕熟语的本质与信息处理用“语”的要求、固定语的标注等进行了阐述。
- 安娜刘海涛侯敏
- 关键词:汉语语言语言文字语言标记
- 文献传递