王树伟
- 作品数:1 被引量:17H指数:1
- 供职机构:哈尔滨工业大学深圳研究生院更多>>
- 发文基金:深圳市基础研究计划项目模式识别国家重点实验室开放课题基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 面向微博文本的情绪标注语料库构建被引量:17
- 2014年
- 文本情绪分析研究近年来发展迅速,但相关的中文情绪语料库,特别是面向微博文本的语料库构建尚不完善。为了对微博文本情绪表达特点进行分析以及对情绪分析算法性能进行评估,该文在对微博文本情绪表达特点进行深入观察和分析的基础上,设计了一套完整的情绪标注规范。遵循这一规范,首先对微博文本进行了微博级情绪标注,对微博是否包含情绪及有情绪微博所包含的情绪类别进行多标签标注。而后,对微博中的句子进行有无情绪及情绪类别进行标注,并标注了各情绪类别对应的强度。目前,已完成14 000条微博,45 431句子的情绪标注语料库构建。应用该语料库组织了NLP&CC2013中文微博情绪分析评测,有力地促进了微博情绪分析相关研究。
- 姚源林王树伟徐睿峰刘滨桂林陆勤王晓龙
- 关键词:语料库构建