国家自然科学基金(61273320)
- 作品数:11 被引量:59H指数:5
- 相关作者:周国栋李艳翠冯文贺孙静赵京胜更多>>
- 相关机构:河南科技学院苏州大学青岛理工大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划教育部人文社会科学研究基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 基于有监督学习方法的多文档文本情感摘要被引量:3
- 2014年
- 该文研究有监督学习方法在多文档文本情感摘要中的应用。利用从亚马逊中文网和亚马逊英文网上收集的产品评论语料,抽取文本内特征、PageRank特征、情感特征和评论质量特征,基于有监督方法进行多文档文本情感摘要抽取。实验结果表明有监督学习方法比无监督学习方法在ROUGE值上有显著的提高,情感特征和评论质量特征均有助于文本情感摘要。
- 李艳翠林莉媛周国栋
- 关键词:情感特征有监督学习最大熵分类器
- 汉语篇章连接词识别与分类被引量:7
- 2015年
- 基于自建的汉语篇章结构语料库以及语料库中连接词和连接词关系类别的标注,抽取自动句法树和标准句法树的句法、词法和位置特征,利用有监督的方法进行连接词识别和分类。实验结果表明,连接词识别的F1值为69.2%,连接词自动识别并分类的总正确率为89.1%。
- 李艳翠孙静周国栋
- 关键词:汉语篇章
- Personal summarization from profile networks
- 2017年
- Zhongqing WANGShoushan LIGuodong ZHOU
- 汉英篇章结构平行语料库的对齐标注研究被引量:7
- 2013年
- 篇章结构平行语料库是对具有对译关系的双语文本标注了平行篇章结构信息的语料库。对齐标注是汉英篇章结构平行语料库的核心理论基础。该文提出"结构对齐,关系对齐"的对齐标注策略,应用于切分对齐、层次结构对齐、关系对齐、中心对齐等环节,实现了对齐和标注并行、单位对齐和结构对齐共进的平行语料库工作模式。本策略辅之以相应标注平台和工作程序以及相应难点解决方案,被证明是一种高效的篇章结构平行语料库工作方式。
- 冯文贺
- 关键词:平行语料库篇章结构
- 汉语隐式篇章关系识别被引量:14
- 2014年
- 采用一个自建的汉语篇章结构语料库(隐式关系占80%)进行隐式关系识别。语料中将篇章关系分成3个层次,第一层包含因果、并列、转折、解说四大类。在此语料上,利用上下文特征、词汇特征、依存树特征,采用最大熵的分类方法对四大类关系进行识别。实验结果显示,总正确率为62.15%,其中并列类识别效果最好,F1值达到75.26%。
- 孙静李艳翠周国栋冯文贺
- 关键词:篇章结构分析
- 基于清华汉语树库的复句关系词识别与分类研究被引量:18
- 2014年
- 根据清华汉语树库的标注方法,利用规则从中提取复句关系词并标注其类别,然后分别抽取带功能标记和不带功能标记的自动句法树的句法、词法、位置特征,进行复句关系词的识别和分类。实验结果表明,复句关系词判断准确率达95.7%,复句关系词类别判断F1值为77.2%。
- 李艳翠孙静周国栋冯文贺
- 添加冒号和分号分类标签特征的汉语逗号分类被引量:2
- 2014年
- 标点分析在句子和篇章分析中有重要作用,其中逗号的功能分类是标点分析的重点和难点。该文研究添加冒号和分号分类标签为特征的逗号自动分类。首先给出逗号、冒号和分号的分类方法;然后介绍基于此分类方法的逗号、冒号和分号标点分类语料库;最后分别考察添加冒号类别标签、分号类别标签以及同时添加冒号和分号类别标签为特征的逗号分类结果。实验结果表明,三种情况下的逗号分类正确率均有不同程度的提高。
- 李艳翠谷晶晶周国栋
- 关键词:篇章分析
- 中文文学作品中的社会网络抽取与分析被引量:14
- 2017年
- 应用自然语言处理技术和复杂网络技术,可以对中文文学作品中内含的社会网络进行抽取和分析。该文以《三国演义》为例,抽取了其中的社会网络,节点是作品中的人物,边是人物之间的联系,边的权重为各章回中的人物共现次数。借助背景知识和互联网构建了角色库辅助网络建模。对构建出来的社会网络进行分析,包括节点度分布、中心性、聚类特征等。结果表明,中文文学作品中的角色分布具有明显的小世界性、有限幂律分布特征和社区特性,同时也有多面性和多元性。
- 赵京胜张丽朱巧明周国栋
- 关键词:文学作品社会网络自然语言处理
- 基于语料库的动态词群建构
- 2014年
- 提出一个以大规模语料库为资源提取材料,以词汇集为语义成分表达方式的动态词群建构方法,其维度特征值的提取不但具有客观性,而且操作简易。维度特征值用词汇集的方式表示特征取值范围,可以避免传统的义素概括性过强、词汇个性表现不足的缺陷。这种方法有利于面向应用的大规模动态词群的建构。
- 冯文贺
- 关键词:词群词义特征结构
- 含情绪词文本的情绪识别方法研究
- 情绪识别是情绪分析研究中的一项基本任务,旨在对文本表达的情绪类型(例如:高兴、伤心等)进行识别。已有的研究一般借助于文本中包含的情绪关键词或利用构建的情绪词典进行情绪识别和类别判断。然而,我们分析语料发现,文本中情绪词在...
- 李逸薇刘欢欢李寿山黄居仁
- 关键词:情绪识别语言学特征
- 文献传递