国家自然科学基金(60873150)
- 作品数:7 被引量:76H指数:4
- 相关作者:周国栋王荣洋李寿山朱巧明孔芳更多>>
- 相关机构:苏州大学江苏省计算机信息处理技术重点实验室更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种改进的中文层次句法分析模型研究
- 首先提出了层次句法分析模型,该模型先对输入句子进行词性标注和基本组块识别,紧接着循环多次进行复杂组块识别直至得到根结点。该方法本质上属于一种基于移进-归约序列的句法分析模型,因此具有此类模型的各类优点;然后,本文分析了移...
- 李军辉周国栋朱巧明钱培德
- 文献传递
- 主题信息的中文多文档自动文摘系统被引量:5
- 2012年
- 多文档自动文摘能够帮助人们自动、快速地获取信息,使用主题模型构建多文档自动文摘系统是一种新的尝试,其中主题模型采用浅层狄利赫雷分配(LDA)。该模型是一个多层的产生式概率模型,能够检测文档中的主题分布。使用LDA为多文档集合建模,通过计算句子在不同主题上的概率分布之间的相似度作为句子的重要度,并根据句子重要度进行文摘句的抽取。实验结果表明,该方法所得到的文摘性能优于传统的文摘方法。
- 王红玲张明慧周国栋
- 关键词:中文自动文摘主题模型多文档
- 基于CRFs的评价对象抽取特征研究被引量:39
- 2012年
- 评价对象是情感分析中情感信息的一个重要组成部分。该文基于条件随机场模型,研究多种特征在评价对象抽取任务中的表现,并将特征归纳为词法、依存关系、相对位置、语义四大类别。其中,重点引入语义角色标注新特征。在实验中,我们在三个不同的数据集上考查了各个特征及其组合对系统性能的影响,作了详细地比较研究。另外,实验结果表明新提出的语义角色标注特征对评价对象抽取有很好地指示作用。
- 王荣洋鞠久朋李寿山周国栋
- 关键词:情感分析评价对象抽取语义角色标注
- 基于依存句法分析的中文语义角色标注
- 依存句法是句法分析的一种,相比于短语结构句法分析,依存句法具有更简洁的表达方式。本文采用英文语义角色标注的研究方法,实现了一个基于中文依存句法分析的语义角色标注系统。该系统针对中文依存关系树,采用有效的剪枝算法和特征,使...
- 王步康王红玲袁晓虹周国栋
- 关键词:语义角色标注最大熵分类器
- 文献传递
- 基于依存关系的中文名词性谓词语义角色标注研究被引量:2
- 2011年
- 语义角色标注是自然语言处理的一个重要研究内容,性能对机器翻译等研究有重大影响。实现了一个基于依存关系的中文名词性谓词语义角色标注平台,并对名词性谓词进行识别,使用最大熵分类模型在Chinese NomBank的转换语料上进行系统实验,对各种词法特征、结构特征及其组合进行了测试,标准语料上F1值达到78.09,基于自动句法树的语料上的F1值达到67.42。
- 袁晓虹王红玲王步康周国栋
- 关键词:语义角色标注
- 基于CRFs的评价对象抽取特征研究
- 评价对象是情感分析中情感信息的一个重要组成部分。本文基于条件随机场模型,研究多种特征在评价对象抽取任务中的表现,并将特征归纳为词法、依存关系、相对位置、语义等四大类别。其中,重点引入语义角色标注新特征。在实验中,我们在三...
- 王荣洋鞠久朋李寿山周国栋
- 关键词:情感分析评价对象抽取条件随机场语义角色标注
- 文献传递
- 基于依存关系的中文谓词标注研究
- 谓词标注是语义角色标注中的重要一步,它的性能直接影响到语义角色标注的性能。本文实现了一个基于依存关系的中文谓词分析平台,使用最大熵分类器在CoNLL’2008和CoNLL’2009评测数据上进行了系统实验,对各种词法、语...
- 袁晓虹王步康王红玲周国栋
- 关键词:语义角色标注最大熵分类器
- 文献传递
- 依存信息在蛋白质关系抽取中的作用
- 基于核函数的蛋白质关系(PPI)抽取可以捕获结构化句法信息,取得了较高的性能,但计算复杂度过高。本文结合词汇、句法信息,重点探讨了依存信息对基于特征向量的蛋白质关系(PPI)抽取的影响。研究表明,依存信息和基本短语块信息...
- 刘兵徐华钱龙华周国栋
- 关键词:支持向量机
- 文献传递
- 基于机器学习方法的英文事件代词消解研究被引量:2
- 2012年
- 与实体指代不同,事件指代因为其先行词候选是一个事件,与名词性的指代词具有完全不同的语义分类体系,因此适用于实体指代消歧的大多数特征都不能用于事件指代消歧。该文给出了一个基于机器学习方法的事件代词指代消歧平台,详细介绍了平台的实例生成和特征选择过程,并给出了平台在OntoNotes3.0语料上的事件代词指代消歧的结果,对结果进行了分析。从实验结果可以看到,给出的平台获得了较好的系统性能。
- 张宁孔芳李培峰周国栋朱巧明
- 关键词:机器学习方法
- 中英文指代消解中待消解项识别的研究被引量:15
- 2012年
- 深入研究了中英文指代消解中的待消解项识别问题.在前人工作的基础上,首先使用规则方法识别与上下文无关或具有显著固定模式的非待消解项;针对与上下文相关的非待消解项识别,从平面特征方法和结构化树核函数方法两方面入手进行了探索;利用复合核函数将平面特征和结构化特征有效结合,对待消解识别问题进行了进一步研究.在ACE2003英文语料和ACE2005中文语料上的实验结果表明,提出的多种待消解项识别方案各具特色,都取得了不错的性能.最后将得到的待消解项识别模块应用于中英文的指代消解任务.实验结果表明,合适的待消解项识别能够大大提高中英文指代消解的性能.
- 孔芳朱巧明周国栋