国家教育部博士点基金(20100042110031)
- 作品数:4 被引量:32H指数:2
- 相关作者:王会珍朱靖波王锦张俐姚树杰更多>>
- 相关机构:东北大学教育部更多>>
- 发文基金:中央高校基本科研业务费专项资金国家教育部博士点基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于维基百科类别的文本特征表示被引量:17
- 2011年
- 该文提出了基于维基百科类别体系的文本特征表示方法,方法是将文本中的词映射到维基百科的类别体系中,使用类别作为特征来对文本进行表示。基于维基类别的文本特征表示方法可以增强文本特征表示能力,降低文本特征空间维数。针对维基百科条目在语料中覆盖度不足的问题,该文提出了一种基于全局信息自学习维基百科类别的方法。该文构造基于维基百科类别为文本表示的分类系统,实验结果证明,基于维基百科类别作为文本表示特征,相对于词袋模型,具有明显的降维效果,在当特征数量较少时(如:<700),分类的F1值提高了5.14%。
- 王锦王会珍张俐
- 关键词:文本分类文本表示
- 基于句对质量和覆盖度的统计机器翻译训练语料选取被引量:12
- 2011年
- 该文研究的目的是在待翻译文本未知的情况下,从已有的大规模平行语料中选取一个高质量的子集作为统计机器翻译系统的训练语料,以降低训练和解码代价。该文综合覆盖度和句对翻译质量两方面因素,提出一种从已有平行语料中获取高质量小规模训练子集的方法。在CWMT2008汉英翻译任务上的实验结果表明,利用本文的方法能够从现有大规模语料中选取高质量的子集,在减少80%训练语料的情况下达到与Baseline系统(使用全部训练语料)相当的翻译性能(BLEU值)。
- 姚树杰肖桐朱靖波
- 关键词:覆盖度统计机器翻译
- 面向移进-归约句法分析器的单模型系统融合算法
- 本文提出了一种面向移进-归约句法分析器的单模型系统融合算法。在训练阶段,该方法通过调整训练数据的分布,来构建用于融合的多个移进-归约句法分析器。在解码阶段,该方法首先使用各个移进-归约句法分析器对待分析的句子进行句法分析...
- 马骥朱慕华肖桐朱靖波
- 关键词:句法分析
- 文献传递
- 部分监督的音乐情感分类
- 基于歌词的音乐情感分析可以看作一个分类问题。为了获得较高的性能,情感分类通常需要人工标注一定规模的数据以便训练分类模型。然而人工构建数据需要以大量的时间和精力为代价。本文以二类情感分类为例,研究在没有负类数据的情况(即只...
- 王静朱慕华胡明涵
- 文献传递
- CWMT2011东北大学参评系统NiuTrans介绍(英文)
- 本文介绍了东北大学自然语言处理实验室(NEUNLPLab)开发的NiuTrans机器翻译系统参加第七届全国机器翻译研讨会(CWMT2011)机器翻译评测任务的情况.在本次评测中,NEUNLPLab在所有九项翻译子任务中均...
- 肖桐张浩李强路琦朱靖波任飞亮王会珍
- 关键词:自然语言处理统计机器翻译
- 文献传递
- 基于反向转录语法的机器翻译混合解码策略
- Cocke-Younger-Kasami(CYK)解码算法和移进-归约解码算法是基于反向转录语法(ITGs)的统计机器翻译系统通常采用的两种解码算法。它们在翻译准确率和解码速度方面各有不同的优劣势。例如,基于CYK解码算...
- 张浩肖桐朱靖波
- 关键词:统计机器翻译解码算法
- 文献传递
- 向上学习方法改进移进-归约中文句法分析被引量:2
- 2015年
- 基于移进-归约的句法分析系统具有线性的时间复杂度,因此在大规模句法分析任务中具有特别实际的意义。然而目前移进-归约句法分析系统的性能远低于领域内最好的句法分析器,例如,伯克利句法分析器。该文研究如何利用向上学习和无标注数据改进移进-归约句法分析系统,使之尽可能接近伯克利句法分析器的性能。我们首先应用伯克利句法分析器对大规模的无标注数据进行自动分析,然后利用得到的自动标注数据作为额外的训练数据改进词性标注系统和移进-归约句法分析器。实验结果表明,向上学习方法和无标注数据使移进-归约句法分析的性能提高了2.3%,达到82.4%。这个性能与伯克利句法分析器的性能可比。与此同时,该文最终得到的句法分析系统拥有明显的速度优势(7倍速度于伯克利句法分析器)。
- 朱慕华王会珍朱靖波
- 多维度等级评分模型优化技术被引量:1
- 2013年
- 研究了多维度等级评分模型的训练学习优化技术.为了解决不同用户之间的评分标注所存在的不一致性,提出两种简单、有效的模型训练优化技术,包括基于容忍度的样本选择方法和基于排序损失的样本选择方法.另外,为了充分利用不同特征的用户评分标注之间的相关性,提出了一个面向属性的协同过滤技术以改善多维度等级评分模型.在两个公开的英语和汉语真实餐馆评论数据集上进行实验验证,实验结果表明,所提出的方法有效地改善了等级评分的性能.
- 王会珍朱靖波
- 关键词:情感分析协同过滤