国家自然科学基金(61105049)
- 作品数:2 被引量:5H指数:2
- 相关作者:黄亚楼刘杰王扬谢茂强廖振更多>>
- 相关机构:南开大学更多>>
- 发文基金:中央高校基本科研业务费专项资金国家教育部博士点基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于半监督CRF的缩略词扩展解释识别被引量:2
- 2013年
- 缩略词拓展解释识别任务中标注样本较少,无法从中总结出全面的规则或采用有监督的学习方法来学习。为此,提出一种基于半监督条件随机场(CRF)的缩略词扩展解释识别模型,利用广泛的未标注样本和较少的标注样本寻找序列文本中恰当的语句,以解释给定的缩略词。使用较少的标注序列样本训练一个全监督CRF模型,针对未标注序列样本,采用最小序列熵学习样本之间的联系,结合标注样本和未标注样本,利用半监督自学习方法学习两者的关系。实验结果表明,该模型的序列F1值达到84.73%,高于支持向量机和全监督CRF基准算法。
- 陈季梦刘杰黄亚楼刘天笔刘才华
- 关键词:条件随机场序列熵
- 代价敏感的列表排序算法被引量:3
- 2012年
- 排序学习是信息检索与机器学习中的研究热点之一.在信息检索中,预测排序列表中顶部排序非常重要.但是,排序学习中一类经典的排序算法——列表排序算法——无法强调预测排序列表中顶部排序.为了解决此问题,将代价敏感学习的思想融入到列表排序算法中,提出代价敏感的列表排序算法框架.该框架是在列表排序算法的损失函数中对文档引入权重,且基于性能评价指标NDCG计算文档的权重.在此基础之上,进一步证明了代价敏感的列表排序算法的损失函数是NDCG损失的上界.为了验证代价敏感的列表排序算法的有效性,在此框架下提出了一种代价敏感的ListMLE排序算法,并对该算法开展序保持与泛化性的理论研究工作,从理论上验证了该算法具有序保持特性.在基准数据集上的实验结果表明,在预测排序列表中顶部排序中,代价敏感的ListMLE比传统排序学习算法能取得更好的性能.
- 卢敏黄亚楼谢茂强王扬刘杰廖振