山东省科技发展计划项目(2012GGB01194)
- 作品数:2 被引量:9H指数:2
- 相关作者:费绍栋刘培玉张朕杜文韬杨玉珍更多>>
- 相关机构:山东财经大学山东师范大学山东省分布式计算机软件新技术重点实验室更多>>
- 发文基金:山东省科技发展计划项目山东省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于关联特征词表的中文比较句识别被引量:5
- 2013年
- 中文比较句研究多集中于语言学领域,然而利用机器学习的方法识别比较句的研究才刚刚起步。根据关联规则挖掘算法的基本原理提出一种基于关联特征词表的比较句识别方法,该方法将词和词性作为一个基本元素,定义特征词表中核心词和依存词之间的关联方式,利用支持向量机(SVM)分类器进行比较句的识别。实验结果表明,该方法能够有效地识别出中文比较句,在准确率、召回率和F值上均取得不错的效果。
- 杜文韬刘培玉费绍栋张朕
- 关键词:文本分类
- 融合扩展信息瓶颈理论的话题关联检测方法研究被引量:4
- 2014年
- 话题关联检测的关键任务在于判断给定报道对是否属于同一话题.现有判断方法往往忽略种子事件与其直接相关事件之间的层次关系.为此,通过分析报道内部语义分布规律及篇章结构,并依据语义分布规则,利用语义分布规律改进信息瓶颈(Information bottleneck,IB)算法,用于子话题逻辑语义单元的划分,并利用这些逻辑语义单元表示报道,进行话题关联检测.实验证明该方法有较快的收敛速度,并在一定程度上提高了系统性能.
- 杨玉珍刘培玉费绍栋张成功
- 关键词:信息瓶颈