吕云云
- 作品数:3 被引量:10H指数:2
- 供职机构:山西大学计算机与信息技术学院更多>>
- 发文基金:山西省自然科学基金山西省科技攻关计划项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于非完备信息系统的评价对象情感聚类被引量:2
- 2012年
- 该文利用领域本体对产品评论文本中的评价对象进行抽取和整合,在此基础上,建立产品性能的非完备信息系统,将特征的情感倾向寓于特征的权重计算之中。对非完备信息系统,给出了基于差别矩阵的启发式特征约简方法,通过特征降维处理,达到了减少特征的冗余度和数据稀疏性的目的。对降维后的非完备信息系统采用K-Means聚类算法,实现了评价对象情感聚类。为了验证该文提出方法的有效性,在真实汽车评论文本数据上进行实验,实验结果表明,在对特征进行一定程度的降维后,仍表现出较好的聚类效果。
- 王素格尹学倩李茹张杰吕云云
- 关键词:本体特征降维聚类
- 基于集成学习的中文观点句抽取方法研究
- 随着网络的普及和发展,越来越多的人喜欢在网上自由地发表自己的观点和意见。对这些蕴藏着巨大的潜在价值的观点信息的挖掘和倾向性分析,可为网络问政、舆情分析、市场导购等领域提供决策支持。然而,文本中的观点主要由带有观点的句子构...
- 吕云云
- 关键词:抽取方法
- 文献传递
- 基于BootStrapping的集成分类器的中文观点句识别方法被引量:8
- 2013年
- 领域相关的大规模和高质量的标注训练数据是分类器性能的重要保证,而标注训练语料是一件费时费力的工作。该文提出了一种采用小规模标注语料识别中文观点句的方法。首先采用Bootstrapping方法扩展训练语料,分别训练贝叶斯、支持向量机和最大熵分类器。最后,通过给三个训练好的分类器赋权获得一个集成分类器。实验结果表明,集成后的分类器性能优于单分类器,并且该方法在使用部分标注训练数据的情况下也能取得与采用全部标注训练数据相近的实验结果。
- 吕云云李旸王素格
- 关键词:BOOTSTRAPPING集成分类器