河北省教育厅科研基金(2009116)
- 作品数:3 被引量:18H指数:2
- 相关作者:张霞王素贞许鸣珠尹怡欣赵海龙更多>>
- 相关机构:北京科技大学河北经贸大学石家庄铁道大学更多>>
- 发文基金:河北省教育厅科研基金国家自然科学基金河北省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于粒运算的文本情感分类方法研究
- 2011年
- 随着Internet的迅猛发展,人们对事件的立场、观点和看法的文本信息每天都会在网上出现,对于这些评论,仅靠人工进行跟踪和分析显然是行不通的,人们开始关注并研究评论文本的主观性情感倾向分析。文本情感分类中,分类器的设计是其中最重要的一个环节。文本评论往往是针对某一个特定领域的产品,评论语句一般都是短短几句,并且词汇量小特征词的交叉比较多,在这种情况下,与那些基于统计方法的分类器比较,基于规则的分类器更具优越性。提出了一种基于粒运算的方法,通过建立粒网络生成分类规则,从而得到评论文本的情感倾向分类。
- 张霞王素贞许鸣珠
- 关键词:文本情感
- 基于信息粒度的不完备信息系统空值补齐算法被引量:4
- 2011年
- 在现实世界中,不完备信息系统大量存在的,信息系统中空值的存在大大增加了信息表的不确定性,信息表无法产生更多潜在的有价值规则.处理不完备信息表的一种做法是先将空值补齐再提取规则,常用的空值补齐算法通常都是根据同属性其他值出现的频率高低估计空值,但是此方法不一定能保证规则的一致性.本文提出一种基于信息粒度的空值补齐方法GRCC,首先根据定义的信息粒度选择信息粒度最大的列,然后由相容类产生空值的属性值范围,最后利用MDL准则确定遗漏项的属性值,如此逐列进行填充直到完成全部信息表的补齐.经过实验,GRCC算法补齐的信息表比其它补齐方法产生的信息表产生更多高可信度和高支持度的规则,降低了信息表的不确定性.
- 张霞储尚军许鸣珠
- 关键词:不完备信息系统信息粒度相容类最小描述长度
- 基于模糊粒度计算的K-means文本聚类算法研究被引量:14
- 2010年
- 传统的K-means算法对初始聚类中心非常敏感,聚类结果随不同的初始输入而波动,算法的稳定性下降。针对这个问题,提出了一种优化初始聚类中心的新算法:在数据对象的模糊粒度空间上给定一个归一化的距离函数,用此函数对所有距离小于粒度d_λ的数据对象进行初始聚类,对初始聚类簇计算其中心,得到一组优化的聚类初始值。实验对比证明,新算法有效地消除了传统K-means算法对初始输入的敏感性,提高了算法的稳定性和准确率。
- 张霞王素贞尹怡欣赵海龙
- 关键词:粒度K-MEANS文本聚类