宋擒豹
- 作品数:52 被引量:978H指数:16
- 供职机构:西安交通大学电子与信息工程学院更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划教育部“新世纪优秀人才支持计划”更多>>
- 相关领域:自动化与计算机技术经济管理社会学文化科学更多>>
- 软件质量保障技术被引量:6
- 2001年
- 文章从软件工程方法、软件质量国际标准体系、软件可靠性和软件构件技术等方面介绍了现有的软件质量保障技术,同时分析了用数据挖掘方法研究软件质量的可行性,并提出了具体的解决方案。
- 宋擒豹杨向荣沈钧毅
- 关键词:软件质量数据挖掘可靠性软件工程
- 一种新的基于信息熵的属性选择算法
- 属性选择是提高分类器性能的一种有效的方法.然而已有的属性选择算法要么假设数据无噪声,要么没有考虑属性间的交互作用,不能用于数据集中既有噪声又存在属性交互作用的情况.提出一种基于信息熵的属性选择算法。该算法用条件熵来评价属...
- 王广涛宋擒豹车蕊
- 关键词:信息熵分类器性能属性选择算法条件熵
- 文献传递
- 电子商务环境下的数据挖掘研究
- 电子商务的蓬勃发展使得Internet上的资源和服务更加丰富多彩,这些丰富的资源和服务每天又都会产生许多新的、蕴涵着大量重要的信息的异构、不确定性和非结构化海量数据,其复杂程度已远远超出了人类目前已有的分析和理解能力.因...
- 宋擒豹
- 关键词:数据库知识发现数据挖掘WEB挖掘电子商务
- 文献传递
- 一个基于关联规则的多层文档聚类算法被引量:4
- 2005年
- 提出了一种新的基于关联规则的多层文档聚类算法,该算法利用新的文档特征抽取方法构造了文档的主题和关键字特征向量。首先在主题特征向量空间中利用频集快速算法对文档进行初始聚类,然后在基于主题关键字的新的特征向量空间中利用类间距和连接度对初始文档类进行求精,从而得到最终聚类。由于使用了两层聚类方法,使算法的效率和精度都大大提高;使用新的文档特征抽取方法还解决了由于文档关键字过多而导致文档特征向量的维数过高的问题。
- 宋江春沈钧毅宋擒豹
- 关键词:文档聚类关联规则
- 集成Web使用挖掘和内容挖掘的用户浏览兴趣迁移挖掘算法被引量:10
- 2004年
- 提出了一种集成 Web使用挖掘和内容挖掘的用户浏览兴趣迁移模式的模型和算法 .介绍了 Web页面及其聚类 .通过替代用户事务中的页面为相应聚类的方法得到用户浏览兴趣序列 .从用户浏览兴趣序列中得到用户浏览兴趣迁移模式 .该模型对于网络管理者理解用户的行为特征和安排 Web站点结构有较大的意义 .
- 邢东山沈钧毅宋擒豹
- 关键词:浏览兴趣WEB内容挖掘WEB使用挖掘电子商务
- 一种集成数据挖掘的自动视频分类方法被引量:4
- 2004年
- 针对自动视频分类工作中分类预测精度低的问题,提出了一种集成数据挖掘技术的自动视频分类方法。首先进行视频分割,形成了一个视频属性数据库;然后分别使用决策树、分类关联规则等技术对视频属性数据库进行数据挖掘,提取出决策树分类规则集和分类关联规则集;最后利用一个规则集的合并裁减算法来合并这两个分类预测规则集,形成最终的具有更高精度的视频分类规则集。通过实验验证了决策树分类预测规则和分类关联规则具有分类预测的一致性;同时实验表明,使用合并后的规则集比单独使用一个规则集来预测视频具有更高的预测准确率。
- 原野宋擒豹沈钧毅
- 关键词:数据挖掘决策树分类关联规则
- 自动视频分类中的数据预处理被引量:2
- 2004年
- 提出了一套视频数据采集、特征提取及数据预处理方法。介绍了视频数据的采集方式,并提出了一套可计算的视频特征属性,可以反映人们对不同的视频风格的典型特征的理解。给出了如何将这些提取的视频属性数据处理成适合于决策树分类、分类关联规则以及序列模式等数据挖掘技术适用的数据格式。
- 原野沈钧毅宋擒豹
- 关键词:视频分割数据挖掘数据预处理
- 神经网络数据挖掘方法中的数据准备问题被引量:51
- 2000年
- 文章讨论了神经网络数据挖掘方法中的数据准备问题.首先简要介绍数据清洗与选择的基本方法,然后详细论述数据预处理、数据表示和数据集管理等方面的问题.
- 宋擒豹沈钧毅
- 关键词:数据准备数据挖掘神经网络数据预处理数据库
- 软件度量筛选研究被引量:2
- 2009年
- 根据度量需求选择合适的度量是度量实施中的一大问题。基于PSM给出的度量选择准则和GQ(I)M模型,提出基于模糊群决策理论的度量筛选模型(MTM)。该模型从利益攸关者角度出发,根据评估指标,对根据GQ(I)M模型得到的基度量进行评估,然后验证度量目标的可达性并删除冗余的基度量,最终得到利益攸关者一致满意的无冗余的基度量集,实现度量的科学筛选。最后通过案例演示模型在度量筛选中的应用。
- 侯红张娟宋擒豹
- 一种新的Web事务模糊聚类算法的研究被引量:28
- 2002年
- 提出了一种新的Web事务模糊聚类算法 .首先 ,在Web日志预处理后建立Web站点用户访问矩阵 ,矩阵元素为用户访问离散化时间 ,在此基础上进行Web事务群体的模糊聚类 ,最后对在线的活动Web事务进行类别归属 .经实验证明 ,该算法比已有的算法准确性高 ,运行时间少 ,扩展性好 ,它可以广泛地应用于电子商务领域 ,如个性化Web和Web推荐系统等 .
- 邢东山宋擒豹沈钧毅
- 关键词:WEB使用挖掘WEB日志模糊相似矩阵