宋晓辉
- 作品数:5 被引量:10H指数:2
- 供职机构:燕山大学信息科学与工程学院更多>>
- 发文基金:河北省教育厅科研基金教育部科学技术研究重点项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于MFSP-DG的个性化推荐算法
- 2008年
- 提出一种基于最大频繁序列模式有向图的页面个性化推荐技术,由于考虑了用户会话的页面访问顺序,比一些不考虑页面访问顺序的推荐技术有更高的准确率。有向图结构压缩存储了所有最大频繁序列模式,推荐引擎依据截取的用户最近访问页面子序列,与有向图的部分路径进行匹配并进行横向推荐和纵向推荐,无需在整个模式库中搜索相同或相似的模式,从而加快了模式匹配的速度,更好地满足了页面推荐的特性和实时要求。实验证明,方法是有效的。
- 张忠平宋晓辉赵海亮
- 一种基于OUS的最大频繁项集挖掘算法
- 2008年
- 分析实际应用中有效访问序列的特点,提出了一种采用自底向上策略快速挖掘最大频繁项集的OUS算法。该算法首先对用户项集进行重叠操作统计浏览次数,然后合并,依据用户给出的最小支持度删除原项集中的非频繁页面元素,并对两两用户项集筛选生成候选频繁项集,最后扫描数据库,统计各个候选频繁项集的支持度计数。实验结果表明,该算法能有效地发现用户最大频繁项集。
- 张忠平宋晓辉宋少英
- 关键词:最大频繁项集
- ISAD:一种新的基于属性距离和的孤立点检测算法被引量:7
- 2009年
- 孤立点是数据对象在某些属性(维)上波动形成的。由此,本文提出了关键属性的概念,用于描述影响数据稳定性的属性。在真实数据集中,只有一部分属性是能够决定某数据是否是孤立点的关键属性。由此,本文提出了关键属性隶属度的定义及其求解算法,并在此基础上提出了一种新的基于属性距离和的孤立点检测算法。实验结果表明,该算法较基于单元的算法在效率及维数可扩展方面均有显著提高。
- 张忠平宋少英宋晓辉
- 关键词:孤立点
- 基于PCA及属性距离和的孤立点检测算法被引量:4
- 2009年
- 提出了一种基于主分量分析和属性距离和的孤立点检测算法。该方法首先通过主分量分析方法从众多属性中提取出满足累计贡献率的主分量,同时利用PCA变换矩阵把原始数据集转换到由主分量组成的新的特征空间上,之后对转换后的数据集用属性距离和的方法对孤立点进行检测。实验结果证明了基于主分量分析和属性距离和的孤立点检测算法的有效性。
- 张忠平宋少英宋晓辉
- 关键词:孤立点主分量分析
- 基于Web使用挖掘的个性化技术研究
- 随着网络资源的不断丰富和网络信息量的不断膨胀,信息过载和资源迷向已经成为制约人们高效使用Web信息的瓶颈。网站需要引入一种能够根据用户的兴趣爱好自动组织和调整信息的服务模式,即个性化服务方式,使信息服务方式从传统“一对多...
- 宋晓辉
- 关键词:WEB使用挖掘最大频繁项集
- 文献传递