江苏省自然科学基金(BK2012815)
- 作品数:5 被引量:42H指数:3
- 相关作者:业宁韦素云杨绪兵陈斌王一雄更多>>
- 相关机构:南京林业大学扬州大学更多>>
- 发文基金:江苏省自然科学基金江苏省“六大人才高峰”高层次人才项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 马氏度量学习中的几个关键问题研究及几何解释被引量:17
- 2013年
- 采用距离度量模式的相似性(或不相似性)已广泛应用于模式识别和机器学习等领域.最常用的度量是欧氏距离和马氏距离(Mahalanobis distance).欧氏距离虽然计算相对简单,但由于存在无法结合先验知识、同等看待样本等局限性,常无法满足实际需要.解决此类问题的有效手段之一就是采用非欧氏度量,如马氏度量.马氏度量不仅能够结合数据的统计特性,还能兼顾样本间的相关性.讨论马氏距离度量的相关性质,并给予证明,主要包括:(1)两种度量的区别与联系;(2)在马氏距离度量下导出的点到平面(超平面)距离公式及投影公式;(3)两种度量是距离保持的.最后,给出相关实验验证.
- 杨绪兵王一雄陈斌
- 关键词:欧氏距离
- 结合项目类别和动态时间加权的协同过滤算法被引量:10
- 2014年
- 基于项目的协同过滤算法仅通过计算项目相似性产生推荐结果,忽略了项目类别信息对项目相似性的影响,且未考虑时间因素对推荐结果产生的影响。针对上述问题,引入项目类别相似性、用户兴趣度时间加权函数和项目流行度时间加权函数,提出结合项目类别相似性和动态时间加权的协同过滤推荐算法,包括将项目类别相似性引入到传统项目相似性计算中。分析用户兴趣度和项目受欢迎程度随时间动态变化对推荐结果产生的影响,构造基于时间的用户兴趣度加权函数和基于时间的项目流行度加权函数。实验结果表明,该算法的项目类别特征能够进一步提高项目相似性的精度,动态时间加权函数能够及时反映用户兴趣度和项目受欢迎程度的变化,提高推荐的准确度。
- 韦素云业宁杨旭兵
- 关键词:推荐系统协同过滤时间加权
- 基于动态抽样的图分类算法被引量:2
- 2015年
- 传统的图分类算法由于支持度阈值选择过低导致频繁子模式规模过大,进而造成效率过低,阈值选择过高导致重要模式丢失而造成分类精度下降,如FSG和CEP方法.针对这些问题,提出将动态抽样策略引入图分类领域,在保持分类准确率的前提下通过顶点平均度的计算抽样选取代表性子模式,结合CEP所给出的频繁闭显露模型,设计出一种新的图特征(分类规则)提取方法,解决了CEP算法由于支持度阈值设置过低而导致的无法计算现象,大大提高了分类效率;并通过实验证明本文算法优于现有的一些主流算法.
- 尹婷婷刘俊焱周溜溜业宁尹佟明
- 基于联合聚类平滑的协同过滤算法被引量:12
- 2013年
- 协同过滤是电子商务推荐系统中被广泛采用的技术,但还存在诸如稀疏性、冷启动、可扩展性等制约其进一步发展的瓶颈问题.针对上述问题,提出一种基于联合聚类平滑的协同过滤推荐算法.在该算法中,首先对原始矩阵中的评分模式进行用户和项目2个维度的联合聚类;然后采用联合聚类平滑的方法预测用户对未评分项目的评分值,分别从用户聚类簇、项目聚类簇和联合聚类簇多方面对评分矩阵空缺项进行平滑填充;最后结合基于项目的协同过滤算法查找项目最近邻并进行推荐.实验结果表明,该算法可以有效缓解用户评分数据稀疏带来的不良影响,一定程度上解决冷启动问题,提高预测准确率和推荐质量.
- 韦素云肖静静业宁
- 关键词:推荐系统协同过滤联合聚类数据平滑
- 隐目标回归算法设计研究被引量:1
- 2014年
- 对常用的回归方法进行研究。此类方法虽然几何解释明确、易于求解,但均须事先确定(或假定)变量间的因果关系,再考虑建模,在实际应用中,对于很难确定变量的因果关系的问题,如物联网数据分析,上述方法就会失效。为此,提出一种无需假定因变量的隐目标回归方法。该方法易于核化,可以推广到非线性回归问题。通过人工数据和国际标准数据集上的实验验证了所提算法的有效性。
- 华晓芳杨绪兵
- 关键词:最小二乘法偏最小二乘岭回归支持向量回归特征值问题