武森
- 作品数:130 被引量:462H指数:12
- 供职机构:大连海事大学更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金教育部“新世纪优秀人才支持计划”更多>>
- 相关领域:自动化与计算机技术经济管理理学文化科学更多>>
- 基于数据对的聚类算法研究
- 聚类分析是数据挖掘领域最为常见的技术之一,传统的聚类方法是面向单个主体进行聚类的。本文提出了一种基于数据对的聚类算法CABDP,用以发现电信业务中相互通话的客户群。该算法从集合的角度出发,定义了完全连通集的概念,采用逐层...
- 武森崔焕荣鄂旭高学东
- 关键词:数据挖掘聚类集团客户
- 文献传递
- 面向稀疏数据的协同过滤用户相似度计算研究被引量:5
- 2022年
- 基于用户的协同过滤通过获取最近邻的偏好实现对目标用户偏好的预测推荐,相似度计算为其核心步骤。传统数值相似度计算依赖于用户共同评分项的评分数值,用户-项目评分矩阵稀疏程度的加剧导致数值相似度计算准确性降低,难以为目标用户选取可靠的最近邻,影响推荐效果;现有结构相似度大多利用用户共同评分项占比度量,计算简单,受数据稀疏影响较小但区分度低。针对上述协同过滤任务中数据稀疏带来的相似度计算问题,提出一种稀疏余弦相似度。首先定义新的结构相似度——稀疏集合相似度,将用户区分为高相关用户与低相关用户,并进一步针对不同类型用户设计差异化的数值相似度计算方式,以缓解传统数值相似度在面临数据稀疏时的不足,最终综合数值相似度与结构相似度形成稀疏余弦相似度。实验结果表明,与七种相似度计算方法相比,稀疏余弦相似度解决了传统数值相似度受数据稀疏影响严重和结构相似度计算结果区分度低的问题,可更准确计算用户相似度,提升推荐效果。
- 武森董雅贤魏桂英高晓楠
- 关键词:相似度计算协同过滤稀疏数据推荐系统
- 线性规划的支撑方法(一)
- 1995年
- 本文简要介绍了求解线性规划的支撑方法.它引入了类似于基的支撑概念,但对非基变量不作为零的要求,即迭代不一定在极点上进行.文中给出了包括支撑可行解、ε-最优解(次优解)在内的主要概念,论述了最优性判据和次优性判据,建立了迭代算法并证明了有限步终止性.
- 高学东武森李宗元
- 关键词:线性规划支撑方法最优性判据
- 加权关联规则的改进算法被引量:11
- 2004年
- 论文讨论了加权关联规则问题,针对布尔类型的加权关联规则问题提出一种改进算法。该算法首先利用普通的关联规则算法产生频繁集,然后在该频繁集的基础上产生加权频繁集。同时,给出了最优的最小支持度设定方法,保证了普通关联规则算法所产生的频繁集为加权频繁集的超集。该算法有较高的效率,并且能够有效利用已有的关联规则算法。
- 宫雨武森尹阿东高学东
- 关键词:数据挖掘关联规则
- 客户关联聚类在电信客户关系管理中的应用被引量:2
- 2005年
- 本文对电信行业的客户关系中的关联聚类问题,结合某移动公司的业务数据,演绎了客户关联聚类分析的应用过程。
- 武森杨柳
- 关键词:数据挖掘
- 基于MapReduce的大规模文本聚类并行化被引量:9
- 2014年
- 建立快速有效的针对大规模文本数据的聚类分析方法是当前数据挖掘研究和应用领域中的一个热点问题.为了同时保证聚类效果和提高聚类效率,提出基于"互为最小相似度文本对"搜索的文本聚类算法及分布式并行计算模型.首先利用向量空间模型提出一种文本相似度计算方法;其次,基于"互为最小相似度文本对"搜索选择二分簇中心,提出通过一次划分实现簇质心寻优的二分K-means聚类算法;最后,基于MapReduce框架设计面向云计算应用的大规模文本并行聚类模型.在Hadoop平台上运用真实文本数据的实验表明:提出的聚类算法与原始二分K-means相比,在获得相当聚类效果的同时,具有明显效率优势;并行聚类模型在不同数据规模和计算节点数目上具有良好的扩展性.
- 武森冯小东杨杰张晓楠
- 关键词:云计算聚类相似度
- 基于网络拓扑着色的虚拟电路阻抗辨识方法被引量:2
- 2016年
- 在虚拟电路故障诊断训练系统中,为了实现电路拓扑中任意节点间阻抗准确、快速、动态和实时辨识,提出一种基于网络拓扑着色的虚拟电路阻抗辨识算法。首先基于网络拓扑着色原理,进行虚拟电路拓扑深度优先搜索、同属性节点着色,简化待辨识电路。其次,提取简化电路的节点和支路信息,建立节点-支路关联矩阵和支路阻抗矩阵,通过剪枝变换Tc、串支变换Ts、并支变换Tp和桥支Y-△变换Tb对节点-支路关联矩阵A和支路阻抗矩阵Z进行循环降维处理,并由支路阻抗矩阵的变换结果获得待辨识电路阻抗。最后,对一个虚拟电路网络进行任意节点之间阻抗的辨识,辨识结果与实际计算结果完全一致。基于网络拓扑着色的虚拟电路阻抗辨识算法可实现任意节点间阻抗的有效辨识。
- 武森林叶锦黄朝明
- 考虑数据排序的改进CABOSFV聚类被引量:2
- 2011年
- CABOSFV是基于稀疏特征进行高维数据聚类的高效算法,但算法的聚类质量受数据输入顺序的影响。针对此问题,提出考虑数据排序的改进CABOSFV聚类(CABOSFV_CS),通过定义稀疏性指数来描述数据的稀疏特征,并按照稀疏性指数升序对数据进行排序以改进CABOSFV算法的聚类质量。采用UCI基准数据集进行实验,结果表明与传统的CABOSFV算法相比,CABOSFV_CS有效地提高了聚类准确率。
- 武森王静谭一松
- 关键词:高维数据聚类
- 一种用于电磁检测的金属颗粒固定装置
- 本实用新型涉及金属颗粒检测领域,特别涉及一种用于电磁检测的金属颗粒固定装置。该装置包括微动操作模块、加热模块及显微成像模块,微动操作模块利用延伸臂夹紧纤维并控制纤维在加热模块作用范围内移动;加热模块对金属微颗粒和纤维进行...
- 刘连坤武森刘大壮刘志坚潘新祥许朝阳徐方松
- 文献传递
- 稀疏数据非线性降维的CN-Isomap算法被引量:2
- 2010年
- 针对经典的流形学习算法Isomap在非线性数据稀疏时降维效果下降甚至失效的问题,提出改进的切近邻等距特征映射算法(Cut-Neighbors Isometric feature mapping,CN-Isomap).该算法在数据稀疏的情况下首先通过有效识别样本点的"流形邻居"来剔除近邻图上的"短路"边,然后再通过最短路径算法拟合测地线距离,使得拟合的测地线距离不会偏离流形区域,从而低维嵌入映射能够正确地反映高维输入空间样本点间的内在拓扑特征,很好地发现蕴含在高维空间里的低维流形,有效地对非线性稀疏数据进行降维.通过对Benchmark数据集的实验表明了算法的有效性.CN-Isomap算法是Isomap算法的推广,不仅能有效地对非线性稀疏数据进行降维,同样也适用于数据非稀疏的情况.
- 武森全喜伟陈学昌
- 关键词:降维流形学习等距特征映射稀疏数据