国家自然科学基金(60905029) 作品数:5 被引量:79 H指数:4 相关作者: 贾彩燕 周元炜 王天宇 黄厚宽 林友芳 更多>> 相关机构: 北京交通大学 中国移动通信集团天津有限公司 更多>> 发文基金: 国家自然科学基金 中央高校基本科研业务费专项资金 北京市自然科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
加权的自适应相似度度量 被引量:5 2013年 聚类分析是数据挖掘中一种非常重要的技术.聚类算法中的关键问题是相异度或相似度的度量,聚类结果直接依赖于相异度或相似度度量,尤其对于谱聚类方法更是如此.谱聚类算法是近期兴起的一种基于相似度矩阵的聚类算法.相比于传统的划分型聚类算法,谱聚类算法不受限于球状聚类簇,能够发现不规则形状的聚类簇.在已有的谱聚类算法中,高斯核相似度是最常用的相似度度量准则.基于高斯核相似度度量及其扩展形式,提出了一种加权的自适应的相似度度量,此相似度可以用于谱聚类以及其他基于相似度矩阵的聚类算法.新的相似度度量不仅能够描述多密度聚类簇中数据点间的相似度,而且可以降低离群点(噪声点)与其他数据点间的相似度.实验结果显示新的相似度度量可以更好地描述不同类型的数据集中数据点间的相似度,进而得到更好的聚类结果. 肖宇 于剑关键词:聚类分析 相似度度量 谱聚类 离群点 一种基于流行度和中心度的内容网络社区发现方法 2013年 基于近年来发展的社区发现概率模型的可解释性,对现有的性能较好的基于节点中心度和流行度的社区划分链接模型PPL进行扩展,给出了一种新的可以结合节点内容的组合模型PPL-DC。该模型不但可解决节点属性的选择问题,并可充分利用节点间的链接关系。实验结果表明,新给出的PPL-DC模型优于单纯的链接模型及已有的链接和内容相结合的组合模型。 康钊宁 贾彩燕 柴变芳一种改进的标签传播快速社区发现方法 被引量:9 2013年 标签传播社区发现方法LPA(Label Propagation Algorithm,简称LPA)和已有的一些算法相比具有算法复杂度低、思想简单、不需要指定社区数量等优点,但相比于传统社区发现方法(如GN)也有准确率较低的缺点。文章提出了一种改进的、基于节点局部相似性的标签传播算法LPALS(Label Propagation Algo-rithm based on Local Similarity,简称LPALS)。实验结果表明,LPALS算法在提高准确率的同时也保证了算法具有较低的时间复杂度。 康旭彬 贾彩燕关键词:复杂网络 一种基于用户相似性的协同过滤推荐算法 被引量:15 2013年 个性化推荐技术研究用户行为,分析用户兴趣,主动为用户推荐合适的资源,较好地解决了互联网信息日益庞大与用户需求之间的矛盾。协同过滤算法中,基于邻居的方法和基于潜在因子的方法是目前应用于推荐系统最成功的技术。前者虽然简单易行,但精度有待提高;后者精度较高,但模型复杂,参数难以学习。提出了一种改进的基于用户相似性的协同过滤算法,通过修正用户相似性的度量方法,产生更合理的用户邻居,实现对用户的评分推荐。实验结果表明,所提出的算法相比基于潜在因子的方法简单易行;同时,相比基于邻居的方法,在一定程度上提高了推荐的精度。 程飞 贾彩燕关键词:推荐系统 协同过滤 一种有效的社会网络社区发现模型和算法 被引量:51 2012年 社会网络的社区发现存在划分效果较好的算法时间复杂度过高、现有快速划分算法划分质量不佳、缺乏表达和充分利用个体和链接属性信息的模型和机制等问题.针对这些问题,提出了一种边稳定系数模型和一种能表达个体间关系紧密度的完全信息图模型,在此基础上设计和实现了一种有效的社区发现算法.提出的完全信息图模型具有较高通用性,适用于需要融合个体和链接属性的社区发现算法.通过系列实验表明,所提出的以边稳定系数模型和完全信息图为基础的算法,对社会网络中的社区发现问题是有效的.算法不仅具有较快的速度,也能适用于带权与不带权的网络,得到的社区划分结果也具有较高的划分质量. 林友芳 王天宇 唐锐 周元炜 黄厚宽关键词:社会网络 信息融合 链接挖掘