施欢欢
- 作品数:3 被引量:3H指数:1
- 供职机构:南京财经大学信息工程学院更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 在复杂网络中查找k个有限重叠的密集子图
- 2016年
- 密集子图问题广泛应用于社区发现、生物信息学中基因共表达和蛋白质相互作用等方面,是图挖掘和复杂网络研究的一个重要环节。现有的研究大多围绕查找单个密集子图和多个不相交的密集子图展开,忽略了子图的重叠及子图间的联系。为填补这一空白,引入最小密集图的概念,提出查找k个有限重叠的密集子图问题,最大化总密度的同时,满足子图节点集合间不超过限定的Jaccard系数。提出两个启发式算法,并通过实例计算以及与现有算法的比较分析,证明了算法的有效性。
- 印安涛钱钢施欢欢
- 关键词:复杂网络线性规划
- 基于图熵聚类的重叠社区发现算法被引量:2
- 2016年
- 图聚类算法是数据挖掘和复杂网络研究中的一个关键环节。基于密度、层次划分的方法已经被广泛应用于流行病学、新陈代谢和科学引文写作中。尽管上述的聚类方法适用于复杂网络的社区发现,但精度受到限制,其中一个最大的挑战是重叠社区的生成。为填补这一缺口,提出了一种利用图熵搜索局部最优的聚类方法。与传统的基于密度的种子生长式方法不同,在每一次迭代中,引入图熵来衡量图结构的模块度,并为种子的选择提供了随机选择、基于节点的度和基于节点的聚类系数3种方案。经过自下而上迭代的聚类,引入准确率和召回率等评价指标评估聚类结果的精确度,证明了算法的有效性。
- 施欢欢印安涛
- 关键词:复杂网络
- 基于MapReduce的关系数据库关键词查询技术被引量:1
- 2017年
- 为了解决关系数据库关键词查询算法存在的问题,根据图搜索算法,将关系数据转换成数据图,再将数据图物化成key/value形式存于分布式文件系统中。Map函数对数据图中每个节点计算其可达关键词,Reduce函数判断一个节点是否可达所有查询关键词,若满足条件则输出以该节点为根的结果树。在深入研究传统的查询算法基础上,提出了基于MapReduce的分布式并行数据图搜索算法。在用普通PC搭建的Hadoop集群上的实验表明:该方法明显提升了查询结果树生成速度,并且具有较好的可扩展性。
- 周鹏程施欢欢钱钢
- 关键词:关键词查询MAPREDUCE分布式计算