徐晓旻
- 作品数:6 被引量:8H指数:1
- 供职机构:复旦大学更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金上海市教育委员会创新基金更多>>
- 相关领域:自动化与计算机技术更多>>
- Graph Explorer:基于结构的大型网络可视系统被引量:1
- 2011年
- 视觉是人类观察理解事物的最直接的途径.在社会网络、生物网络等大型网络的研究与分析中,视觉依然是发现其中蕴含知识的重要途径之一.为了使用户更好地观测网络,本系统利用快速社区挖掘算法对网络的结构信息进行分析,并将其应用于网络可视化,从而实现实时、层次化地大网络展示.系统由结构分析器,缓冲管理器和视觉器3个模块组成.系统可以根据用户需求,观测网络的局部细节或者高层次结构.
- 余韬肖仰华徐晓旻何震瀛
- 关键词:大网络可视化
- 维基百科链接网络实证分析
- 2012年
- 理解维基百科词条链接网络的结构特征是深入而有效地应用维基百科的前提。基于2010年1月的数据,从度分布、权分布、宏观结构特征等角度对维基百科词条链接网络的结构特征展开实证分析。相关结果与2006年之前的维基百科词条链接网络展开对比,发现当前的维基百科网络仍然具有无标度网络特性;其宏观结构总体上满足bow-tie模型,但模型中的各组成部分比例发生了显著变化。因此,该研究对深入解析维基百科词条链接网络的结构特性具有理论和现实意义。
- 王辉徐晓旻施佺
- 关键词:维基百科无标度网络
- KBAC:一种基于K-means的自适应聚类被引量:6
- 2012年
- K-means聚类算法存在的主要不足之处之一在于需要用户指定聚类核数目,在一般应用场景下,用户无法给出合适的聚类核数目.另一方面,K-means聚类所具有的可并行化特点非常适合运用到云计算平台上以处理大规模数据样本的聚类任务.本文提出KBAC算法采用K-means算法作为预聚类过程并在云平台上进行实现和优化,能够自适应确定最佳聚类核数目并进行聚类.其核心思想是将样本空间聚类问题转换为图上社团发现问题.理论和实验证明,通过在云计算框架下实现K-means预聚类过程的并行化,KBAC算法能够高效地对大规模数据进行聚类,并获得高质量的聚类结果.
- 徐晓旻肖仰华
- 关键词:K-MEANSMAPREDUCE聚类社团发现
- 基于图聚类的多维数据和软件聚类研究
- 聚类作为一种无监督的模式分类方法,在语音识别、字符识别以及数据挖掘(多关系数据挖掘)、时空数据库应用(GIS等)、序列数据分析等领域具有广阔的应用前景。聚类研究按照数据建模方式可分为多维空间上的聚类以及图聚类(又称为图上...
- 徐晓旻
- 关键词:多维数据数据挖掘
- 文献传递
- KBAC:-种基于K-means自适应聚类
- K-means聚类算法存在的主要不足之处之一在于需要用户指定聚类核数目,在一般应用场景下,用户无法给出合适的聚类核数目.另一方面.K- means聚类所具有的可并行化特点非常适合运用到云计算平台上以处理大规模数据样本的聚...
- 徐晓旻肖仰华
- 关键词:K-MEANSMAPREDUCE聚类社团发现
- 文献传递
- 基于Web社会网络的节点间关系多样性分析被引量:1
- 2011年
- 多样性是描述社会网络中节点行为的一个重要特性,通过对典型的大规模Web社会网络DBLP数据源提取,构建了一个大型SCN(科研合作网络),针对该网络节点间的关系进行建模与量化分析,利用节点度的累积分布、相关性、结构洞、聚类系数等网络结构特征参数,实证分析得出真实社会网络中的节点间关系具有多样化的特性,其多样性指标分布呈指数或高斯方式的衰减,具有结构洞特性的节点(作者)比其他节点更具竞争力,关系多样性强的节点倾向于彼此之间保持的联系。因此,对刻画社会网络中节点重要性具有重要意义,对实体搜索排名、广告营销等具有较好的应用价值。
- 王辉施佺徐波徐晓旻
- 关键词:社会网络多样性