您的位置: 专家智库 > >

徐雯

作品数:1 被引量:10H指数:1
供职机构:大连理工大学国家示范性软件学院更多>>
发文基金:中央高校基本科研业务费专项资金教育部“新世纪优秀人才支持计划”国家教育部博士点基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇识别技术
  • 1篇最大流
  • 1篇最大流算法
  • 1篇文本相似度
  • 1篇相似度
  • 1篇链接
  • 1篇链接分析
  • 1篇WEB社区
  • 1篇WEB挖掘

机构

  • 1篇大连理工大学

作者

  • 1篇高亮
  • 1篇张宪超
  • 1篇徐雯
  • 1篇梁文新

传媒

  • 1篇计算机研究与...

年份

  • 1篇2012
1 条 记 录,以下是 1-1
排序方式:
一种结合文本和链接分析的局部Web社区识别技术被引量:10
2012年
当前Web社区识别算法大都基于纯链接分析,忽略了Web的文本属性.针对Flake等人提出的基于最大流算法的社区识别框架的不足(如赋予网页之间的链接不公平的权重、排序策略单一等),提出了一种结合网页内容分析与链接分析的改进算法.首先,提出一种新的基于文本相似度的边容量分配方法.基于网页间内容越相似彼此传递的权威度越大的特点,将网页的内容相似度用于Web图的边容量设置上,具体策略为Max-flow+TF-IDF边容量设置和Max-flow+TF-IDF+Seeds边容量设置.其次,提出的社区结点的排序策略充分考虑了结点和社区主题的相似度,以此来增强结点区分度.理论分析和实验证明了该算法具有提高社区发现的精度和大小、计算出的排序分值更为客观合理等优点.
张宪超徐雯高亮梁文新
关键词:最大流算法文本相似度WEB挖掘
共1页<1>
聚类工具0