您的位置: 专家智库 > >

徐玛丽

作品数:1 被引量:5H指数:1
供职机构:南京农业大学信息科学技术学院更多>>
发文基金:教育部人文社会科学研究基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇子树
  • 1篇相似度
  • 1篇相似度计算
  • 1篇DOM树

机构

  • 1篇南京农业大学

作者

  • 1篇王东波
  • 1篇吴龙凤
  • 1篇朱毅华
  • 1篇张超群
  • 1篇曾通
  • 1篇李晓晖
  • 1篇徐玛丽

传媒

  • 1篇现代图书情报...

年份

  • 1篇2013
1 条 记 录,以下是 1-1
排序方式:
基于子树相似度计算的网页评论提取算法研究被引量:5
2013年
将网页评论的识别与自动提取转化为DOM树结构中的子树循环体识别问题,提出一种基于网页DOM子树相似度计算的方法,从网页中节点向下逐层遍历识别出满足约定条件的评论块节点树。针对目前DOM树相似度计算算法在评论提取方面的性能不足,本算法同时考虑树节点的标签与位置信息构建叶节点路径,通过求解两个DOM子树的叶节点路径相似度矩阵得到两个子树的相似度。比较其他几种基于DOM相似度计算方法和一种基于标签权重的网页评论提取方法在性能和效率上的差异。实验表明,基于本算法的网页评论提取方法具有较高的查准率和查全率,总体优于现有网页评论提取方法。
朱毅华张超群曾通吴龙凤徐玛丽王东波李晓晖
关键词:DOM树
共1页<1>
聚类工具0