您的位置: 专家智库 > >

李爱玲

作品数:1 被引量:9H指数:1
供职机构:西安电子科技大学计算机学院软件工程研究所更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇信息熵
  • 1篇页面
  • 1篇主题信息
  • 1篇WEB
  • 1篇WEB页
  • 1篇WEB页面
  • 1篇抽取
  • 1篇抽取方法

机构

  • 1篇西安电子科技...

作者

  • 1篇徐学洲
  • 1篇李爱玲
  • 1篇贺智平

传媒

  • 1篇计算机工程与...

年份

  • 1篇2007
1 条 记 录,以下是 1-1
排序方式:
一种基于信息熵的Web页面主题信息抽取方法被引量:9
2007年
提出了一种剪枝信息熵增较大结点的信息抽取方法。通过对HTML文档解析来构造DOM树,根据配置过滤掉不需处理的相关内容并建立语义模型树,最后对熵增超过阈值的结点进行剪枝并输出抽取的主题信息页面,初步实验结果验证了用这种方法进行Web页面信息抽取的有效性。方法的数学模型简单可靠,基本不需要人工干预即可完成主题信息抽取。可应用于Web数据挖掘系统以及PDA等移动设备的信息获取方面。
贺智平徐学洲李爱玲
关键词:WEB抽取信息熵
共1页<1>
聚类工具0