您的位置: 专家智库 > >

河南省教育厅科学技术研究重点项目(13A520032)

作品数:2 被引量:17H指数:2
相关作者:张乃洲曹薇李石君更多>>
相关机构:河南财经政法大学武汉大学更多>>
发文基金:河南省教育厅科学技术研究重点项目国家级星火计划河南省基础与前沿技术研究计划项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇点击
  • 1篇页面
  • 1篇页面分割
  • 1篇引擎
  • 1篇日志
  • 1篇社会计算
  • 1篇搜索
  • 1篇搜索引擎
  • 1篇随机游走
  • 1篇随机游走模型
  • 1篇索引
  • 1篇节点密度
  • 1篇块分类
  • 1篇WEB页
  • 1篇WEB页面
  • 1篇DOM树
  • 1篇查询
  • 1篇查询日志
  • 1篇查询意图

机构

  • 2篇河南财经政法...
  • 1篇武汉大学

作者

  • 2篇张乃洲
  • 1篇李石君
  • 1篇曹薇

传媒

  • 1篇计算机学报
  • 1篇计算机工程

年份

  • 2篇2015
2 条 记 录,以下是 1-2
排序方式:
一种基于节点密度分割和标签传播的Web页面挖掘方法被引量:13
2015年
获取Web页面中的重要内容如文本和链接,在许多Web挖掘研究领域有着重要的应用价值.目前针对该问题主要采用Web页面分割和区块识别的方法.但现有的方法将Web页面中重要文本和链接的识别视为两个相互独立的问题,这种做法忽略了Web页面中文本和链接的内在语义关系,同时降低了页面处理的效率.文中提出了一种Web页面重要内容挖掘的统一框架,该框架主要由3个部分组成:第一,先将Web页面转换为DOM树表示,然后采用节点密度熵为度量将DOM树分割为不同的页面块;第二,采用基于K最近邻标签传播的半监督方法自动扩展页面块训练集;第三,在扩展的页面块训练集上对SVM分类器进行训练,并用来对页面块进行分类.采用该框架可以将Web页面块区分为多种类型,并且该框架独立于Web页面的类型和布局.我们在真实的Web环境下进行了广泛的实验,实验结果表明了该方法的有效性.
张乃洲曹薇李石君
关键词:页面分割节点密度DOM树块分类社会计算
基于时间点击图挖掘的查询建议方法被引量:4
2015年
采用查询建议技术表现用户查询意图的多样化,并自动向用户提供多种选择,是当前搜索引擎普遍的做法。但当前的查询建议研究鲜有考虑时间因素对生成查询建议的影响,而实际上在很多情况下,用户的查询意图会随着时间的推移发生改变。为此,根据时间点击图挖掘原理提出一种查询建议方法。对原始的查询日志文件进行预处理,生成时间点击图。对时间点击图进行非连通子图检测和图的合并操作,以降低或消除图的非连通性。采用基于随机游走模型的图挖掘算法,生成给定查询的查询建议集。在真实的Web环境下进行实验,结果表明,利用该方法能够提高查询建议的精度和差异度,从而生成更加可靠的查询建议。
张乃洲
关键词:查询意图随机游走模型查询日志搜索引擎
共1页<1>
聚类工具0