您的位置: 专家智库 > >

国家高技术研究发展计划(2006AA01Z141)

作品数:8 被引量:130H指数:6
相关作者:马少平刘奕群张敏茹立云路晶更多>>
相关机构:清华大学清华信息科学与技术国家实验室搜狐公司更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 10篇会议论文
  • 8篇期刊文章

领域

  • 18篇自动化与计算...

主题

  • 6篇信息检索
  • 6篇用户
  • 6篇搜索
  • 5篇引擎
  • 5篇用户行为
  • 5篇搜索引擎
  • 5篇索引
  • 4篇信息处理
  • 4篇用户行为分析
  • 4篇中文
  • 4篇中文信息
  • 4篇中文信息处理
  • 4篇网络
  • 4篇计算机
  • 4篇计算机应用
  • 3篇日志
  • 3篇日志挖掘
  • 3篇图像
  • 3篇聚类
  • 3篇基于用户

机构

  • 13篇清华大学
  • 5篇清华信息科学...
  • 2篇搜狐公司

作者

  • 13篇马少平
  • 8篇张敏
  • 7篇刘奕群
  • 4篇岑荣伟
  • 4篇茹立云
  • 2篇余慧佳
  • 2篇周博
  • 2篇路晶
  • 1篇金奕江
  • 1篇陈磊
  • 1篇崔安颀
  • 1篇王灿辉
  • 1篇李智超
  • 1篇富羽鹏
  • 1篇薛宇飞
  • 1篇王勇

传媒

  • 5篇中文信息学报
  • 2篇计算机研究与...
  • 1篇山东大学学报...

年份

  • 1篇2011
  • 1篇2010
  • 6篇2009
  • 5篇2008
  • 5篇2007
8 条 记 录,以下是 1-10
排序方式:
基于URL特征的动态页面聚类
日益广泛应用的动态页面使数据抽取成为信息检索的关键技术和垂直搜索等领域中的重要组成部分。页面聚类利用页面间相互关系,可有效简化数据抽取步骤。但目前尚无有效的基于页面格式特征的页面聚类方法。格式相近的动态页面使用相同或近似...
崔安颀岑荣伟张敏马少平
关键词:数据抽取信息检索垂直搜索聚类
一种基于文档相似度的检索结果重排序方法被引量:9
2010年
对相关反馈问题的研究已有近30年的历史,相关反馈也被证明可以大程度稳定地提升检索系统的性能。当前网络环境下相关反馈的应用以及用户提供反馈信息的方式已经发生了明显的变化,因此相关反馈研究又一次引起了研究界的注意。该文提出了一种基于文档相似度的搜索结果重排序方法,该方法同时利用了反馈信息中的相关文档与不相关文档。在大规模网络信息检索标准实验数据上的实验结果表明:该方法不仅可以稳定地提高系统的检索性能,并且相较于经典的查询扩展方法有着明显的优势。
周博岑荣伟刘奕群张敏金奕江马少平
关键词:计算机应用中文信息处理信息检索
基于用户兴趣分析的网页生命周期建模被引量:6
2008年
网页在其生命周期内的活跃程度会随时间发生变化。有的网页只在特定的阶段有价值,此后就会过时。从用户的角度对网页的生命周期进行分析可以提高网络爬虫和搜索引擎的性能,改善网络广告的效果。利用一台代理服务器收集的网页访问量信息,我们对网页的生命周期进行了研究,给出了用户兴趣演变的模型。这个模型有助于更好地理解网络的组织与运行机理。
王勇刘奕群张敏马少平茹立云
关键词:计算机应用中文信息处理用户行为分析网络日志挖掘
使用支持向量机进行作弊页面识别
搜索引擎已经成为通过网络获取信息的重要工具。一些网页通过不正当的手段,提高在搜索引擎的结果列表中获得较高的排名以获得点击量,这就是网页作弊。作弊页面的种类非常多,本文中对网络上常见的一类作弊页面的内容特征进行了分析,并使...
李智超余慧佳马少平
关键词:支持向量机信息检索搜索引擎
文献传递
相关反馈任务中一种基于文档相似度的检索结果重排序方法
研究界关于相关反馈问题的研究已经有近30年的历史,相关反馈也被证明可以在很大程度上稳定地提升检索系统的性能。由于目前相关反馈的应用,以及用户提供反馈信息的方式都发生了明显的变化,有关相关反馈的研究又一次引起了研究界的注意...
周博岑荣伟刘奕群张敏马少平
关键词:信息检索
文献传递
基于虚拟主题的网络关键资源页面定位技术研究
关键资源页面是网络信息环境中一类重要的页面,是用户进行网络搜索的主要目标。虚拟组织是网格体系结构中的基本单元。本文借鉴网格研究中虚拟组织的结构的研究和分析,基于网络用户搜索行为分析提出虚拟主题的概念,并构架基于虚拟主题的...
岑荣伟刘奕群茹立云张敏马少平
关键词:网络搜索引擎用户行为
文献传递
基于目的分析的作弊页面分类
随着互联网的飞速发展,因网络作弊而产生的垃圾页面越来越多,严重影响了搜索引擎的检索效率和用户体验。反作弊已经成为搜索引擎所面临的最重要挑战之一。但目前的反作弊研究大都是基于页面内容或链接特征的,没有一个通用可行的识别方法...
余慧佳刘奕群张敏马少平茹立云
文献传递
基于目的分析的作弊页面分类被引量:7
2009年
随着互联网的飞速发展,因网络作弊而产生的垃圾页面越来越多,严重影响了搜索引擎的检索效率和用户体验。反作弊已经成为搜索引擎所面临的最重要挑战之一。但目前的反作弊研究大都是基于页面内容或链接特征的,没有一个通用可行的识别方法。本文主要基于作弊目的的分析,给出作弊页面另一种体系的分类,为基于目的的作弊页面识别起到良好的导向作用。
余慧佳刘奕群张敏马少平茹立云
关键词:计算机应用中文信息处理
基于用户浏览图的网页质量评估方法的比较分析
面对海量繁杂的网络数据环境,网页质量评估成为互联网搜索引擎面临的主要技术挑战之一,当前针对互联网网页评估的主要研究思路是基于网络超链接结构的分析完成。然而,Web2.0、搜索引擎结果优化(SEO),网络作弊等现象的出现严...
薛宇飞刘奕群张敏马少平茹立云
关键词:PAGERANK
文献传递
基于用户日志挖掘的搜索引擎广告效果分析被引量:17
2008年
随着搜索引擎市场的飞速发展,竞价排名广告以其有效、低风险、灵活等特点逐渐受到中小企业用户的青睐,成为搜索引擎稳定的收益增长点。然而竞价排名广告是否会影响用户体验,从而削弱其宣传效果并且影响用户对于搜索引擎的忠实度成为了企业及搜索引擎所担忧的问题。该文从网络用户日志中挖掘出网络用户对于广告的实际交互行为,并给出了各大搜索引擎竞价排名广告方面的统计数据。对于企业用户如何更有效地利用竞价排名广告以及搜索引擎如何平衡广告的经济效益和用户体验之间的关系都有较高的指导意义。
陈磊刘奕群茹立云马少平
关键词:计算机应用中文信息处理搜索引擎用户行为分析
共2页<12>
聚类工具0