您的位置: 专家智库 > >

茹立云

作品数:41 被引量:251H指数:9
供职机构:清华大学更多>>
发文基金:国家自然科学基金国家教育部博士点基金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 30篇期刊文章
  • 8篇会议论文
  • 2篇科技成果
  • 1篇学位论文

领域

  • 39篇自动化与计算...
  • 2篇文化科学

主题

  • 21篇用户
  • 19篇用户行为
  • 14篇用户行为分析
  • 10篇搜索
  • 9篇引擎
  • 9篇搜索引擎
  • 9篇索引
  • 8篇中文
  • 7篇日志
  • 7篇基于用户
  • 6篇计算机
  • 6篇查询
  • 5篇信息处理
  • 5篇中文信息
  • 5篇中文信息处理
  • 5篇浏览
  • 5篇计算机应用
  • 4篇信息检索
  • 4篇图像
  • 4篇排序

机构

  • 40篇清华大学
  • 5篇清华信息科学...
  • 2篇搜狐公司
  • 2篇北京搜狗科技...
  • 1篇香港城市大学

作者

  • 41篇茹立云
  • 38篇马少平
  • 31篇刘奕群
  • 23篇张敏
  • 7篇岑荣伟
  • 5篇张阔
  • 4篇金奕江
  • 4篇花贵春
  • 4篇王倩
  • 3篇方奇
  • 3篇路晶
  • 2篇唐杰
  • 2篇王灿辉
  • 2篇许丹青
  • 2篇李涓子
  • 2篇许斌
  • 2篇杨磊
  • 2篇闫兴龙
  • 2篇张静
  • 2篇刘健

传媒

  • 12篇中文信息学报
  • 6篇计算机研究与...
  • 3篇软件学报
  • 2篇模式识别与人...
  • 2篇智能系统学报
  • 2篇第五届全国信...
  • 1篇广西师范大学...
  • 1篇计算机工程与...
  • 1篇中国科技成果
  • 1篇中国图象图形...
  • 1篇计算机科学与...
  • 1篇第五届全国青...
  • 1篇全国第八届计...
  • 1篇第五届全国信...
  • 1篇全国第八届计...

年份

  • 1篇2018
  • 1篇2016
  • 1篇2015
  • 4篇2014
  • 2篇2013
  • 5篇2012
  • 5篇2011
  • 7篇2010
  • 5篇2009
  • 3篇2008
  • 2篇2006
  • 4篇2005
  • 1篇2003
41 条 记 录,以下是 1-10
排序方式:
基于伪反馈与分类的文本检索
查询空间与文档空间的不匹配是文本检索中的一大难题,在句子级别的检索中表现尤为突出。为解决这个问题而提出的查询扩展方法本身存在着难以解决的困扰。基于分类的方法绕过了这一难题,成为实现句子检索的一个可行方法。实际中使用分类方...
王灿辉茹立云张敏马少平
关键词:文本检索
文献传递
基于群体智慧的Web访问日志会话主题识别研究被引量:5
2011年
Web访问日志中的会话(session)是指特定用户在一定时间范围内的访问行为的连续序列。会话主题(topic)是指会话中具有相同用户意图的部分。从会话中进一步识别出能体现用户意图的处理单元(topic)是进行用户访问行为分析的重要基础。目前相关工作主要集中在边界识别上,无法处理用户意图交叉情况。为了解决该问题,该文重新形式化定义了session和topic的相关概念,提出最大划分的求解任务,并设计出了基于用户群体智慧的会话主题识别算法。在使用大规模真实Web访问日志的实验中,我们的算法取得了不错的效果。
方奇刘奕群张敏茹立云马少平
关键词:WEB访问日志
基于用户浏览图的网页质量评估方法的比较分析
面对海量繁杂的网络数据环境,网页质量评估成为互联网搜索引擎面临的主要技术挑战之一,当前针对互联网网页评估的主要研究思路是基于网络超链接结构的分析完成。然而,Web2.0、搜索引擎结果优化(SEO),网络作弊等现象的出现严...
薛宇飞刘奕群张敏马少平茹立云
关键词:PAGERANK
文献传递
面向用户互联网访问日志的异常点击分析
随着互联网用户量的爆炸性增长,用户行为分析已经成为互联网技术领域广泛应用的研究方法,如信息检索,网络安全,电子商务,广告投放等等。在这些不同的领域里,用户行为分析都有一个共同的目的:即通过用户行为日志分析来挖掘用户行为蕴...
王倩刘奕群马少平茹立云
关键词:用户行为分析
文献传递
基于用户日志挖掘的搜索引擎广告效果分析被引量:17
2008年
随着搜索引擎市场的飞速发展,竞价排名广告以其有效、低风险、灵活等特点逐渐受到中小企业用户的青睐,成为搜索引擎稳定的收益增长点。然而竞价排名广告是否会影响用户体验,从而削弱其宣传效果并且影响用户对于搜索引擎的忠实度成为了企业及搜索引擎所担忧的问题。该文从网络用户日志中挖掘出网络用户对于广告的实际交互行为,并给出了各大搜索引擎竞价排名广告方面的统计数据。对于企业用户如何更有效地利用竞价排名广告以及搜索引擎如何平衡广告的经济效益和用户体验之间的关系都有较高的指导意义。
陈磊刘奕群茹立云马少平
关键词:计算机应用中文信息处理搜索引擎用户行为分析
面向浏览推荐的网页关键词提取被引量:4
2012年
在网页浏览推荐任务中,如何利用网页内容选取合适的推荐关键词是具有挑战性的研究热点.为了实现有效的关键词推荐方法,利用大规模的真实网络用户浏览行为数据,以及相关提取算法和新词发现算法实现并比较了基于领域关键词提取技术和基于查询词候选集合的关键词推荐方法.实验结果证明,2种方法都能够有效地表征用户信息需求,而第1种推荐方法的准确率更高,具有更好的推荐性能.
闫兴龙刘奕群马少平张敏茹立云
关键词:关键词提取网页关键词
基于用户行为的长查询用户满意度分析被引量:5
2012年
搜索引擎性能评估是信息检索界一个重要课题.长查询具有较为丰富的信息内容,能更加准确地描述用户的信息需求.在此基础上文中提出长查询用户满意度分析的整体框架,定义用户满意度的概念,并在用户日志中提取相关用户行为特征,应用决策树和SVM两种分类算法评测用户满意度.在大规模商业搜索引擎日志上完成的实验结果证明了这套评价体系的有效性.结果表明,用户对于查询满意和不满意的分类准确率分别达到86%和70%.
朱彤刘奕群茹立云马少平
关键词:用户行为分析用户满意度学习算法
面向排序的基于查询需求的查询聚类模型被引量:2
2012年
排序是信息检索中的一个重要的环节,当今已经提出百余种用于构建排序函数的特征,如何利用这些特征构建更有效的排序函数成为当今的一个热点问题,因此排序学习(learningtorank)作为信息检索与机器学习的交叉学科,越来越受到人们的重视.根据不同的原则,查询可以分为不同的类别.不同类别的查询,排序特征的重要性不同,在排序函数的构建过程中的权重也会不同.为所有的查询都采用统一的排序函数是不合理的.针对这一问题,首先对利用关键词匹配原则得到的查询特征进行分析,选择出适当的查询特征集合构建查询特征向量,然后基于查询特征向量之间的距离对查询进行聚类,并为每个聚类类别学习得到排序函数,最后为一个新来的查询选择最适合的排序函数对文档进行排序.实验结果显示,在经过查询特征选择的查询聚类基础上得到的排序函数,和在所有的查询类别上得到的排序函数,两者的性能具有可比性,甚至前者优于后者.
花贵春张敏刘奕群马少平茹立云
关键词:关键词匹配信息检索
基于用户意图识别的查询推荐研究被引量:13
2014年
信息检索的效果很大程度上取决于用户能否输入恰当的查询来描述自身信息需求。很多查询通常简短而模糊,甚至包含噪音。查询推荐技术可以帮助用户提炼查询、准确描述信息需求。为了获得高质量的查询推荐,在大规模"查询-链接"二部图上采用随机漫步方法产生候选集合。利用摘要点击信息对候选列表进行重排序,使得体现用户意图的查询排在比较高的位置。最终采用基于学习的算法对推荐查询中可能存在的噪声进行过滤。基于真实用户行为数据的实验表明该方法取得了较好的效果。
罗成刘奕群张敏张敏马少平张阔
关键词:查询推荐
面向排序学习的特征分析的研究被引量:7
2011年
排序是信息检索中一个重要的环节,当今已经提出百余种用于构建排序函数的特征,如何利用这些特征构建更有效的排序函数成为当今的一个热点问题,因此排序学习(Learning to Rank),一个信息检索与机器学习的交叉学科,越来越受到人们的重视。从排序特征的构建方式易知,特征之间并不是完全独立的,然而现有的排序学习方法的研究,很少在特征分析的基础上,从特征重组与选择的角度,来构建更有效的排序函数。针对这一问题,提出如下的模型框架:对构建排序函数的特征集合进行分析,然后重组与选择,利用排序学习方法学习排序函数。基于这一框架,提出四种特征处理的算法:基于主成分分析的特征重组方法、基于MAP、前向选择和排序学习算法隐含的特征选择。实验结果显示,经过特征处理后,利用排序学习算法构建的排序函数,一般优于原始的排序函数。
花贵春张敏邝达刘奕群马少平茹立云
关键词:排序函数
共5页<12345>
聚类工具0