蒋在帆
- 作品数:4 被引量:29H指数:2
- 供职机构:中国科学院研究生院更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划北京市自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于用户行为分析的个人信息检索研究被引量:11
- 2011年
- 个人信息检索是指个人计算机上用户搜索个人信息(通常是文档)的过程,与互联网检索相比,个人信息检索能够利用的信息很少,这使得其检索结果的排序更加困难。该文通过考察计算机上的用户行为,对个人信息检索的排序问题进行深入的研究。该文考察的用户行为主要包括用户在检索系统中的查询行为和在计算机上的文件访问行为。该文一方面通过查询行为数据训练出结果排序函数,另一方面通过文件访问行为数据获取文件自身的权重,最后利用统计学习方法结合这两类行为的计算结果。实验结果表明,该文提出的方法好于传统的TFIDF排序方法。
- 蒋在帆王斌
- 关键词:用户行为统计学习RANKINGSVM
- 网页搜索引擎查询日志的Session划分研究被引量:18
- 2009年
- 搜索引擎查询日志中的session(以下简称session)是指某特定用户为得到某个信息需求而在一段时间内的搜索行为的连续序列。Session的正确划分是进行用户搜索行为分析等一系列工作的重要基础,目前尚没有关于session的系统研究工作。本文针对相关研究工作的问题重新统一定义了session的概念并进行探索和比较研究,得出结论:(1)统计语言模型因数据稀疏问题不适合做session划分;(2)利用多种属性的决策树方法可以得到比较理想的结果,以session为单位进行评价,F值达到了78.6%。
- 张磊李亚楠王斌李鹏蒋在帆
- 关键词:计算机应用中文信息处理网络信息检索查询日志
- 基于用户行为分析的个人信息检索研究
- 个人信息检索是个人计算机上用户搜索文件的一种重要技术,但同互联网检索相比,个人信息检索能利用的信息很少,这使得个人信息检索的排序成为很困难的问题。本文通过收集计算机上的用户行为,对个人信息检索的排序问题进行深入的研究。其...
- 蒋在帆王斌
- 关键词:计算机应用统计学习
- 文献传递
- 网页搜索引擎查询日志的session划分研究
- 搜索引擎查询日志中的Session(以下简称Session)是指某特定用户为得到某个信息需求而在一段时间内的搜索行为的连续序列。Session的正确划分是进行用户搜索行为分析等一系列工作的重要基础,目前尚没有关于sess...
- 张磊李亚楠王斌李鹏蒋在帆
- 关键词:网络信息检索查询日志
- 文献传递