林古立
- 作品数:4 被引量:7H指数:2
- 供职机构:华南理工大学计算机科学与工程学院更多>>
- 发文基金:中央高校基本科研业务费专项资金广东省自然科学基金广东省科技攻关计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 互联网信息检索中的多样化排序研究及应用
- 随着信息技术的高速发展,互联网已成为目前世界上最大的信息库。互联网信息检索系统的诞生,为几们从互联网上获取信息提供了巨大的便利。然而随着信息检索研究的不断深入,许多学者逐渐意识到了一个影响用户检索满意度的重要因素——用户...
- 林古立
- 关键词:信息检索
- 文献传递
- 基于聚类和用户点击的在线多样化排序算法被引量:1
- 2011年
- 在互联网信息检索中,多样化排序方法力求在排序结果列表靠前的位置为用户提供多样的结果文档.文中提出一种基于聚类和用户点击的在线多样化排序算法CRBA,通过结合文档的相似性以及用户的点击反馈,在与用户的不断交互中为用户提供多样化的排序结果.该算法将在线和离线的思想进行融合,既可以利用主题聚类的优点,根据主题对候选文档集合进行简单的划分,大大加快了算法收敛速度,又能发挥在线排序算法的优点,利用用户点击反馈,获得对用户意图更为准确和完整的估计.实验结果表明,与其它在线排序算法相比,CRBA算法收敛速度快,且具有适应现实搜索环境中文档数量大的特点.
- 马千里林古立
- 关键词:信息检索聚类
- 一种基于关键词的网页搜索结果多样化方法被引量:5
- 2011年
- 网页搜索结果的多样化已经逐渐成为提高网页搜索效率和用户满意度的一个重要因素.文中将多样化问题形式化为信息面覆盖率的最大化问题,提出了一种基于关键词的网页搜索结果多样化方法KDM.该方法首先从与用户查询相关的结果文档中提取出可以描述结果文档所蕴含的信息面的关键词,然后根据关键词的同现性以及关键词对文档的描述能力,计算出结果文档的信息面新颖度,最后结合新颖度和相关度对文档进行重新排序,从而给用户提供多样化的搜索结果.实验结果表明,文中方法的多样化性能优于现有的其它多样化方法.
- 林古立彭宏马千里韦佳覃姜维
- 关键词:信息检索关键词
- 多步桥接精化迁移学习被引量:1
- 2011年
- 传统机器学习方法假设训练数据和测试数据分布一致,但在许多实际应用中这个假设并不能得到满足.针对该情况,文中提出了一种非参数化的迁移学习算法———多步桥接精化算法.首先构造一系列中间模型来建立不同领域之间的桥梁,然后在近邻的模型间进行标签传播,实现从源领域到目标领域的判别信息迁移.实验结果表明,分布相近的模型使迁移变得平滑,并使精化结果不敏感于初始标签,文中算法在分类精度上优于其他对比算法.
- 覃姜维郑启伦马千里韦佳林古立
- 关键词:文本分类