周小平
- 作品数:5 被引量:7H指数:1
- 供职机构:广西大学计算机与电子信息学院更多>>
- 发文基金:国家科技型中小企业技术创新基金广西研究生教育创新计划更多>>
- 相关领域:自动化与计算机技术理学文化科学更多>>
- 搜索引擎的反作弊技术研究
- 作弊已经成为搜索引擎面临的一个重大挑战,作弊者利用各种作弊技术来骗取虚假排名.为了对付网页作弊也出现了很多反作弊的技术.当前主要的反作弊技术可以分为基于网页特征分析,基于网页链接分析和检测隐藏技术的方法.当前,大部分搜索...
- 申文明梁一平周小平
- 关键词:计算机网络搜索引擎
- 一种多关系频繁模式挖掘算法被引量:1
- 2009年
- 传统数据挖掘算法在处理多表时,需要物理连接,存在效率不高的问题。为了解决这一问题,提出了一种多关系频繁模式挖掘算法。该算法利用元组ID传播的思想,使多表间无须物理连接,就可以直接挖掘频繁模式。实验表明,此算法具有较高的效率。
- 邓左祥刘连芳梁一平周小平
- 关键词:多关系数据挖掘
- 一种多关系数据挖掘中元组ID传播的设计与实现
- 传统的多关系数据挖掘是在多个表中进行物理上的连接。这是一种低效率的方法。基于元组ID传播的虚拟连接可能缩小了存储空间,并提高了多关系数据挖掘的效率。本文提出了一种基于数据集用于元组ID传播的设计方法。实验表明,这种方法是...
- 梁一平邓左祥周小平
- 关键词:多关系数据挖掘数据集
- 文献传递
- 基于网页正文主题和摘要的网页去重算法被引量:6
- 2009年
- 针对元搜索返回的网页内容相同,别名差异很大的重复网页,提出基于网页正文主题和摘要的网页去重算法,并通过实验对算法进行有效性验证。该算法首先对各成员搜索引擎返回来的网页标题进行有关处理,提取出网页的主题信息,然后对摘要进行分词,再计算摘要的相似度,二者结合能更好地现出文章摘要的内容,实现网页去重。该算法有效,并且比基于传统特征码的算法有明显的优势,更接近人工统计结果。
- 周小平黄家裕刘连芳梁一平申文明
- 关键词:去重网页分词元搜索
- 元搜索引擎研究
- 索引擎通过调用多个独立搜索引擎,从而提高了检索结果的覆盖面.本文简述了元搜索引擎的运作原理,研究了元搜索引擎的核心技术在于成员搜索引擎的选择,收集搜索引擎程序接口检索结果的优化。阐述了它的局限性在于成员搜索引擎的数量受限...
- 周小平梁一平邓左祥
- 关键词:元搜索引擎功能分析性能评价