梁一平
- 作品数:7 被引量:7H指数:1
- 供职机构:广西大学更多>>
- 发文基金:国家科技型中小企业技术创新基金广西研究生教育创新计划更多>>
- 相关领域:自动化与计算机技术理学文化科学更多>>
- 搜索引擎的反作弊技术研究
- 作弊已经成为搜索引擎面临的一个重大挑战,作弊者利用各种作弊技术来骗取虚假排名.为了对付网页作弊也出现了很多反作弊的技术.当前主要的反作弊技术可以分为基于网页特征分析,基于网页链接分析和检测隐藏技术的方法.当前,大部分搜索...
- 申文明梁一平周小平
- 关键词:计算机网络搜索引擎
- 一种多关系频繁模式挖掘算法被引量:1
- 2009年
- 传统数据挖掘算法在处理多表时,需要物理连接,存在效率不高的问题。为了解决这一问题,提出了一种多关系频繁模式挖掘算法。该算法利用元组ID传播的思想,使多表间无须物理连接,就可以直接挖掘频繁模式。实验表明,此算法具有较高的效率。
- 邓左祥刘连芳梁一平周小平
- 关键词:多关系数据挖掘
- 基于网页正文主题和摘要的网页去重算法被引量:6
- 2009年
- 针对元搜索返回的网页内容相同,别名差异很大的重复网页,提出基于网页正文主题和摘要的网页去重算法,并通过实验对算法进行有效性验证。该算法首先对各成员搜索引擎返回来的网页标题进行有关处理,提取出网页的主题信息,然后对摘要进行分词,再计算摘要的相似度,二者结合能更好地现出文章摘要的内容,实现网页去重。该算法有效,并且比基于传统特征码的算法有明显的优势,更接近人工统计结果。
- 周小平黄家裕刘连芳梁一平申文明
- 关键词:去重网页分词元搜索
- 搜索引擎中查询扩展的研究
- 随着信息技术的飞速发展以及人们对信息需求的日益迫切,搜索引擎已成为人们在网上搜索相关信息的一个必不可少的工具。在使用搜索引擎中,如何通过输入好的查询表达式来获得好的搜索结果是困扰网民的一个问题。查询扩展具有增强搜索引擎系...
- 梁一平
- 关键词:搜索引擎查询扩展查询日志
- 文献传递
- 一种多关系数据挖掘中元组ID传播的设计与实现
- 传统的多关系数据挖掘是在多个表中进行物理上的连接。这是一种低效率的方法。基于元组ID传播的虚拟连接可能缩小了存储空间,并提高了多关系数据挖掘的效率。本文提出了一种基于数据集用于元组ID传播的设计方法。实验表明,这种方法是...
- 梁一平邓左祥周小平
- 关键词:多关系数据挖掘数据集
- 文献传递
- 元搜索引擎研究
- 索引擎通过调用多个独立搜索引擎,从而提高了检索结果的覆盖面.本文简述了元搜索引擎的运作原理,研究了元搜索引擎的核心技术在于成员搜索引擎的选择,收集搜索引擎程序接口检索结果的优化。阐述了它的局限性在于成员搜索引擎的数量受限...
- 周小平梁一平邓左祥
- 关键词:元搜索引擎功能分析性能评价
- 网络蜘蛛Nutch的分析、定制与二次开发
- Nutch是一个开源的网络蜘蛛。利用Nutch可以快速抓取网页,并对网页进行解析,对解析的内容进行索引。Nutch可以快速地搭建出一个搜索引擎平台,但NUTCH不适合所有的应用场景。有时,我们需要根据具体情况对Nutch...
- 梁一平刘连芳周小平申文明
- 关键词:网络蜘蛛NUTCH定制二次开发
- 文献传递