滕伟
- 作品数:10 被引量:160H指数:5
- 供职机构:上海交通大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- Web页面中文文本主题的自动提取研究被引量:23
- 2001年
- Internet上的内容日益增多 ,搜索引擎返回的结果往往冗长。本文首先讨论Web页面文本与一般文本的四个不同点 ,然后介绍一种以统计方法为主、以匹配校验为辅的Web页面中文文本主题自动提取方法 ,它能帮助用户在最短时间内了解当前页面的主题。实验显示 ,所提取的前15个字串 ,反映主题的平均正确率在 85%以上 ,而处理时间仅为几十到几百毫秒。
- 韩客松王永成滕伟
- 关键词:主题抽取加权主题标引
- 搜索引擎中Robot搜索算法的优化被引量:39
- 2002年
- 目前的搜索引擎越来越暴露出不足之处 ,当用户使用搜索引擎时输入特定关键词之后 ,返回的查询结果往往有数千甚至几百万之多 ,而且其中包含大量的重复信息与垃圾信息 ,用户从中筛选出自己感兴趣的网页仍然需要耗费很长的时间。另外一种情况就是 ,Web上明明存在某些重要网页 ,却没有被搜索引擎的robot发现。本文针对这种现象 ,重点讨论搜索引擎中的搜索策略 ,改善搜索算法 ,使Robot在搜索阶段就能够充分处理与Robot频繁交互的URL列表。根据网页的内容、HTML结构以及其中包含的超链信息计算网页的PageRank ,使URL列表能够根据重要性调整排列顺序。初步的试验结果表明 。
- 宋聚平王永成滕伟许欢庆
- 关键词:搜索引擎超链接ROBOTPAGERANK搜索策略搜索算法
- 开发具有独立版权的搜索引擎
- 该文用简明的语言介绍了开发具有中国独立版权的搜索引擎的必要性,对系统的性能要求及共总体结构。
- 王永成滕伟
- 关键词:搜索引擎总体结构
- 文献传递网络资源链接
- 对网页PageRank算法的改进被引量:68
- 2003年
- 分析了著名搜索引擎 Google采用的 Page Rank算法 ,指出其偏重旧网页、忽视专业站点以及对网页中的超链接评估不恰当等不足之处 .改进算法考虑了网页日期这一重要因素 ,并重新计算网页中超链接对网页的影响 .网页结构中蕴涵着丰富的信息 ,在 href、title等标记中文字对网页主题有重要作用 ,利用结构标记可以辅助判断网页的主题内容 .试验结果表明 。
- 宋聚平王永成尹中航滕伟
- 关键词:搜索引擎网页超链分析PAGERANK
- 面向主题的网页搜索系统被引量:19
- 2003年
- 论述一个面向主题的网页搜索系统 (SATWP) ,该系统在智能代理的辅助下具有搜索、导航、以及信息反馈等功能 .在判断网页与查询主题的相关度时改变了单纯的从网页内容上考虑的方法 ,即从网页自身的 URL、网页间的关系以及网页的内容来判断 .SATWP采用在客户端的智能代理记录用户的浏览行为 ,并把有关信息反馈给服务器 ,服务器根据这些信息随时调整数据库中相关网页的重要性顺序 ,增加了自身的学习功能 .试验结果表明 。
- 宋聚平王永成尹中航滕伟
- 关键词:搜索引擎超链分析
- 智能代理技术在新一代搜索引擎中的应用被引量:6
- 2000年
- 本文分析了当前中文搜索引擎存在的主要技术问题,指出缺乏中文信息处理技术和高级人工智能技术的支持是导致中文搜索引擎质量普遍偏低的重要原因之一,在此基础上提出了新一代中文智能搜索引擎的总体设计方案并详述了智能代理技术应用于新一代搜索引擎的具体方法,该方法能很好地适应Internet信息分布、变化快和增长快的特点.
- 滕伟王永成
- 关键词:搜索引擎计算语言学人工智能中文信息处理
- 智能代理技术在新一代搜索引擎中的应用
- 本文分析了当前中文搜索引擎存在的主要技术问题,指出缺乏中文信息处理技术和高级人工智能技术的支持是导致中文搜索引擎质量普遍偏低的重要原因之一,在此基础上提出了新一代中文智能搜索引擎的总体设计方案并详述了智能代理技术应用于新...
- 滕伟王永成
- 关键词:搜索引擎计算语言学人工智能中文信息处理智能代理
- 文献传递
- 开发具有独立版权的搜索引擎
- 该文用简明的语言介绍了开发具有中国独立版权的搜索引擎的必要性,对系统的性能要求及共总体结构。
- 王永成滕伟
- 关键词:搜索引擎总体结构
- 文献传递
- 智能代理技术在搜索引擎中的应用被引量:3
- 2001年
- 分析了当前中文搜索引擎存在的主要技术问题 ,指出缺乏中文信息处理技术和高级人工智能技术的支持是导致中文搜索引擎质量普遍偏低的重要原因之一。在此基础上提出了新一代智能搜索引擎的总体设计方案并详述了智能代理技术应用于新一代搜索引擎的具体方法。该方法能很好地适应Internet信息分布、变化快和增长快的特点。
- 滕伟王永成
- 关键词:搜索引擎计算语言学中文信息处理智能代理INTERNET
- 面向Web信息集成的Web信息抽取中若干关键问题的研究
- 网络技术的迅猛发展为信息集成技术带来了新的问题和挑战,面对Internet上异质、异构数据的大量涌入,信息集成技术的研究呈现出前所未有的生命力。Web信息集成系统为Web数据管理提供了一种全新的方法,它提供了一个访问We...
- 滕伟
- 关键词:信息集成信息抽取HOWNET
- 文献传递