奚伟鹏
- 作品数:4 被引量:14H指数:2
- 供职机构:南京大学计算机科学与技术系计算机软件新技术国家重点实验室更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 面向网上论坛的信息抽取技术被引量:10
- 2005年
- 在分析了网上论坛内部的信息组织模式和链接结构的基础上,提出了一套面向网上论坛的语义话题线索抽取框架,叙述了其具体 实现。为信息抽取定义了完善的抽取规则规范,提供了用户定制规则的可视化工具和论坛站点中语义信息单元自动下载抽取的后台引擎。
- 奚伟鹏李昕蒋凯武港山
- 关键词:信息抽取包装器
- Web智能信息服务系统的设计与实现被引量:3
- 2004年
- Web信息的快速增长和人们对信息需求的不断提高 ,使得用户越来越难获得其需要的信息。为了解决这些问题 ,介绍了一个智能化的Web信息服务系统的设计及其实现 ,它能够使用户更好地获得并使用信息。对系统的基本框架。
- 陈康奚伟鹏蒋凯武港山
- 关键词:信息服务关键词提取信息分类信息检索
- 面向Web论坛的信息抽取技术研究
- 随着Internet技术的不断发展,基于Web方式的论坛得到了越来越广泛的应用,随着时间的推移,这些论坛站点中积累了丰富的信息资源。然而,由于论坛站点本身的特点,至今缺乏行之有效的方法处理这些信息资源。在这种情况下,面向...
- 奚伟鹏
- 关键词:互联网论坛信息收集信息抽取
- 文献传递
- 超链语义分类系统的设计与实现被引量:1
- 2004年
- 提出了一套超链语义分类框架,并详细叙述了其具体实现。该分类系统对反映超链内容语义的各种相关特征进行自动提取以及量化处理,并采用基于决策树的分类方法,使用C4.5机器学习算法,通过对大量人工标注超链样本的学习进行特征优化和选择,形成分类规则。该分类系统,从超链的语义角度研究了Web中超链的类别,有助于对Web上的资源进行更加有效的自动化处理,并在更深层次上挖掘Web结构信息。
- 奚伟鹏李昕武港山
- 关键词:超链语义WEB信息挖掘