您的位置: 专家智库 > >

重庆市自然科学基金(CTS2009817)

作品数:3 被引量:5H指数:1
相关作者:吴春明谢德体李盛瑜邹显春更多>>
相关机构:西南大学重庆工商大学更多>>
发文基金:重庆市自然科学基金中央高校基本科研业务费专项资金重庆市高等教育教学改革研究项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...

主题

  • 1篇神经网
  • 1篇神经网络
  • 1篇识别方法
  • 1篇特征抽取
  • 1篇匹配方法
  • 1篇向量
  • 1篇向量空间
  • 1篇向量空间模型
  • 1篇WEB
  • 1篇DEEP
  • 1篇DEEP_W...
  • 1篇抽取

机构

  • 3篇西南大学
  • 1篇重庆工商大学

作者

  • 3篇吴春明
  • 2篇谢德体
  • 1篇邹显春
  • 1篇李盛瑜

传媒

  • 3篇计算机科学

年份

  • 2篇2012
  • 1篇2011
3 条 记 录,以下是 1-3
排序方式:
基于领域特征文本的Deep Web分类研究被引量:4
2012年
Deep Web自动分类是建立深网数据集成系统的前提和基础。提出了一种基于领域特征文本的Deep Web分类方法。首先借助本体知识对表达同一语义的不同词汇进行了概念抽象,进而给出了领域相关度的定义,并将其作为特征文本选择的量化标准,避免了人为选取的主观性和不确定性;在接口向量模型构建中,考虑了不同特征文本对于分类作用的差异,提出了一种改进的W-TFIDF权重计算方法;最后采用KNN算法对接口向量进行了分类。对比实验证明,利用所提方法选择的特征文本是准确有效的,新的特征文本权重计算方法能显著地提高分类精度,且在KNN算法中表现出较好的稳定性。
吴春明谢德体
关键词:向量空间模型DEEPWEB
一种有效的标签抽取和匹配方法
2012年
标签抽取和匹配是查询接口理解的重要组成部分。提出了一种基于视觉的标签抽取和匹配方法,深入分析了相关匹配因子,给出了一种对查询接口表单进行重构的方法,它能依据接口HTML源代码自动还原出该表单的视觉布局特征。在最终的匹配算法中,综合考虑了基于label标记的匹配、基于文本语义的匹配以及基于位置特征的匹配。在8个领域共计277个查询接口上的实验证明了所提方法能取得较高的匹配精度。
邹显春吴春明李盛瑜
一种有效的深网入口识别方法被引量:1
2011年
深网入口自动识别是深网数据集成的前提和基础。由于表单在设计上具有较大的随意性,使得深网入口缺乏统一的构建标准,难以利用确定性的规则对其进行判断。首先基于统计特征,抽取了部分表单属性作为深网入口与非深网入口的可区分特征,在此基础上,提出了一种利用神经网络进行深网入口自动识别的方法。不同于基于规则的判断方法,神经网络是被训练的,不需要任何先验知识,这种特性使其非常适合于对具有复杂表现形式的深网入口进行判定。实验结果表明了该方法的有效性。
吴春明谢德体
关键词:神经网络特征抽取
共1页<1>
聚类工具0