您的位置: 专家智库 > >

田建伟

作品数:8 被引量:45H指数:4
供职机构:武汉大学计算机学院更多>>
发文基金:国家自然科学基金湖北省自然科学基金更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 7篇期刊文章
  • 1篇学位论文

领域

  • 8篇自动化与计算...
  • 1篇语言文字

主题

  • 6篇DEEP_W...
  • 2篇数据提取
  • 2篇接口
  • 1篇形式概念分析
  • 1篇中间软件
  • 1篇容差
  • 1篇容差关系
  • 1篇深网
  • 1篇属性值
  • 1篇树模型
  • 1篇数据抽取
  • 1篇数据集
  • 1篇数据集成
  • 1篇数据集成技术
  • 1篇数据挖掘
  • 1篇数据质量
  • 1篇频繁项
  • 1篇频繁项集
  • 1篇频繁项集挖掘
  • 1篇频繁项集挖掘...

机构

  • 8篇武汉大学
  • 1篇湖北大学
  • 1篇武汉理工大学

作者

  • 8篇田建伟
  • 6篇李石君
  • 4篇余伟
  • 2篇张卓
  • 2篇洪辉
  • 1篇陈莘萌
  • 1篇余丹
  • 1篇张乃洲
  • 1篇文利娟

传媒

  • 2篇计算机研究与...
  • 2篇小型微型计算...
  • 1篇模式识别与人...
  • 1篇计算机科学
  • 1篇计算机技术与...

年份

  • 2篇2011
  • 3篇2010
  • 1篇2008
  • 2篇2007
8 条 记 录,以下是 1-8
排序方式:
基于语义的中文Deep Web查询接口集成被引量:14
2008年
现在网上信息正越来越被在线数据库深化,而传统的搜索引擎对此类信息源却没有很好的获取办法,加剧了人们想得到有用知识而搜索结果并不理想的形势。本文针对这种情况,简要论述了中文Deep Web研究工作的必要性及其发展前景,探讨了中文Deep Web技术的关键问题,并基于中文语义,提出了中文Deep Web中的查询接口集成方案。实验表明该方法能使得接口之间属性匹配的正确率达到98%以上。
洪辉李石君余伟田建伟
关键词:深网接口集成
面向领域的高质量Deep Web数据集成技术研究
按照信息蕴藏的深度,Web分为Surface Web和Deep Web两大部分。其中,Surface Web是由超链接连接起来的静态网页,其内容能够为当前的通用搜索引擎索引和检索。而Deep Web是指访问在线数据库而动...
田建伟
关键词:数据提取层次树
文献传递
基于数据质量的Deep Web数据源排序被引量:8
2010年
Deep Web技术使得大量隐藏在接口背后的有用信息更容易被用户查找到.然而,随着数据源的增多,如何从众多的数据源中快速地找到合适的结果这一问题变得越来越重要.通过传统的链接分析方法和相关性评估方法来对数据源进行排序,已经不能满足高精度的要求.提出一种通过抽样方法和数据质量评估来判断数据源的优劣性的算法.本文提出的抽样方法,改进了分层抽样和雪球抽样,使得在较少的样本点时,能够准确的反映整体特征.定义了能基本反映数据源的优劣程度的6个主要质量标准,并给出计算方法;通过质量标准,结合权重向量来量化数据源的质量.实验通过对数据源进行抽样分析,求解数据源得分的期望值,并根据该期望值对数据源进行了整体排序.结果表明,利用抽样对数据源的数据质量进行估计和评分,具有很好的准确性和可操作性.
余伟李石君文利娟田建伟
关键词:抽样估计数据质量
基于覆盖关系的Deep Web数据源排名被引量:5
2007年
Deep Web是隐藏在Web数据库中的结构数据,只能通过查询接口访问.目前大部分针对排名的研究都只停留在对Deep Web接口特征的分析上.利用抽样理论知识,将在Deep Web中进行的每一次检索行为看做是一次抽样,检索的结果是抽样结果.通过选择合适的抽样方法,使抽样所反映出来的部分数据覆盖关系能够从一定程度上反映整个Deep Web的数据覆盖关系.进而通过对覆盖关系的估计,确定覆盖程度,并按其进行排名.
余伟李石君洪辉田建伟
关键词:DEEPWEB抽样方法
基于格空间的受限Deep Web数据抽取算法被引量:3
2011年
将返回结果受限的Deep Web数据源中预测查询结果大小并且抽取的问题转化为概念覆盖问题.首先证明由属性及属性组合产生的集合划分之间为容差关系,进而又证明其构成一个完全格,并且与概念格同态.使用概念间的偏序关系来刻画属性间的相关性,使用概念内涵为查询属性,概念外延为返回结果的预测,基于外延的势剪枝后的概念格为搜索空间,最终提出一种基于格空间的Deep Web数据抽取算法.实验由可控实验和实际应用实验组成,结果证明该算法理论正确性和现实应用的可行性及有效性.
张卓李石君张乃洲田建伟
关键词:数据抽取容差关系形式概念分析概念格
基于Iceberg概念格叠置半集成的全局闭频繁项集挖掘算法被引量:4
2010年
研究专有的分布式数据挖掘算法是提高分布式数据库下数据分析和挖掘的有效方法.结合Iceberg概念格对于频繁项集精简表达的特性和其集成构造过程可并行化的特点,进而实现分布式全局闭频繁项集的挖掘.面对目前仍然缺乏有关Ice-berg概念格分布式集成构造研究的文献,本文从理论上分析Iceberg概念格叠置集成构造全局Iceberg概念格的局限性,然后论证了基于Iceberg概念格叠置半集成构造全局Iceberg概念格的可行性,进而提出一个基于Iceberg概念格叠置半集成的频繁概念生长分布算法(Frecogd),并且把它应用于同构分布式环境下的全局闭频繁项集挖掘过程中。实验验证了该算法理论的可行性,同时也揭示了该算法的挖掘效能有待进一步的改进与提高.
张卓李石君余伟田建伟
关键词:分布式数据挖掘
SLeD中QTI服务的实现
2007年
当前IMS Learning Design(IMS LD)规范中虽然整合了QTI(Question and Test Interoperability)规范,但是在当前的播放器中却没有很好地整合QTI服务,这就阻碍了播放器和QTI之间的通信,从而不能很好地实现QTI服务。文中针对SLeD体系结构,在该体系结构中加入了中间软件层,利用这个中间软件层实现了播放阶段QTI和播放器的通信。
田建伟余丹陈莘萌
关键词:IMSLEARNINGDESIGNSLEDQTI
基于层次树模型的Deep Web数据提取方法被引量:16
2011年
网络在成为信息查询和发布平台的同时,海量的信息隐藏在查询受限的Web数据库中,使得人们无法有效地获取这些高质量的数据记录.传统的Deep Web搜索研究主要集中在通过关键字接口获取Web数据库内容.但是,由于Deep Web具有多属性和top-k的特点,基于关键字的方法具有固有的缺点,这就为Deep Web查询和检索带来了挑战.为了解决这个问题,提出了一种基于层次树的DeepWeb数据获取方法,该方法可以无重复和完整地提取Web数据库中的数据记录.该方法首先把Web数据库模型化为一棵层次树,Deep Web数据获取问题就转化为树的遍历问题.其次,对树中的属性排序,缩小遍历空间;同时,利用基于属性值相关度的启发规则指导遍历过程提高遍历效率.最后,在本地模拟数据库和真实Web数据库上的大量实验证明,这种方法可以达到很好的覆盖度和较高的提取效率.
田建伟李石君
关键词:数据提取互信息
共1页<1>
聚类工具0