您的位置: 专家智库 > >

文利娟

作品数:2 被引量:9H指数:1
供职机构:武汉理工大学理学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇期刊文章
  • 1篇学位论文

领域

  • 2篇自动化与计算...

主题

  • 1篇社区网络
  • 1篇数据挖掘
  • 1篇数据质量
  • 1篇排序
  • 1篇网络
  • 1篇网络服务
  • 1篇WEB社区
  • 1篇DEEP_W...
  • 1篇抽样估计

机构

  • 2篇武汉理工大学
  • 1篇武汉大学

作者

  • 2篇文利娟
  • 1篇余伟
  • 1篇田建伟
  • 1篇李石君

传媒

  • 1篇小型微型计算...

年份

  • 1篇2010
  • 1篇2009
2 条 记 录,以下是 1-2
排序方式:
Web社区中话题的发现与排序
随着Web社区的蓬勃发展,互联网正逐步跨入社区时代。Web社区以其开放性、互动性和共享性深得广大网民的喜爱,成为网民表达思想、获取信息、互相交流以及建立社交圈的主要平台。如何对社区中的资源进行分类、整理、排序,将优质、有...
文利娟
关键词:社区网络网络服务数据挖掘
文献传递
基于数据质量的Deep Web数据源排序被引量:8
2010年
Deep Web技术使得大量隐藏在接口背后的有用信息更容易被用户查找到.然而,随着数据源的增多,如何从众多的数据源中快速地找到合适的结果这一问题变得越来越重要.通过传统的链接分析方法和相关性评估方法来对数据源进行排序,已经不能满足高精度的要求.提出一种通过抽样方法和数据质量评估来判断数据源的优劣性的算法.本文提出的抽样方法,改进了分层抽样和雪球抽样,使得在较少的样本点时,能够准确的反映整体特征.定义了能基本反映数据源的优劣程度的6个主要质量标准,并给出计算方法;通过质量标准,结合权重向量来量化数据源的质量.实验通过对数据源进行抽样分析,求解数据源得分的期望值,并根据该期望值对数据源进行了整体排序.结果表明,利用抽样对数据源的数据质量进行估计和评分,具有很好的准确性和可操作性.
余伟李石君文利娟田建伟
关键词:抽样估计数据质量
共1页<1>
聚类工具0