您的位置: 专家智库 > >

卓林

作品数:7 被引量:9H指数:1
供职机构:中国人民银行更多>>
发文基金:国家自然科学基金江苏省基础研究计划江苏省重大科技支撑与自主创新项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 6篇期刊文章
  • 1篇学位论文

领域

  • 7篇自动化与计算...

主题

  • 4篇DEEP_W...
  • 3篇DEEP
  • 2篇信息抽取
  • 2篇增量式
  • 2篇数据源
  • 2篇本体
  • 2篇WEB
  • 2篇抽取
  • 1篇信息集成
  • 1篇语义相似
  • 1篇语义相似度
  • 1篇数据抽取
  • 1篇数据获取
  • 1篇数据获取技术
  • 1篇数据源发现
  • 1篇数据源选择
  • 1篇随机场
  • 1篇条件随机场
  • 1篇爬虫
  • 1篇启发式规则

机构

  • 6篇苏州大学
  • 4篇江苏省现代企...
  • 1篇中国人民银行

作者

  • 7篇卓林
  • 5篇崔志明
  • 5篇杨舟
  • 5篇赵朋朋
  • 3篇岳亮

传媒

  • 3篇苏州大学学报...
  • 2篇计算机工程
  • 1篇计算机光盘软...

年份

  • 1篇2012
  • 5篇2011
  • 1篇2010
7 条 记 录,以下是 1-7
排序方式:
Deep Web爬虫的一种增量式更新策略被引量:1
2011年
为了在网络及计算机硬件等资源有限的前提下,最大限度地保证本地副本的"新鲜"程度,往往需要为Deep Web爬虫定制一个重爬机制。为了满足这种需求,提出了一种基于采样的增量式Deep Web更新方法,使用贪心策略分配爬虫资源,以最大限地的提高资源利用率。经实验验证,该方法取得了比较优异的结果。
卓林杨舟岳亮赵朋朋崔志明
关键词:DEEPWEB
一种基于领域本体的Deep Web数据自动标注方法
2011年
为了准确全面地对Deep Web查询结果页面的数据进行语义标注,将领域本体作为Web数据库所应遵循的全局模式引入到语义标注的研究中,通过建立起接口模式、结果模式与本体间的映射来实现数据的自动语义标注。针对多个不同领域的Web数据库进行实验测试,证明了该方法是有效的。
杨舟岳亮卓林赵朋朋崔志明
关键词:DEEPWEB本体
基于本体和语义相似度的Deep Web数据源发现技术
2012年
Deep Web数据源发现是指从Web中搜索到含有Web数据库的Deep Web站点。查询接口作为DeepWeb数据源信息访问的唯一入口,发现工作更多地转向了对查询接口的判定。本文在处理时,首先构建领域本体模型,并利用HowNet语义知识辞典进行语义相似度计算,完成查询接口判定工作,同时通过启发式规则提高查询接口判定的效率。
卓林
关键词:DEEP语义相似度启发式规则
一种针对商品数据记录的自动抽取方法被引量:8
2010年
提出一种针对电子商务网站商品列表页数据记录的自动抽取方法。该方法根据商品记录的特点,通过商品记录中商品的文本、图片以及布局等节点类型信息计算节点对应的值,依据节点值的相似度对节点进行分组,再从不同分组中过滤出包含数据记录节点的集合,从而抽取整个页面的数据记录。实验结果证明该方法有效且抽取效率较高。
杨舟卓林赵朋朋崔志明
关键词:WEB信息抽取数据抽取信息集成
基于二维混合条件随机场的Web记录抽取模型
2011年
提出一种基于混合二维条件随机场的Web记录抽取模型,以克服线性链条件随机场不能充分利用Web实体间二维依赖关系的缺点,且训练条件随机场模型时无需大量手工标注的样本数据。对当当网上的742个数据记录进行抽取,对比同等情况下的其他模型。实验结果表明,混合二维条件随机场模型在抽取TDS数据集时展现了更优越的性能。
卓林杨舟赵朋朋崔志明
关键词:条件随机场信息抽取
一种面向Deep Web集成服务的查询结果动态排序方法
2011年
Deep Web集成服务的快速发展,方便了用户对Deep Web信息检索需求。如何提高查询结果的排序效果,将最接近用户查询的结果显示给用户,逐渐成为研究重点。提出了一种综合评判方法,从数据源质量、查询相关度以及查询响应反馈三个方面,综合计算出查询结果的评价分值,并用于查询结果排序,具有较好的可行性和有效性。
岳亮杨舟卓林赵朋朋崔志明
关键词:数据源选择TF-IDF
增量式Deep Web数据获取技术研究
随着WWW的飞速发展,Deep Web中蕴含了海量的可供访问的信息,并且还在迅速增加。高速增长的Deep Web信息已经成为人们获取信息的一个重要来源。但由于其本身异构性和动态性的特征,用户必须面对和克服信息发现的主要问...
卓林
关键词:数据源发现
文献传递
共1页<1>
聚类工具0