中央高校基本科研业务费专项资金(90304005)
- 作品数:2 被引量:19H指数:2
- 相关作者:申德荣于戈聂铁铮寇月李冬更多>>
- 相关机构:东北大学东软集团更多>>
- 发文基金:中央高校基本科研业务费专项资金国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- D-EEM:一种基于DOM树的Deep Web实体抽取机制被引量:17
- 2010年
- 随着Web数据库的不断增长,通过对Deep Web的访问逐渐成为获取信息的主要手段.如何有效地抽取Deep Web中结果页面所包含的实体信息成为一个值得研究的问题.通过分析Deep Web结果页面的特点,提出了一种基于DOM树的Deep Web实体抽取机制(DOM-tree based entity extraction mechanism for Deepweb,D-EEM),能够有效解决Deep Web环境中的实体抽取问题.D-EEM采用基于DOM树的自动实体抽取策略,利用DOM树中的文本内容和层次结构来确定数据区域和实体区域,提高了实体抽取的准确性;另外,提出了一种基于上下文距离和共现次数的语义标注方法,有效地将来自不同数据源的抽取结果进行合成.通过实验验证了D-EEM中所采用的关键技术的可行性和有效性,同其他实体抽取策略相比,D-EEM在抽取效率及抽取准确性等方面具有一定的优势.
- 寇月李冬申德荣于戈聂铁铮
- 关键词:DOM树DEEPWEB
- S-RSM:一种基于语义的数据空间资源搜索机制被引量:2
- 2011年
- 数据空间技术是数据库管理技术的进一步发展,如何有效地搜索数据空间中的资源成为一个值得研究的问题.为此提出一种基于语义的数据空间资源搜索机制(S-RSM,Semantics-based Resource Search Mechanism for Dataspace).定义了资源描述模型,能够有效地将数据资源进行统一描述和包装;提出一种基于语义的资源搜索策略,利用Dbped ia语义知识库评估资源对象关联和语义项关联.同其它搜索策略相比,S-RSM在查全率和查准率等方面具有一定的优势.
- 寇月申德荣聂铁铮赵宁于戈
- 关键词:数据空间语义资源描述