付玥
- 作品数:2 被引量:11H指数:2
- 供职机构:东北石油大学更多>>
- 发文基金:国家科技重大专项更多>>
- 相关领域:自动化与计算机技术更多>>
- 半结构化数据语义分析与映射方法研究
- 半结构化数据的出现,带动了企业异构数据集成的发展。它的无模式和可以自描述的特点能够给应用带来很大的方便性,但结构与数据混淆的形式也给异构数据集成研究带来了难度。在异构数据集成的过程中,快速、有效地确定半结构化数据中数据项...
- 付玥
- 关键词:半结构化数据数据元相似度计算数据映射
- 文献传递
- 数据集成中数据项与数据元匹配算法被引量:8
- 2012年
- 近年来,随着数据元标准的建立,数据元在各行各业的数据集成过程中担任着重要角色,用于规范数据库、报表、文档中的数据项,实现各种数据源之间的映射。分析数据元的结构,提出一种数据项与数据元匹配算法,该算法基于编辑距离算法,融合最长公共子序列、权重、词语重心后移等思想,实现数据项与数据元字典中数据元的相似度计算,利用排列组合原理对匹配速度进行优化。以中石化标准数据元为实验数据进行实验,验证了该匹配算法的有效性。
- 文必龙付玥
- 关键词:最长公共子序列相似度计算数据元