国家自然科学基金(61073057)
- 作品数:6 被引量:21H指数:3
- 相关作者:张俊高燕于素华周新张晓民更多>>
- 相关机构:大连海事大学中国人民大学教育部更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金国家科技重大专项更多>>
- 相关领域:自动化与计算机技术更多>>
- 健康领域Web信息抽取被引量:6
- 2016年
- 针对Web信息抽取(WIE)技术在健康领域应用的问题,提出了一种基于Web Harvest的健康领域Web信息抽取方法。通过对不同健康网站的结构分析设计健康实体的抽取规则,实现了基于Web Harvest的自动抽取健康实体及其属性的算法;再把抽取的实体及其属性进行一致性检查后存入关系数据库中,然后对关系数据库中隐含健康实体的属性值利用Ansj自然语言处理方法进行实体识别,进而抽取健康实体之间的联系。该技术在健康实体抽取实验中,平均F值达到99.9%,在实体联系抽取实验中,平均F值达到80.51%。实验结果表明提出的Web信息抽取技术在健康领域抽取的健康信息具有较高的质量和可信性。
- 李汝君张俊张晓民桂小庆
- 关键词:信息抽取
- 一种模块化的多策略模糊本体映射方法被引量:2
- 2011年
- 通过分析模糊本体的特点,并结合模块化和多策略映射的优点,提出了一个面向语义Web的模糊本体模型,并针对该模型提出了一种模块化的多策略本体映射方法,以提高模糊本体映射的效率和准确率。最后对映射结果进行融合并采用迭代矫正的方法进行修复,使得映射结果更加准确可靠。
- 赵妍李冠宇饶章敏
- 关键词:模糊本体
- NoSQL数据管理技术被引量:8
- 2013年
- 社交网络和微博等新型应用对数据管理技术提出了新的挑战,如海量数据高效存储、高并发访问、高可扩展性和高可用性等。而传统的关系数据库技术无法满足这些新型应用的需求,因此,NoSQL数据管理技术的研究、开发和应用越来越受到重视。本文从NoSQL数据模型、数据存储、查询处理以及SQL与NoSQL混合数据库解决方案等方面,综述了NoSQL数据管理技术发展现状和趋势,并介绍了几种典型的NoSQL产品。
- 张俊周新于素华高燕
- 关键词:NOSQL数据管理技术SQL
- 一种RDF图的语义相似性度量方法被引量:3
- 2013年
- 在资源描述框架(RDF)图的语义相似性度量过程中,结构相似性和语义相似性计算不精确。针对该问题,提出结构语义(SAS)方法。结合改进的基于网络距离模型的语义距离公式、基于信息量模型的权重度量机制,计算概念节点的语义相似度,完善RDF图语义相似度算法,分析结构、深度和密度对RDF图语义相似性度量的影响。设计并实现原型系统,实验结果表明,该方法可有效保证RDF图的语义相似度与实际相符。
- 刘建明史一民张俊陈存衡
- 关键词:语义匹配语义距离
- 一种层次聚类的RDF图语义检索方法研究被引量:2
- 2012年
- 针对当前信息资源描述框架(RDF)检索过程中存在的内存使用过大及检索效率低等问题,提出一个RDF图的层次聚类语义检索模型,设计并实现了相应的检索方法。首先从RDF图中抽取实体数据,在本体库的指导下,通过层次聚类,将复杂的图形结构转换为适合检索的树型结构;根据在树中查找到的目标对象,确定其在RDF图中的位置,进行语义扩充查询。检索模型的构建缩小了检索范围,从而提高了检索效率,其语义扩充查询还可以得到较好的查全率。
- 刘宁左凤华张俊
- 关键词:层次聚类语义检索向量空间模型
- 嵌入图数据库的检索算法研究
- 2013年
- 为实现大规模数据下关系数据库的信息检索,在现有关系数据库对象级别建模思想的基础上,提出了基于对象实体完整性的建模方法。利用嵌入图数据库的方式,实现了关系数据库对象级别信息检索算法。通过将图数据库与关系数据库相结合,为解决检索大规模数据时带来的内存溢出问题提供了思路。设计了原型系统,并通过实验验证了该算法的有效性和可行性。
- 于素华张俊高燕
- 关键词:关系数据库信息检索