黎玲利
- 作品数:7 被引量:12H指数:2
- 供职机构:哈尔滨工业大学更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- EIF:一种基于关系的实体识别框架
- 在很多现实世界的应用中名字和实体间存在冲突,也就是说,不同的人或事物可能拥有同一个名字,同一个人或事物也可能用不同的名字指代.识别名字指代的实体是数据清洗和实体查询中的重要问题。当前的方法仅能够处理某种单一情况下的冲突,...
- 黎玲利王宏志高宏李建中
- 关键词:聚类技术
- 文献传递
- 实体识别关键技术的研究
- 实体识别在数据质量管理中起着重要地位。它是数据质量管理的重要研究方向。在一个或多个数据库中,同一个现实世界实体可能具有多种描述方式。实体识别的目的是识别出数据集中描述同一真实世界实体的元组。实体识别的结果可以在数据质量管...
- 黎玲利
- 关键词:数据质量
- XML数据流上的TOP-K关键字查询处理
- 利用关键字可以在模式未知的情况下对XML数据进行查询.提出了一种面向XML数据流的关键字查询技术——TOP-K关键字查询.这类查询在模式未知的情况下,对用户给出的关键字集合和结果个数K,随时给出接收到数据中前K个与关键字...
- 黎玲利王宏志李建中骆吉洲
- 关键词:XML数据数据流关键字查询TOP-K
- 文献传递
- XML数据流上Top-K关键字查询处理被引量:8
- 2012年
- 利用关键字可以在模式未知的情况下对XML数据进行查询.在当前的XML数据流上的关键字查询处理中,打分函数往往不能都满足各种用户不同的需求.提出了一种基于skyline的XML数据流上的Top-K关键字查询.对于这种查询,不需要考虑影响结果与查询相关性的复杂因素,只需利用skyline挑选与查询最相关的结果.提出了两种XML数据流上的有效的基于skyline的Top-K关键查询处理算法,包括对单查询和多查询的处理算法.通过扩展实验对两种算法的有效性和可扩展性进行了验证.经过实验验证,所提出的查询处理算法的效率几乎不受关键字个数、查询结果数量、查询数量等参数的影响,运行时间和文档大小大致呈线性关系.
- 黎玲利王宏志高宏李建中
- 关键词:数据流关键字查询TOP-KSKYLINE
- XML数据流上的TOP-K关键字查询处理
- 由于其灵活性和可扩展性,XML成为越来越多互联网上数据的表示标准。在一类应用中,XML数据表现为源源不断到来的数据片断,在这类应用中的XML数据称为XML数据流。XML数据流的应用包括网络信息订阅与发布、电子邮件监测等。...
- 黎玲利
- 关键词:XML数据流关键字查询TOP-K查询SKYLINE查询
- 文献传递
- XML数据流上的TOP-K关键字查询处理
- 利用关键字可以在模式未知的情况下对XML数据进行查询。提出了一种面向XML数据流的关键字查询技术——TOP-K关键字查询。这类查询在模式未知的情况下,对用户给出的关键字集合和结果个数K,随时给出接收到数据中前K个与关键字...
- 黎玲利王宏志李建中骆吉洲
- 关键词:XML数据流关键字查询TOP-K
- 文献传递
- 基于距离度量的实体识别算法被引量:1
- 2014年
- 传统的实体识别中,往往是利用字符串相似性函数来计算元组对在每个属性值上的相似度从而来判断其总的相似性(例如,元组对的相似性等于每个属性值上的相似度的加权求和)。然而这一类相似性测度不能够反映属性值内部不同的词在元组对相似性计算中的不同重要性。由于不能区分哪些词对元组对匹配更重要,就导致仍然存在某些匹配的元组相似性不高,而不匹配的元组相似性高的情况,故很难将匹配元组对和不匹配元组对有效区分开。为了解决这个问题,提出了以词为特征的距离度量函数,设计了基于词特征的距离度量学习算法,和基于距离度量的实体识别算法。扩展性实验对所提出的算法的有效性进行了验证。
- 黎玲利高宏