中央高校基本科研业务费专项资金(N090304007) 作品数:4 被引量:53 H指数:3 相关作者: 王国仁 信俊昌 白梅 东韩 黄山 更多>> 相关机构: 东北大学 国家海洋信息中心 更多>> 发文基金: 中央高校基本科研业务费专项资金 国家自然科学基金 国家杰出青年科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
不确定数据流上的概率反轮廓查询处理 被引量:5 2011年 反轮廓查询在制定有效的市场决策方面具有重要的作用,随着数据流特征和不确定性的表现日益明显,不确定数据流上概率反轮廓查询已经成为一个新的研究课题.为了高效解决不确定数据流上概率反轮廓查询问题,首先,通过对实际应用需求进行分析,提出了不确定数据流上概率反轮廓查询的定义,并根据相关概念,提出了不确定数据流上概率反轮廓查询的索引模型;其次,通过对不确定数据流上概率反轮廓的性质进行深入分析,提出了一种新颖高效的基于R-tree的不确定数据流上概率反轮廓查询算法RT2RS,该算法运用了高效的剪枝策略,避免了大量的无效运算;最后,通过大量的仿真实验对RT2RS性能进行了验证.实验结果表明,RT2RS是解决不确定数据流上概率反轮廓查询的有效方法,大大减少了不确定数据流上概率反轮廓查询的运行时间,能够满足实际应用需求. 白梅 信俊昌 东韩 王国仁关键词:不确定性 数据流 R-树 一种ρ-支配轮廓查询的高效处理算法 被引量:5 2011年 近年来,作为重要的多目标决策手段的轮廓查询逐渐得到学术界的重视,相继提出了基于不同支配关系的多种轮廓变体查询.首先,通过对实际应用需求进行分析,提出了基于元组对应数值间比例值大小的ρ-支配关系的定义,进而提出了ρ-支配轮廓查询的概念.其次,对ρ-支配轮廓的基本性质进行了细致而深入的分析,在此基础上,提出了基于分支定界的ρ-支配轮廓查询算法(Branch and Boundρ-Dominant Skyline Algorithm,BBDS),避免了对R-树索引的多次访问,从而提高了ρ-支配轮廓查询的执行效率.最后,通过大量的仿真实验对ρ-支配轮廓查询的语义进行分析,并对BBDS算法的性能进行验证.实验结果表明,ρ-支配轮廓查询是轮廓查询语义的扩展和补充,而提出的BBDS算法则是求解ρ-支配轮廓查询的高效算法. 信俊昌 白梅 东韩 王国仁关键词:轮廓查询 基于状态空间搜索的不确定轮廓查询算法 2010年 针对阈值轮廓查询忽略了轮廓的整体性,只考虑单个对象成为轮廓中对象的现象,深入地研究了不确定数据库中的轮廓查询处理技术.首先,提出了将对象集合作为整体考虑其轮廓概率的不确定轮廓查询的定义;其次,通过对其性质的分析,提出了基于状态空间搜索的基本的不确定轮廓算法(BUS);接着,通过进一步分析,在BUS算法的基础上,增加了有效的过滤策略,提出了改进的不确定轮廓算法(IUS).实验结果表明,加入了改进策略的IUS算法明显优于BUS算法,验证了改进策略的有效性. 信俊昌 黄健美 王国仁 公丕臻关键词:不确定性 基于Map-Reduce的海量数据高效Skyline查询处理 被引量:46 2011年 Skyline查询已成为现今数据库和信息检索领域的研究热点之一,伴随着人类可以采集和利用的数据信息的急剧增长,使得如何处理海量数据的Skyline查询成为急需解决的问题.近年来兴起的Map-Reduce编程框架能够有效地处理基于海量数据的应用,该文既是研究如何运用Map-Reduce编程框架解决海量数据的Skyline查询问题.在Map-Reduce框架下处理Skyline查询的直接方法是扫描整个数据集进而得到查询结果,但是在海量数据Skyline查询问题中,查询结果的数量远小于原始数据集的数据量,对此该文提出了一系列的Skyline查询算法及优化,有效地过滤掉部分不能成为Skyline查询结果的数据对象,大幅度提高了在Map-Reduce框架下处理Skyline查询的效率.大量运行在Hadoop平台上的实验验证了该文所提出的Skyline查询处理算法具有良好的有效性、准确性和可用性. 丁琳琳 信俊昌 王国仁 黄山关键词:SKYLINE查询 MAP-REDUCE 海量数据 HADOOP