黄鑫
- 作品数:8 被引量:0H指数:0
- 供职机构:中国科学院深圳先进技术研究院更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种并行处理方法及装置
- 本发明适用于信息处理技术领域,提供了一种并行处理方法及装置,应用于包含多个终端设备的系统,所述方法包括:在各终端设备并行构建广义后缀树;基于构建的广义后缀树,通过MapReduce在各终端设备查找候选频繁模式;通过Map...
- 黄鑫罗军
- 文献传递
- 一种海量遥感数据的云存取方法
- 本发明提供的海量遥感数据的云存取方法,基于Hadoop构建所述遥感数据云计算平台,再根据所述遥感数据的分辨率构建所述遥感数据的遥感图像金字塔,按所述遥感图像金字塔,将所述遥感图像分割成若干切片,合成上述所有切片以形成完整...
- 陈会娟钱静刘萍郑茂恭黄鑫
- 一种海量遥感数据的云存取方法
- 本发明提供的海量遥感数据的云存取方法,基于Hadoop构建所述遥感数据云计算平台,再根据所述遥感数据的分辨率构建所述遥感数据的遥感图像金字塔,按所述遥感图像金字塔,将所述遥感图像分割成若干切片,合成上述所有切片以形成完整...
- 陈会娟钱静刘萍郑茂恭黄鑫
- 文献传递
- 一种检测出租车改装计价器行为的方法、系统及计算机
- 本发明适用于信息技术领域,提供了一种检测出租车改装计价器行为的方法:获取某出租车一定时间段的GPS营运轨迹数据和计价器营运数据,根据事先计算的计价器和GPS设备的时钟偏移值t,对获取的计价器营运数据进行时间偏移;对计算出...
- 郑茂恭钱静陈会娟黄鑫陈曦周启鸣
- 文献传递
- 一种检测出租车改装计价器行为的方法、系统及计算机
- 本发明适用于信息技术领域,提供了一种检测出租车改装计价器行为的方法:获取某出租车一定时间段的GPS营运轨迹数据和计价器营运数据,根据事先计算的计价器和GPS设备的时钟偏移值t,对获取的计价器营运数据进行时间偏移;对计算出...
- 郑茂恭钱静陈会娟黄鑫陈曦周启鸣
- 文献传递
- 基于最小生成树的大规模数据分类模型及其MapReduce实现(英文)
- 2013年
- 数据的快速增长,为我们提供了更多的信息,然而,也对传统信息获取技术提出了挑战。这篇论文提出了MCMM算法,它是基于MapReduce的大规模数据分类模型的最小生成树(MST)的算法。它可以看做是介于传统的KNN方法和基于聚类分类方法之间的模型,旨在克服这两种方法的不足并能处理大规模的数据。在这一模型中,训练集作为有权重的无向完全图来处理。顶点是对象,两点之间边的权重是对象间的距离。这一距离,不同于欧几里得距离,它是一个特定的距离度量。这样,可以找到图中最小生成树集,其中,图中每棵树代表一个类。为了降低时间复杂度,提取了每棵树中最具代表性的点来代表该树。这些压缩了的点集,可以通过计算无标签对象和它们之间的距离,来进行分类。MCMM模型基于MapReduce实现并且部署在Hadoop平台。该模型可扩展处理大规模的数据,是因为Hadoop支持数据密集分布应用,并且这些应用可以和数以千计的节点和数据一起运作。另外,MapReduce和Hadoop能在由商品机组成的集群上很好的运行。MCMM模型使用云平台并且通过使用MapReduce和Hadoop进行云计算是有益处的。实验采用的数据集包括从UCI数据库得到的真实数据和一些模拟数据,实验使用了4000个集群。实验表明,MCMM模型在精确度和扩展性上优于KNN和其他一些经常使用的基础分类方法。
- 黄鑫罗军
- 关键词:最小生成树MAPREDUCE云计算
- 一种并行处理方法及装置
- 本发明适用于信息处理技术领域,提供了一种并行处理方法及装置,应用于包含多个终端设备的系统,所述方法包括:在各终端设备并行构建广义后缀树;基于构建的广义后缀树,通过MapReduce在各终端设备查找候选频繁模式;通过Map...
- 黄鑫罗军
- 文献传递
- 一种广义后缀树快速遍历的方法及系统
- 本发明适用于计算机科学领域,提供了一种广义后缀树快速遍历的方法,包括:为广义后缀树的数据结构添加第一属性,以更改所述广义后缀树的数据结构;为广义后缀树节点的数据结构添加第二属性,以更改所述广义后缀树节点的数据结构;利用更...
- 黄鑫罗军
- 文献传递