杨苗苗
- 作品数:5 被引量:2H指数:1
- 供职机构:南京邮电大学通信与信息工程学院更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于云平台的电信数据仓库文件备份和分布动态调整算法
- 2014年
- Hadoop利用统一的备份机制来确保数据的可用性和容错性。然而对于重要的文件块,只能通过修改配置文件来设置副本数量。通过分析电信业数据仓库文件的访问情况,提出文件备份与存放动态调整算法(BPDA)来提高数据局部性,以减少数据传输带来的I/O和网络消耗,提高查询效率。运用多副本一致性哈希算法,概率采样和竞争力弱化算法,得到每一个文件的最佳备份数和备份位置。实验结果验证了该算法可以提高查询关联效率。
- 杨苗苗李跃辉刘静许静
- 关键词:HADOOPMAPREDUCE备份
- 基于MapReduce的电信客户流失决策树算法研究
- 2013年
- 针对传统的关系型数据管理技术在电信企业面对海量数据对客户流失进行分析研究时存在的海量存储能力和计算能力不足的问题,提出了一种基于MapReduce架构的并行决策树算法,该算法采用校正系数来避免ID3算法多值偏向问题,并应用于客户流失分析中。在Hadoop集群平台上的结果分析表明:基于MapReduce并行模型能够解决电信企业进行客户流失分析时处理大规模数据的问题,在保证分类准确率的情况下能获得趋近线性的加速比,并具有较好的扩展性。
- 刘静李跃辉杨苗苗许静
- 关键词:MAPREDUCE决策树客户流失
- 基于Hadoop的电信频繁交往圈算法研究被引量:1
- 2013年
- 通过研究电信社交网络的个人交往圈和客户群,结合有向图和无向图,采用邻接链表,挖掘极大团,提出基于Ma-pReduce的频繁交往圈算法F-Graph,不仅找到频繁交往圈和客户群中的核心用户,同时减小了算法复杂度。利于运营商做出更科学的决策,提高市场竞争力。
- 杨苗苗李跃辉刘静许静
- 关键词:HADOOPMAPREDUCE数据挖掘
- 基于Hadoop的电信社交网络研究与分析
- 电信拥有海量的客户数据,包含着大量的潜在价值。随着结构化和非结构化数据的不断增长,电信行业处理海量数据的效率越来越低,难以对海量数据进行深度挖掘。云计算的发展有效地解决了这个难题,开源的Hadoop云平台被广泛应用到各个...
- 杨苗苗
- 关键词:HADOOPMAPREDUCE备份机制图算法
- 文献传递
- 基于OCDM的PON监控技术研究
- 2014年
- 讨论了OCDM在无源光网络监控系统中的应用,介绍了基于OCDM的1D码、周期码方案及其监控原理。分析了两种监控方案中误码率与用户数、误码率与门限值的关系。仿真结果表明,与1D码相比,周期码具有更好的码字特性,更能满足当前PON监控系统多用户、高信噪比的要求。
- 许静李跃辉杨苗苗刘静季培培
- 关键词:无源光网络光码分复用