陈垚
- 作品数:4 被引量:11H指数:2
- 供职机构:厦门大学信息科学与技术学院计算机科学系更多>>
- 发文基金:国家自然科学基金福建省自然科学基金黑龙江省教育厅科学技术研究项目更多>>
- 相关领域:自动化与计算机技术生物学更多>>
- 基于Hadoop的大矩阵乘法处理方法
- 目前的矩阵乘法算法无法处理大规模和超大规模的矩阵,而随着MapReduce编程框架的提出,并行处理矩阵乘法成为解决大矩阵运算的主要手段.总结了矩阵乘法在MapReduce编程模型上的并行实现方法,并提出了实现高性能大矩阵...
- 孙远帅陈垚官新均林琛
- 关键词:并行处理海量数据
- 文献传递
- 基于Hadoop的大矩阵乘法处理方法被引量:8
- 2013年
- 目前的矩阵乘法算法无法处理大规模和超大规模的矩阵,而随着MapReduce编程框架的提出,并行处理矩阵乘法成为解决大矩阵运算的主要手段。总结了矩阵乘法在MapReduce编程模型上的并行实现方法,并提出了实现高性能大矩阵乘法的策略———折中单个工作节点的计算量和需要网络传输的数据量。实验证明,并行实现算法在大矩阵上明显优于传统的单机算法,而且随着集群中节点数目的增多,并行算法会表现出更好的性能。
- 孙远帅陈垚官新均林琛
- 关键词:矩阵乘法矩阵运算MAPREDUCEHADOOP并行计算海量数据
- 基于项目层次相似性的推荐算法被引量:3
- 2014年
- 针对协同过滤算法推荐效果依赖于相似度度量方法的问题,提出了一种基于项目层次结构相似度的推荐算法REHIS(recommendation hierarchical similarity)。首先利用关联规则挖掘和KNN(K nearest neighbor)算法完善项目层次结构,然后利用TopK算法计算项目之间的相似度,最后利用基于项目的协同过滤算法框架预测用户评分。为解决协同过滤算法扩展性差的问题,还把TopK算法推广到余弦距离和皮尔逊相关系数等常见的相似度度量方法。实验结果表明,与传统的协同过滤算法相比,REHIS能够获得更优的均方根误差,TopK算法可以减少最近邻项目的查找时间。
- 孙远帅陈垚刘向荣陈珂林琛
- 关键词:推荐系统协同过滤标签倒排索引
- 基于不同分类模型的基因芯片癌症诊断方法研究
- 2013年
- 基因芯片技术的发展为生物信息学带来了机遇,使在基因表达水平上进行癌症诊断成为可能。但基因芯片数据高维小样本的特征也使传统机器学习方法面临挑战。本文利用真实的基因表达数据,测试了目前主要的分类方法和降维方法在癌症诊断方面的效果,通过实验对比发现:基于线性核函数的支持向量机可以有效地分类肿瘤与非肿瘤的基因表达,从而为癌症诊断提供借鉴。
- 孙远帅陈垚玄萍江弋
- 关键词:基因芯片癌症诊断主成份分析