国家自然科学基金(60970060)
- 作品数:4 被引量:10H指数:2
- 相关作者:张桂芸朱蔷蔷刘文龙陈喆赵子平更多>>
- 相关机构:天津师范大学河北大学更多>>
- 发文基金:国家自然科学基金天津市科技支撑计划重点项目博士科研启动基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于MapReduce框架一种文本挖掘算法的设计与实现被引量:4
- 2012年
- 随着文本挖掘在主动信息服务中应用的日益扩展,在文本数据的基础上分析数据的内在特征已经成为目前的研究趋势,本文在Hadoop平台上设计并实现了一种文本挖掘算法,该算法利用Ma-pReduce框架按照自然语料中相邻词组出现的频数进行降序输出,从而有助于用户挖掘大量数据中各项集之间的联系,实验结果体现了该算法的有效性和良好的加速比.
- 朱蔷蔷张桂芸刘文龙
- 关键词:HADOOPMAPREDUCE
- 基于加权信息熵相似性的协同过滤算法被引量:4
- 2012年
- 协同过滤算法是推荐系统中最为成功的技术之一,相似性计算是协同过滤算法的核心.针对传统的相似度计算方法在数据稀疏的情况下推荐不准确问题,提出了基于项目间差异信息熵的相似度计算方法,先通过差异值和共同评价数目对信息熵进行加权,再归一化处理来计算项目间的相似度.用基于项目(Item-based)相似性的协同过滤算法进行了实验验证,实验结果表明,该算法提高了个性化推荐精度.
- 刘文龙张桂芸陈喆朱蔷蔷
- 关键词:相似度计算协同过滤个性化推荐
- 基于边缘增强的多聚焦图像融合方法
- 2012年
- 提出一种基于边缘增强的多聚焦图像融合方法,对需要融合的2幅图像进行小波多尺度分解,根据绝对值最大的方法对高频细节分量图像进行融合,通过增强和提取原始图像的边缘信息强度指导低频近似分量的融合,以此突出融合图像中的边缘信息.采用信息熵和标准差等评价指标对该方法进行客观评价.结果表明:该方法融合效果良好,可以更好地突出低频域边缘细节信息,提高融合图像的清晰度,改善视觉效果.
- 万莉胡燕翔马希荣赵子平
- 关键词:多聚焦图像融合小波变换
- 基于Hadoop平台上面向电影数据集Kmeans算法的改进被引量:2
- 2012年
- 针对聚类算法并行化的需求,该文对基于Hadoop平台Kmeans算法进行了改进,选用Canopy算法对数据进行预处理,并在具有一定数据结构的电影数据集上进行了单机对比实验,集群加速比实验和集群扩展率实验,分别体现改进后算法实现的高效性、良好的加速比和可扩展性,从而可以有效地运用在实际海量数据挖掘中.
- 朱蔷蔷张桂芸刘文龙
- 关键词:HADOOPMAPREDUCE