张旭光
- 作品数:5 被引量:14H指数:2
- 供职机构:新疆财经大学统计与信息学院更多>>
- 发文基金:新疆维吾尔自治区自然科学基金国家自然科学基金博士科研启动基金更多>>
- 相关领域:自动化与计算机技术医药卫生文化科学经济管理更多>>
- 供给侧改革视域下体育产业发展现状、问题及对策被引量:1
- 2018年
- 在新常态经济下,传统经济增长方式弊端逐步显现,加快经济结构调整和改革是目前经济改革的重点。如何在传统增长方式不足的情况下,促进体育产业的又一次发展,是当前思考的主要问题。文章首先对我国体育产业的现状进行分析,其次对我国体育产业所遇到的问题进行解读,最后结合供给侧改革内容就如何加强我国体育产业改革、突破体育产业目前的困境提出相关的对策和建议。
- 张旭光
- 关键词:体育产业无效供给
- 基于朴素贝叶斯分类方法对公民身体健康状况的研究被引量:1
- 2019年
- 肥胖问题一直是人类难以摆脱的健康问题。为了更深入了解肥胖问题,本文从KDD Dataset下载有关公民身体各项指标的有关调查数据,选择的主要指标有性别(Gender)、种族(Race_Ethnicity)、婚姻状况(Marital_Status)、身体质量指数(BMI)、腰围(Waist)共5项指标来反映公民健康情况。本文使用数据挖掘分类规则中的朴素贝叶斯分类进行分析,对样本所属分类进行预测。
- 张旭光
- 关键词:数据挖掘朴素贝叶斯
- 基于Spark的ItemBased推荐算法性能优化被引量:8
- 2017年
- MapReduce计算场景下,复杂的大数据挖掘类算法通常需要多个MapReduce作业协作完成,但多个作业之间严重的冗余磁盘读写及重复的资源申请操作,使得算法的性能严重降低。为提高Item Based推荐算法的计算效率,首先对MapReduce平台下Item Based协同过滤算法存在的性能问题进行了分析;在此基础上利用Spark迭代计算及内存计算上的优势提高算法的执行效率,并实现了基于Spark平台的Item Based推荐算法。实验结果表明:当集群节点规模分别为10与20时,算法在Spark中的运行时间分别只有MapReduce中的25.6%及30.8%,Spark平台下的算法相比MapReduce平台,执行效率整体提高3倍以上。
- 廖彬张陶国冰磊于炯张旭光刘炎
- 关键词:协同过滤MAPREDUCE
- 基于GraphX传球网络的传球质量量化研究被引量:2
- 2017年
- 虽然大数据技术在不断成熟,但它在竞技体育领域的相关应用研究还处于探索阶段。常规篮球统计缺乏对传球数据的记录,更缺乏对传球数据的统计分析、价值挖掘及应用等方面的研究。首先,在GraphX基础上将传球数据构建成图,为传球质量的研究奠定基础;其次,提出传球质量评估方法PESV(Pass Expectation Score Value),相比于传统的助攻数与失误数的比值ATR(Assist Turnover Ratio),PESV能更全面地评价球员传球的质量;最后,介绍基于传球网络及传球质量评估方法 PESV的几种应用场景,包括传球质量对比赛结果的影响分析、基于PESV值的传球路线选择,并以华人球员林书豪为例,计算其2015-2016赛季的传球得分期望值。
- 廖彬张陶国冰磊于炯牛亚锋张旭光刘炎
- Spark DAG优化MapReduce协同过滤算法被引量:3
- 2017年
- 大数据的规模效应给数据存储、管理以及数据分析带来了极大的挑战,高效率低成本的大数据处理技术成为学术界及工业界的研究热点。为提高协同过滤算法的执行效率,对MapReduce架构下的算法执行步骤进行了分解,并对算法执行缺陷进行了分析。结合Spark适于迭代型及交互型任务的特点,提出将算法从MapReduce平台移植Spark平台的改进思路。设计了算法在Spark中的实现流程,并通过参数调整、内存优化等方法进一步提高算法效率。实验结果表明:与MapReduce平台中的算法相比,基于Spark DAG调度的算法能够减少65%以上的HDFS重复I/O操作,执行效率与能耗效率分别提升近200%及50%。
- 廖彬张陶于炯国冰磊张旭光刘炎
- 关键词:协同过滤MAPREDUCESPARK能耗优化