邵晓康
- 作品数:5 被引量:15H指数:3
- 供职机构:北京交通大学海滨学院更多>>
- 相关领域:自动化与计算机技术文化科学经济管理更多>>
- 大数据背景下对数据可用性的思考被引量:1
- 2015年
- 随着当前科学技术与信息化技术的迅猛发展,尤其是社交网络、云计算、互联网以及物理信息系统等相关技术的不断普及与发展,大数据已经成为普遍存在的一种情况,其逐渐发展成为当前这个社会的宝贵财富。爆炸式的数据增长,带来的不仅是财富,同时也是挑战,大数据背景下,劣质数据的不断增加,使人们越来越地开始重视数据的可用性,其已经发展成为当前急需解决的重要课题。鉴于此,本文主要针对大数据的有关概念进行详细地解析,在此基础之上提出几点提升数据可用性的建议,仅供参考与借鉴。
- 田春子邵晓康
- 关键词:大数据数据可用性完整性同一性
- 数据库中敏感数据定位挖掘方法研究被引量:3
- 2016年
- 对SQL Server数据库中敏感数据进行定位检测,可提高数据安全性。由于SQL Server数据库中存储的数据属性众多,使得定位挖掘时需要对特征描述进行约束。采用传统的定位挖掘算法,当数据库中出现过多的约束条件时,敏感数据查找过程复杂,属性分辨不准确,导致定位挖掘效率低的问题。提出采用关联度挖掘的SQL Server数据库中敏感数据定位挖掘的方法。利用布尔加权法不断调整加权系数,实现SQL Server数据库中敏感数据的准确分类,利用关联度的定位挖掘方法计算各个SQL Server数据库中敏感数据的特征,根据将关联度最大数据定义为SQL Server数据库中敏感数据,实现SQL Server数据库中敏感数据的定位挖掘。仿真结果表明,采用改进方法,定位挖掘准确度高,效率好,具有一定的使用性。
- 田春子邵晓康
- 关键词:敏感数据
- 基于Apriori和FP-Growth算法的学生行为分析研究被引量:3
- 2020年
- 随着高校信息化建设逐步加快,大多数高校已经在教学、科研、学生管理等领域部署了管理系统,便于高校科学化管理,并提高了管理质量和效率。这些应用系统经过多年的运行产生了大量数据,存储于各应用系统数据库中。本文使用数据挖掘算法对数据库中学生相关信息进行挖掘,运用Apriori算法和FP-Growth关联分析算法挖掘出平时的学生行为对一个学生学习成绩的影响,从而给高校管理者的工作提供相应的帮助。
- 田春子张磊朱泽一邵晓康胡子悦
- 关键词:数据挖掘APRIORIFP-GROWTH
- 局域网限速状态下的资源调度模型仿真被引量:4
- 2015年
- 在局域网限速状态下进行资源调度时,网络资源受到传输区域的影响,在调度过程中存在较大的流量突变随机性。传统的网络资源调度算法在应对海量突变流量时,采用延迟限制通信的方法,随便能缓解流量峰值,但仅仅通过外加通信约束条件约束、延迟流量突变的通信过程,调度过程存在弊端。提出采用混合蚁群算法的局域网限速状态下资源调度方法,将禁忌搜索作为蚁群算法局部搜索策略,并通过结合分布估计提高算法的收敛速度,把局域网限速状态下资源均衡与优化问题转化为组合优化的最短路径问题,进行计算求精确解。仿真结果表明,利用混合蚂蚁算法在局域网限速状态下进行资源调度,具一定鲁棒性和分布性,提升了调度工作效率。
- 田春子邵晓康
- 关键词:资源调度蚁群算法混合蚁群算法
- Apriori算法研究及在本科招生数据挖掘中应用
- 数据挖掘是从大量的数据中通过算法挖掘出未知潜在的知识或有价值的规律的过程。Apriori算法是数据挖掘关联规则中的经典算法,该算法通过对数据的关联性进行分析和挖掘,挖掘出信息之间的潜在联系,用来进行决策和指导,广泛应用于...
- 邵晓康
- 关键词:本科招生数据挖掘关联规则APRIORI算法
- 文献传递