王晓兰 作品数:9 被引量:22 H指数:3 供职机构: 沧州职业技术学院信息工程系 更多>> 发文基金: 国家自然科学基金 沧州市社会科学发展研究课题 中国博士后科学基金 更多>> 相关领域: 自动化与计算机技术 文化科学 更多>>
基于无放回抽样的帕尔森窗口集成方法 被引量:1 2018年 为解决大规模数据集的概率密度函数估计问题,提出一种基于无放回抽样的帕尔森窗口集成(sampling without replacement-based Parzen window ensemble,SR-PWE)方法,该方法在不需要利用全部数据的前提下,能够以较低的计算复杂度获得令人满意的概率密度函数估计表现.基于无放回抽样得到的若干原数据集的数据子集,利用帕尔森窗口法在数据子集上进行基概率密度函数估计,并将抽样上估计的基概率密度函数集成得到原始数据集的概率密度函数.通过在柯西分布和正态分布上对比帕尔森窗口法和SRPWE方法的概率密度函数估计表现,证实SR-PWE方法可行且有效. 何武超 王晓兰 何玉林 何玉林关键词:概率分布 大规模数据集 面向不平衡数据分类的最近邻三角区域合成少数类过采样技术 被引量:4 2018年 针对传统的合成少数类过采样技术(synthetic minority oversampling technique,SMOTE)在类别区域重合的数据集应用时,可能产生多个更接近多数类的人工样例,甚至突破类别边界,从而影响整体分类性能的情况,提出了一种最近三角区域的SMOTE方法,使合成的人工样例只出现在少数类样例的最近三角区域内部,并且删除掉距离多数类更近的合成样例,从而使生成的样例更接近少数类,且不突破原始的类别边界。实验分别在人工数据集和改进的UCI数据集上进行,并和原始的SMOTE方法分别在G-mean和F-value的评价指标上进行了对比。实验结果验证了改进的SMOTE方法在类别区域有重合的数据集上要优于原始SMOTE方法。 刘丹 王晓兰 邢胜关键词:不平衡数据 一种改进的可适应变宽核密度估计器 被引量:1 2019年 可适应变宽核密度估计器(kernel density estimator with adaptive varying bandwidth,KDE-AVB)是一种基于单个数据点的概率密度估计方法,它以单个数据点为处理对象,利用置信区间交叉法则确定核密度估计器的最优窗口宽度.为加快可适应变宽核密度估计器对最优窗口宽度的寻找,通过引入一种可变的标准差项因子去确定置信区间的上下边界,提出一种改进的可适应变宽核密度估计器(improved kernel density estimator with adaptive varying bandwidth,IKDE-AVB).可变标准差项因子的引入不仅加快了可适应变宽核密度估计器搜索最优窗口宽度的速度,且在一定程度上降低了“过平滑”概率密度估计现象发生的风险.对KDE-AVB和IKDE-AVB的仿真结果表明,IKDE-AVB不仅获得了更快的训练速度(最高降低64%),同时提升了概率密度的估计精度(估计误差最高降低63%). 金会赏 何玉林 何玉林 王晓兰 王晓兰关键词:人工智能 概率密度 核密度估计 沧州市消费提质升级工程研究 2024年 近年来,沧州市经济增长稳健,消费市场持续扩大,整体发展态势良好,但仍面临一些挑战,如部分地区消费水平不高、消费结构有待优化,以及商品和服务质量需进一步提升等.本文旨在从消费环境改善、新兴业态培育、品质消费意识提升和绿色消费推广等方面提出对策,以期提升消费者的购物体验,促进消费市场的持续健康发展. 王晓兰 邢胜 常秀颖关键词:绿色消费 大数据对高校就业形势分析和对策的应用 被引量:3 2018年 现今社会,大数据的应用越来越彰显出其独特优势,它渗透的领域越来越大,电子商务、医疗、金融行业、物流配送等,各种利用大数据进行发展的领域不断地发展新业务,创新运营模式。不仅在企业上如此,教育领域也需要大数据时代的推动。2018年4月,教育部关于印发《教育信息化2.0行动计划》的通知,这也就意味着大数据技术的迅猛发展,将深刻改变人才需求和教育形态。高校的就业问题是人们普遍关注的话题,如何适应与创新大数据时代下的大学生就业指导工作,则是需要深入思考和充分实践的问题。 邢胜 王晓兰关键词:大数据 就业指导 改进的加权极速学习机 2017年 针对加权极速学习机人为固定权重可能会错失更优权重的问题,提出了改进的加权极速学习机。该方法的多数类的初始权重设为1,使用多数类与少数类样例数的比值作为少数类的初始权重,然后通过在多数类或者少数类中添加权重调节因子,从缩小和扩大两个方向去调节权重,最后通过实验结果选出最优的权重。实验分别使用原加权极速学习机、其他权重的极速学习机和新方法在改造的UCI数据集上进行比较。结果表明新方法无论是在F-measure还是G-mean上都要优于其他加权极速学习机。 邢胜 王晓兰 赵士欣 赵彦霞关键词:代价敏感学习 京津冀协同发展背景下的沧州职业教育研究 2022年 自2014年京津冀协同发展规划开始至今经历了八年,协同发展战略稳步推进,协同发展成效显著,在交通、生态、产业、医疗等方面都有明显突破。一直以来河北省教育较京津落后,无论是教育资源、中高职衔接能力还是师资力量存在较大差距,河北省职业院校毕业生质量不高,就业压力大。面临京津冀协同发展给沧州职业教育带来了新的机遇,同时也面临挑战。 王晓兰 常秀颖 张福峰 邢胜关键词:职业教育 中高职衔接 人工智能导论线上线下混合式教学改革探索 被引量:8 2021年 对人工智能导论线上线下混合式教学改革进行探索,找出了其中存在的问题:课程前期知识储备较多,研究性强,前沿知识探索较少,学生的评价区分度不高,实践创新能力不足,课程思政没有围绕教学内容、学生特点形成系统性的建设方案。提出了具体的教学改革目标:通过线上教学提高学生的参与性和互动性。增加线上过程性考核,采用新评价指标将不同能力的学生加以区分。让学生通过团队合作及线上线下自主学习模式掌握科技前沿知识,进行成果展示。让学生能够将人工智能理论应用于实际。完成课程思政的系统方案建设。对线上线下混合式教学进行划分,即线上学习、线下学习、线上作业评测、线下成果汇报。提出了具体的教学方案:重构教学活动,采用多元评价体系,增设实践兴趣小组,解决实际问题,开展课程思政,以期综合评价学生的学习效果。 邢胜 左树萍 王晓兰基于多类重采样的非平衡数据极速学习机集成学习 被引量:5 2016年 极速学习机(Extreme learning machine,ELM)虽然已在理论和应用中证实有很好的泛化性能和极快的训练速度,但是在处理非均衡数据时,它更偏向多数类且极容易忽略少数类,基于数据重采样的集成学习可以帮助ELM解决少数类分类精度低的问题.提出一种按类别重采样技术并据此发展了一种ELM集成学习方法.该方法可充分利用少数类样本的信息,实验结果显示该方法性能明显优于单一的ELM学习模型.由于重采样是大数据处理的最核心的技术之一,该方法对非均衡大数据的学习模型建立有着一般性的指导意义. 邢胜 王熙照 王晓兰关键词:极速学习机 非均衡数据 重采样