王文剑 作品数:236 被引量:849 H指数:13 供职机构: 山西大学计算机与信息技术学院 更多>> 发文基金: 国家自然科学基金 山西省回国留学人员科研经费资助项目 山西省自然科学基金 更多>> 相关领域: 自动化与计算机技术 文化科学 理学 经济管理 更多>>
基于时序核函数的支持向量回归机 被引量:4 2006年 为克服维数灾难和过拟合等传统算法所不可规避的问题,利用支持向量机(SupportVectorMachine,SVM)提出基于时序数据时间相关性的核函数修正选择方法,并以真实的二氧化硫(SO2)数据为实验数据验证该方法的有效性.实验结果表明采用时序核函数对测试数据集的拟合效果更好,并对模型泛化能力有一定的提高. 王平 王文剑关键词:支持向量机 支持向量回归 核函数 时序数据 基于在线性能测试的概念漂移检测方法 被引量:12 2020年 概念漂移是动态流数据挖掘中一类常见的问题,但混杂噪声或训练样本规模过小而产生的伪概念漂移会引起与真实概念漂移相似的结果,即模型在线测试性能的不稳定波动,导致二者容易混淆,发生概念漂移的误报.针对流数据中真伪概念漂移的混淆问题,提出一种基于在线性能测试的概念漂移检测方法(concept drift detection method based on online performance test,简称CDPT).该方法将最新获得的数据集进行均匀分组,在每组子数据集上分别进行在线学习,同时记录每组子数据集训练测试得到的分类精度向量,并计算相邻学习时间单元之间的精度落差,依据测试精度下降阈值得到有效波动位点.然后采用交叉检验的方式整合不同分组中的有效波动位点,以消除流数据在线学习过程中由于训练样本过小导致模型不稳定造成的检测干扰,根据精度波动一致性得到一致波动位点.最后,通过跟踪在线学习分类准确率,得到一致波动位点邻域参照点的测试精度变化,比较一致波动位点邻域参照点对应的模型测试精度下降幅度及收敛情况,以有效检测一致波动位点当中真实的概念漂移位点.实验结果表明,该方法能够有效辨识流数据在线学习过程中发生的真实概念漂移,并能有效避免训练样本过小或者流数据中噪声对检测结果的负面影响,同时提高模型的泛化性能. 郭虎升 张爱娟 王文剑关键词:流数据 概念漂移 一种核的上下文多臂赌博机推荐算法 被引量:2 2022年 个性化推荐服务在当今互联网时代越来越重要,但是传统推荐算法不适应一些高度变化场景。将线性上下文多臂赌博机算法(linear upper confidence bound,LinUCB)应用于个性化推荐可以有效改善传统推荐算法存在的问题,但遗憾的是准确率并不是很高。本文针对LinUCB算法推荐准确率不高这一问题,提出了一种改进算法K-UCB(kernel upper confidence bound)。该算法突破了LinUCB算法中不合理的线性假设前提,利用核方法拟合预测收益与上下文间的非线性关系,得到了一种新的在非线性数据下计算预测收益置信区间上界的方法,以解决推荐过程中的探索–利用困境。实验表明,本文提出的K-UCB算法相比其他基于多臂赌博机推荐算法有更高的点击率(click-through rate,CTR),能更好地适应变化场景下个性化推荐的需求。 王鼎 门昌骞 王文剑关键词:个性化推荐 核方法 点击率 融合边缘增强与多尺度注意力的皮肤病变分割 2023年 皮肤病变形状、颜色、大小类型多样,给皮肤病变的准确分割带来了巨大挑战。针对这一问题,提出了一种融合边缘增强与多尺度注意力的皮肤病变分割网络(BEMA U-Net)。该网络包含一个用于提取全局特征的空间多尺度注意力模块和一个用于增强病变区域边缘特征的边缘增强模块,将两种模块添加到以编码解码结构为主干的网络(U-Net)中,能够有效抑制病变图像中背景噪声的干扰并强化病灶的边缘细节。此外,设计了混合损失函数,结合Dice Loss和Boundary Loss,并在训练过程中实现混合损失函数的动态权重调整,使网络对病变图像整体特征和边缘细节特征的提取进行多重监督,缓解了皮肤病变图像分割中毛发干扰和边缘模糊的问题。在ISIC2017和ISIC2018两个公开数据集上的实验结果表明,所提算法对皮肤病变部位的分割图像边缘连续、轮廓清晰,具有更好的分割效果。 白雪飞 靳智超 王文剑 马亚楠一个通用试题库管理系统的设计与实现 被引量:6 1997年 通用试题库管理系统是CAI(计算机辅助教学)的一个重要分支.本文介绍了在FOXPROFORWINDOWS下开发的能够对图文进行统一管理的通用试题库管理系统,利用本系统可以为任意学科建立选题随机性强、成卷速度快、操作灵活方便的试题库系统,并可对其进行管理。 王文剑 曹焕光 李跃琴关键词:试题库 试卷生成 CAI 关于支撑向量机若干问题的研究及应用 王文剑关键词:支撑向量机 一种面向牙医椅的Kinect手势识别装置 本实用新型公开了一种面向牙医椅的Kinect手势识别装置,该装置将体感设备Kinect与计算机相连接,实现了基于Kinect的牙医手势识别;将单片机与嵌入牙医椅中的步进电机相连接,实现了基于单片机的牙医椅无接触式操作;整... 王文剑 白雪飞 史泽宇 成景文 王瑞芳 王淑华文献传递 一种电商网络异常用户检测方法及系统 本发明涉及电商平台的网络安全领域,为了消除这些异常用户所带来的负面影响,公开了一种电商网络异常用户检测方法及系统。所述系统包括计算机处理器和内存、电商网络数据预处理单元、电商网络异常用户检测模型训练单元、电商网络异常用户... 杜航原 李铎 王文剑基于半监督网络表示学习的电商网络社区发现方法及系统 本发明涉及电商网络数据挖掘领域,公开了一种基于半监督网络表示学习的电商网络社区发现方法及系统,所述方法包括电商网络邻接矩阵、特征矩阵以及部分用户标签矩阵构建环节,半监督网络表示学习的电商网络社区发现模型构建及优化环节,半... 杜航原 谢富中 王文剑 白亮 梁吉业极限距离噪声估计与过滤方法 被引量:1 2023年 近年来,机器学习不断取得显著性进展并被成功应用于诸多领域,然而很多学习模型或算法高度依赖数据的标签质量。实际应用中大量数据集普遍存在复杂的标签噪声,因此机器学习在低质数据建模和标签噪声处理方面面临严峻挑战。文中针对回归中的数值型标签噪声,从理论分析和仿真实验的角度研究了标签估计区间与噪声的关联性,提出了一种极限距离噪声估计方法。在最优样本选择框架下,基于此噪声估计方法提出了一种极限距离噪声过滤(Limit Distance Noise Filtering, LDNF)算法。实验结果表明,所提噪声估计方法与真实标签噪声具有更高的相关性和更低的估计偏差。在标准数据集和真实年龄估计数据集上证实了所提过滤算法可以在不同噪声环境下有效识别标签噪声并减小模型的测试误差,其表现优于最新的其他过滤算法。 姜高霞 秦佩 王文剑关键词:噪声估计