王小英
- 作品数:8 被引量:18H指数:2
- 供职机构:华北电力大学数理学院更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金更多>>
- 相关领域:理学经济管理电子电信自动化与计算机技术更多>>
- 基于Logistic模型的小微贷不良用户画像
- 2023年
- 随着互联网金融的发展及个人消费需求的日益增长,小微贷,特别是基于互联网的P2P借贷得到了较快的发展。但由于平台风险识别能力的缺失,部分平台产生大量违约情况,致使投资人遭受损失。为辅助平台及投资人有效识别不良用户,减少坏账带来的损失,本文基于国内外较有代表性的P2P平台:Prosper及拍拍贷上的数据,采用逻辑回归、决策树及支撑向量机三类模型对借款人进行信用评估,并依据模型结果得到小微贷不良用户画像。结果表明,逻辑回归模型时间复杂度低,具有优越的可解释性,更加适用于违约因素的研究。并且不良用户借款通常具有高利率、长期限的特点;同时用户本身没有稳定工作,收入较低。而常被我们关注到的性别、年龄以及学历反而影响较低。
- 孙璐王小英马锐欣
- 关键词:个人信用评估
- 正态分布和瑞利分布混合情形下的参数估计及分类问题被引量:7
- 2016年
- 学者往往用单一的分布模拟和拟合杂波,如正态分布、瑞利分布和威布尔分布等。然而在实际中,雷达杂波由多种类型的杂波组成,单一分布通常不能精确刻画雷达杂波规律,因此,应用混合分布模型对雷达杂波数据建模更准确。本文考虑用正态分布和瑞利分布的混合分布拟合杂波,并应用矩估计方法和基于EM算法的极大似然估计方法估计模型参数,最后,应用最大后验概率分类准则验证2种估计方法的分类准确率。通过数据模拟,得出极大似然估计的效果和分类准确率都要优于矩估计的估计效果和分类准确率。
- 王小英陈常龙尹俊平
- 关键词:瑞利分布EM算法
- 部分线性分位回归模型估计的MM算法被引量:1
- 2019年
- 近年来,关于部分线性分位回归模型的估计方法的研究得到了较多的关注.但由于目标函数的非光滑性,估计程序的实现是比较具有挑战性的.文章将采用MM(Majorization Minimization)算法计算部分线性分位数回归模型的估计.其基本原理是首先找到目标函数的优化函数,然后借助优化函数的最小化过程.逐步迭代至目标函数的解.数值模拟和实证研究表明该算法具有较好的稳定性和较强的数值计算能力.
- 杨雪梅王小英孙志华
- 基于经验累积分布的正态和均匀混合分布参数估计被引量:1
- 2016年
- 混合正态分布模型易受离群点的影响,其参数的极大似然估计不是稳健估计。Fraley和Raftery在混合正态分布中添加一个均匀分布作为离群点的分布,能够准确的拟合观测数据,但是由于均匀分布概率密度函数的特殊性,即当两个参数充分接近时似然函数无界,因此直接利用EM算法进行迭代是行不通的。一般直接指定均匀分布的参数初始值为观测值中任意两个不同的数据点,在所有结果中选取最大似然函数值所对应的参数作为最终的参数估计值,尽管Coretto和Hennig提出网格化思想但是这种方法仍运算量大,效率低。针对一般情形的正态和均匀混合分布参数估计,本文提出了一种基于观测数据的经验累积分布函数的方法,直接估计均匀分布的参数,再估计混合比例和正态分布参数。数据模拟表明该方法具有效率高、计算量小、估计精度高且易于实现的优点。
- 王小英陈常龙李迎华
- 关键词:EM算法
- 线性回归模型中响应值的选取对二分类问题的影响
- 2015年
- 我们利用多元线性回归模型处理两个总体的分类问题,首先对响应变量按一定的规则赋值,并在最小二乘法的基础上构建判别函数及判别准则,进而论证了响应值的选取对平衡及不平衡数据二分类问题的影响。此外,我们将此判别方法与经典判别分析方法如:经典马氏距离判别法、Bayes判别法进行比较,并得到它们之间的内在联系及优缺点。
- 王小英杨岩丽陈常龙
- 关键词:线性回归模型最小二乘法
- 不同类型数据下混合模型参数估计效果的对比研究
- 2017年
- 混合高斯模型在描述数据方面应用较多,但它易受离群点的影响,其参数的极大似然估计不是稳健估计。混合t-分布模型由于其重尾分布的特性,相对于混合高斯分布,在分析重尾数据上更具稳健性。文章首先研究一元混合t-分布模型,利用标准EM算法给出了该模型参数极大似然估计的迭代步骤,并分别在三类模拟数据下与混合高斯模型进行了对比分析,验证了该模型的有效性以及在拟合重尾数据上的优势。算法初始化采用k-means方法。
- 王小英李迎华杨雪梅
- 关键词:EM算法
- 三维移动目标无源定位算法被引量:7
- 2019年
- 无源定位已经成为雷达对抗中一项相当重要、不可或缺的技术。针对常态侦察时三维移动目标的无源定位问题,考虑了基于到达方位信息的代数几何概率定位方法,并给出了每一时刻目标位置误差随时间变化的关系,最后通过数值模拟展示了所研究定位方法的精度。该算法基于运动学原理,充分利用了辐射源信号测量值的时空变化量信息,定位收敛速度快而且非常稳定,具有很强的实用性。以期在实际应用中对近空间或邻近空间中高速移动目标进行三维快速定位,更好地提供无源侦察中移动目标的方位情报信息。
- 王小英江怡帆赵悦
- 关键词:无源定位
- 基于EM算法的混合t-分布模型参数估计被引量:2
- 2018年
- 混合t-分布模型是分析重尾数据的重要建模工具之一,不易受离群点、异常值点的影响,比混合高斯分布模型具有更好的稳健性。文章研究了两总体一元混合t-分布模型,基于EM算法给出了该模型参数极大似然估计的迭代步骤,并采用k-means方法进行算法初始化,然后分别在三类模拟数据下对比验证了该模型的有效性以及在拟合重尾数据上的优势。
- 王小英李迎华杨雪梅
- 关键词:EM算法极大似然估计