胡雪梅
- 作品数:20 被引量:33H指数:4
- 供职机构:重庆工商大学数学与统计学院更多>>
- 发文基金:国家自然科学基金重庆市自然科学基金重庆市社会科学规划项目更多>>
- 相关领域:理学经济管理医药卫生自动化与计算机技术更多>>
- 惩罚三项Logit模型区分丙型肝炎患者的临床分期
- 2024年
- 丙型病毒性肝炎(简称丙型肝炎或丙肝)是一种由丙型肝炎病毒(HCV)感染引起的病毒性肝炎,可导致肝脏慢性炎症坏死和纤维化,部分患者可发展为肝硬化甚至肝细胞癌(HCC).本文利用丙型肝炎数据建立惩罚三项logit模型诊断患者的疾病分期:首先选取患者的12项生理指标作为预测向量,丙型肝炎的三种疾病分期作为响应变量;接着利用70%的数据作为训练集学习LASSO/Ridge/ENet惩罚三项logit模型,得到模型的参数估计和概率估计;再利用30%的数据作为测试集,结合三类混淆矩阵,ROC(receiver operating characteristic)曲面,HUM(hypervolume under the ROC manifold),PDI(polytomous discrimination index)和Kappa(Cohen’s kappa coefficient)等评估疾病分期的预测精度;最后引入人工神经网络(ANN),支持向量机(SVM)和随机森林(RF)等机器学习方法和惩罚三项logit模型进行比较,发现惩罚三项logit模型的三类分类预测表现最好,不仅能够进一步提高疾病分期的诊断精度,而且可以降低丙型肝炎的检测成本.
- 胡雪梅杨俊文
- 关键词:丙型肝炎疾病分期贝叶斯分类器机器学习方法
- 随机Logistic扩散模型的稳健指数倾斜推断被引量:1
- 2016年
- 研究了随机Logistic扩散模型的稳健指数倾斜推断,建立了模型的稳健指数倾斜估计和稳健指数倾斜检验统计量及计算步骤.随机模拟表明:稳健指数倾斜估计明显优于极大似然估计,稳健指数倾斜检验优于似然比型检验.
- 李岩岩胡雪梅
- 基于惩罚逻辑回归的乳腺癌预测被引量:6
- 2021年
- 本文采用惩罚逻辑回归方法,利用威斯康星大学的乳腺癌数据对乳腺肿瘤进行预测。首先选取与乳腺癌相关的10个指标作为自变量,接着采用逻辑回归、LASSO惩罚逻辑回归、L_(2)惩罚逻辑回归和弹性网惩罚逻辑回归作为分类器,利用75%的数据集作为训练集建立模型,最后利用25%的测试集、混淆矩阵和ROC曲线评估不同模型的预测精度。结果表明,LASSO惩罚逻辑回归的预测表现最好,预测精度达到97.18%;弹性网惩罚逻辑回归的预测表现随着α的增大发生变化,特别当α=0.9时,预测精度达到97.18%,与LASSO惩罚逻辑回归的预测表现一样好;L_(2)惩罚逻辑回归的预测表现排第3,逻辑回归表现最差。因此,在乳腺肿瘤诊断中可借助LASSO惩罚逻辑回归和弹性网惩罚逻辑回归提高诊断精度。
- 胡雪梅谢英蒋慧凤
- 关键词:乳腺癌逻辑回归
- 带有约束的增长曲线模型中回归系数线性估计的可容许性与泛容许性(英文)
- 2010年
- 本文研究了参数受约束的增长曲线模型中多元回归系数线性估计的可容许性和泛容许性.利用线性估计类中的八种最优标准和φ函数,得到了在三个等价子类中线性估计可容许以及回归系数线性估计泛容许的充要条件.本文的结论推广了覃红等人的工作.
- 胡雪梅王志忠高骥忠
- 关键词:容许性泛容许性
- 指导统计专业学生毕业设计的几点看法
- 2013年
- 本文提出了指导统计专业学生进行毕业设计的几点看法,即根据学生能力选题和安排内容,认真指导,经常讨论。
- 胡雪梅
- 基于葡萄酒评价的统计分析
- 2013年
- 利用t检验对两组葡萄酒评酒员的评价结果有无显著性差异进行可信度分析,并采用主成分分析法求得酿酒红葡萄有8个主成分,酿酒白葡萄有10个主成分,最后基于两种葡萄的评价总分对红白葡萄的质量进行分级.
- 郭益敏胡雪梅
- 关键词:T检验显著性差异主成分分析法
- 带有不完全椭球约束的多元回归系数线性估计的泛容许性(英文)被引量:5
- 2005年
- 对于带有不完全椭球约束的多指标线性模型 Y =XΘ+ε,ε~( ∑ V) ,Θ′X′NXΘ≤∑,给出了SΘ的泛容许估计的定义,并在齐次线性估计类(非齐次线性估计类)中给出了SΘ的估计AY(AY+C)泛容许的充要条件。
- 王志忠胡雪梅
- 关键词:不完全椭球约束多元回归系数泛容许性线性估计类非齐次
- 半参数时变系数模型的序列相关检验被引量:1
- 2011年
- 本文提出了两个统计量来检验半参数时变系数模型的序列相关:一个用于检验半变系数时序模型的有限阶序列相关,另一个用于检验半变系数平行数据模型的有限阶序列相关.在误差过程为鞅差的零假设下,所提出的两个检验统计量服从渐近正态或卡方分布.蒙特卡罗模拟研究表明所提出的检验统计量具有良好的有限样本性质.
- 胡雪梅刘锋
- 关键词:鞅差
- 机器学习方法研究肝癌预测问题被引量:1
- 2022年
- 肝癌在所有癌症中病死率高居第二名.由于机器学习方法能改进疾病预测精度,因此文章将利用它们研究肝癌前期诊断问题,提高肝癌的预测精度.首先选取影响肝癌的10个指标作为预测变量,将579位肝癌患者分为两组:随机抽取492位患者构成训练样本,剩余87位患者构成测试样本.接着利用训练样本建立6个分类器:逻辑回归、L_(2)惩罚逻辑回归、支持向量机(Support Vector Machine,SVM)、梯度提升决策树(Gradient Boosting Decision Tree,GBDT)、人工神经网络(Artificial Neural Network,ANN)和极限梯度提升算法(eXtreme Gradient Boosting,XGBoost),其中逻辑回归和L_(2)惩罚逻辑回归采用NewtonRaphson算法得到模型参数的迭代加权最小二乘估计,计算患者肿瘤细胞为恶性和良性的概率估计,确定最佳阈值预测肿瘤性状.最后用测试样本计算混淆矩阵、灵敏度和特异度,绘制ROC曲线评价预测精度.结果表明L_(2)惩罚逻辑回归预测精度最高,SVM预测精度排第二,XGBoost预测精度排第三,逻辑回归预测精度排第四,GBDT预测精度排第五,ANN和随机森林预测精度最差.
- 胡雪梅李佳丽蒋慧凤
- 关键词:支持向量机人工神经网络
- 半变系数模型研究美国爱荷华州埃姆斯市的房价问题被引量:2
- 2021年
- 近年来房地产业发展迅猛,房价快速走高,对经济发展和社会稳定产生了重大影响,因此房价研究具有重要的社会价值和经济意义.文章通过散点图及其拟合曲线展示不同协变量和响应变量之间的相关关系,提出半变系数模型建模美国埃姆斯市的房价问题.文章采用剖面最小二乘法研究7个协变量:地面以上的居住面积、地面以上的房间总数(不包括卫生间)、卫生间总数、房屋整体建材质量和品质、地下室面积、车库面积、建造年份与埃姆斯市房价之间的回归关系,为房价预测研究作准备.研究结果表明半变系数模型在探索美国爱荷华州埃姆斯市房价方面表现较好.因此,文章提供了一种利用半变系数模型同时学习高维数据线性和交互关系的有效方法.
- 胡雪梅胡雪梅
- 关键词:半变系数模型房价