朱岩
- 作品数:7 被引量:8H指数:2
- 供职机构:北京交通大学更多>>
- 发文基金:国家自然科学基金中央高校基金中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术理学经济管理电子电信更多>>
- 样本加权的多模型回归
- 回归分析是一种建立变量之间函数关系的简便方法.原始的回归分析算法并未考虑样本点的权重,即认为每个样本点的重要性都相等.但是,这样的算法在遇到包含野值点的实际问题时经常会失效,因为野值点会对回归模型产生很大的干扰.而对于多...
- 朱岩于剑
- 关键词:最小二乘法样本加权自适应
- 文献传递
- 面向文本数据的半监督学习研究
- 随着计算机和存储技术的发展,电子文本数据呈现出海量性和杂乱无章性。为了从大量杂乱无章的文本数据中获取有用的信息,人们需要利用文本分类技术对文档数据进行有效的组织管理。传统的分类技术包括有监督的分类和无监督的聚类。有监督的...
- 朱岩
- 关键词:半监督学习文本标注K近邻特征加权非负矩阵分解半监督聚类
- 文献传递
- 样本加权的多模型回归
- 2007年
- 回归分析是一种建立变量之间函数关系的简便方法.原始的回归分析算法并未考虑样本点的权重,即认为每个样本点的重要性都相等.但是,这样的算法在遇到包含野值点的实际问题时经常会失效,因为野值点会对回归模型产生很大的干扰.而对于多模型回归估计,每个样本点隶属于各模型的程度不同.针对多模型回归的这一特点,研究一种自适应的样本加权方法,在每一次计算样本点隶属度时,也对样本点的权重进行逼近,尽可能使野值点的权重减小为0,数值实验表明了该方法的有效性.
- 朱岩于剑
- 关键词:最小二乘法异方差自适应
- 铁路国有资本运营监管体系研究
- 该文从理论分析入手,运用委托代理理论阐述了国有资本监管的必要性;同时,借助数学的方法解释了国有资本代理人道德风险的存在及控制此项风险的各项因素,并分析了以国有资本经营者的激励和约束机制.这后,该文描述了西方一些国家对本国...
- 朱岩
- 关键词:资本监管
- 文献传递
- 一种利用近邻和信息熵的主动文本标注方法被引量:5
- 2012年
- 由于大规模标注文本数据费时费力,利用少量标注样本和大量未标注样本的半监督文本分类发展迅速.在半监督文本分类中,少量标注样本主要用来初始化分类模型,其合理性将影响最终分类模型的性能.为了使标注样本尽可能吻合原始数据的分布,提出一种避开选择已标注样本的K近邻来抽取下一组候选标注样本的方法,使得分布在不同区域的样本有更多的标注机会.在此基础上,为了获得更多的类别信息,在候选标注样本中选择信息熵最大的样本作为最终的标注样本.真实文本数据上的实验表明了提出方法的有效性.
- 朱岩景丽萍于剑
- 关键词:信息熵
- 分布式系统隐私保护认证技术及应用
- 刘云曾剑隽张振江李勇刘旭朱岩
- 该项目属于信息安全技术领域。分布式系统安全要保证通信内容的机密性、完整性和不可否认性,还要求实现通信方身份等信息的隐私保护,以防止敏感信息被未授权第三方监控。在国家863计划课题支持下,开展分布式系统环境中的隐私保护认证...
- 关键词:
- 关键词:信息安全隐私保护分布式系统
- 层次非负矩阵分解及在文本聚类中的应用被引量:2
- 2011年
- 文本聚类的目标是把数据集中内容相似的文档归为一类,而使内容不同的文档分开。目前针对不同领域的需求,多种解决聚类问题的算法应运而生。然而,由于文本数据本身固有的复杂特点,如海量、高维、稀疏等,使得对海量文本数据的聚类仍然是一个棘手的问题。提出了层次非负矩阵分解聚类方法,该方法不但保留了非负矩阵分解的优点,如同步识别文档类别和找出类别本质特征,而且能够展现类别间的层次结构。这种类别层次结构在网页预览等应用中是非常有用的。在真实数据集20Newsgroups和Reuters-RCV1上的实验结果表明,层次非负矩阵分解相比已有的方法更有效。
- 景丽萍朱岩于剑
- 关键词:文本聚类非负矩阵分解层次聚类