黎铭
- 作品数:52 被引量:98H指数:6
- 供职机构:南京大学更多>>
- 发文基金:国家自然科学基金江苏省自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学一般工业技术理学更多>>
- 一种适用于快速软件开发模式的实时软件缺陷检测方法
- 本发明公开一种适用于快速软件开发模式的实时软件缺陷检测方法,首先初始化模型使其对任意模块的检测结果置信度为0;等待并接收一个刚完成编码的软件模块;利用当前缺陷检测模型对所接收的软件模块进行实时检测;若缺陷检测模型的缺陷检...
- 黎铭王东周志华
- 文献传递
- 非经典条件下的机器学习方法专题前言
- 2020年
- 近年来,随着学术界与工业界在机器学习和人工智能领域投入的关注越来越多,相关技术飞速发展,机器学习已经在社会生活的方方面面获得广泛应用,并产生了巨大价值.随着机器学习模型应用场景的不断扩大,越来越多的问题难以被经典条件下的机器学习方法所解决.新兴的应用场景下,人们往往面临数据模式发生变化、数据特征发生变化、学习任务目标发生变化等动态场景;数据标记不完备或采样存在偏差等弱监督场景;以及设备存储空间较小、计算能力有限等资源受限场景,等等.
- 高新波黎铭李天瑞
- 关键词:数据模式人工智能数据特征资源受限
- 一种基于适配器微调的自适应模型复用方法
- 本发明公开一种基于适配器微调的自适应模型复用方法。以计算机视觉领域的目标检测任务为例,首先获取在大规模图像数据集上预训练的模型作为原始模型,根据预训练模型结构为其设置候选适配器。再使用泰勒展开方法计算在网络不同位置添加适...
- 黎铭孙宇熙
- Fretcit-kNN算法性能分析
- Fretcit-kNN算法存在几个重要参数,不同的参数配置可能带来算法性能差异.了解算法性能随参数而变化的规律,能够进一步加深对算法内部机制的理解,同时有助于算法更好地应用于实际以及设计更好的算法.本文重点考察不同距离度...
- 黎铭周志华
- 关键词:计算机网络网页浏览计算机数学
- 文献传递
- 一种基于抽象语法树增广图模型的代码补全方法
- 本发明公开一种基于抽象语法树增广图模型的代码补全方法,包括以下步骤:等待新的代码补全需求,获取待补全位置附近的源代码片段;解析待补全的源代码,将其表示为抽象语法树;遍历抽象语法树上各节点之间的顺序、语法和语义关系,通过带...
- 黎铭汤闻誉
- 文献传递
- 在计算机辅助诊断装置中利用未诊断病例的预测建模方法
- 本发明公开了一种在计算机辅助诊断装置中利用未诊断病例的预测建模方法,该方法通过以下步骤得到预测结果:(1)若预测模型未训练好,则执行步骤(2),否则转到步骤(6);(2)利用已诊断病例和未诊断病例产生已标记和未标记训练数...
- 周志华黎铭
- 文献传递
- 软件缺陷因素挖掘被引量:1
- 2012年
- 利用软件开发过程各个阶段中多方面的信息,构建了排序支持向量机(RankSVM)和支持向量回归(SVR)软件缺陷密度预测模型。实验结果表明,与支持向量回归软件缺陷密度预测模型相比,排序支持向量机软件缺陷密度预测模型能够更好地反映软件开发过程中多方面因素对软件缺陷密度的影响。通过对排序支持向量机软件缺陷密度预测模型的分析找出影响软件缺陷密度的重要因素,可以指导后续实践。
- 涂威威黎铭周志华
- 关键词:计算机软件
- 面向半监督聚类的最优间隔分布学习机被引量:1
- 2022年
- 基于间隔的聚类是一类经典的聚类算法,此类算法假设聚类结构能通过引入监督学习中的间隔来确定.即一个好的聚类结果,当以其簇标记作为类别标记进行监督学习时,所得分类器产生的关于间隔的目标物理量也同时达到最优.目前最为有效的间隔物理量是间隔分布,其基于最新的间隔理论,取得了比优化最小间隔更好的效果.然而在现实聚类任务中,我们往往还能获得一些额外的监督信息,例如两两样本之间的"必连"约束和"勿连"约束,此时优化间隔分布是否还有效尚未可知.对此,本文提出面向半监督聚类的最优间隔分布学习机(ODMSSC),对该问题进行初步探索. ODMSSC对应的形式化是一个混合整数规划,我们将其放松成一个鞍点问题,并提出一种高效的交替优化方法进行求解.最终通过真实数据集上的实验,我们验证了所提算法的有效性.
- 张腾黎铭黎铭
- 关键词:半监督聚类约束聚类
- 一种基于缺陷报告分析的缺陷源代码定位方法
- 本发明公开一种基于缺陷报告分析的缺陷源代码定位方法,首先获得新的待检查缺陷报告;如果不存在缺陷定位模型,建立缺陷定位模型。建立缺陷定位模型:获取大量历史缺陷报告、源代码和缺陷定位标记,构造训练集合;初始化缺陷定位模型;利...
- 黎铭霍轩周志华
- 文献传递
- 基于多核集成的在线半监督学习方法被引量:13
- 2008年
- 在很多实时预测任务中,学习器需对实时采集到的数据在线地进行学习.由于数据采集的实时性,往往难以为采集到的所有数据提供标记.然而,目前的在线学习方法并不能利用未标记数据进行学习,致使学得的模型并不能即时反映数据的动态变化,降低其实时响应能力.提出一种基于多核集成的在线半监督学习方法,使得在线学习器即使在接收到没有标记的数据时也能进行在线学习.该方法采用多个定义在不同RKHS中的函数对未标记数据预测的一致程度作为正则化项,在此基础上导出了多核集成在线半监督学习的即时风险函数,然后借助在线凸规划技术进行求解.在UCI数据集上的实验结果以及在网络入侵检测上的应用表明,该方法能够有效利用数据流中未标记数据来提升在线学习的性能.
- 黎铭周志华
- 关键词:数据挖掘半监督学习多核学习