国家科技支撑计划(2009BAH42B02)
- 作品数:12 被引量:117H指数:6
- 相关作者:黄少滨朴秀峰吕天阳谢文艳刘建毅更多>>
- 相关机构:哈尔滨工程大学清华大学北京邮电大学更多>>
- 发文基金:国家科技支撑计划国家自然科学基金中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术理学矿业工程更多>>
- 同行评议专家遴选系统研究与实现被引量:10
- 2012年
- 设计并实现一个科技项目同行评议专家智能遴选系统,以专家信息和专家档案库为基础,采用基于统计的术语抽取技术解决未登录词问题,利用向量空间检索计算待评审项目和评审专家的相关性,根据相关性大小遴选出最合适的评审专家。
- 李振清刘建毅王枞吴旭
- 关键词:同行评议术语抽取
- 加权复杂网络社团的评价指标及其发现算法分析被引量:22
- 2012年
- 节点的聚集现象是复杂网络的重要特性.以往研究主要发现无权复杂网络中的社团,较少涉及加权网络的社团发现.由于加权网络的复杂性远高于无权网络,一般认为加权网络的社团发现是一个较难的问题.本文基于统一的数据基础,从社团评价指标的有效性和现有算法的效果两个角度开展研究.首先,总结了加权网络三种常见的社团评估指标,并在社团大小、密度和局域特点均不同的模拟数据集上分析指标的有效性;其次,针对5个数据集,分析现有的3种加权复杂网络社团发现算法的效果.研究表明:上述指标无论在评价最基本的社团结构,还是在分析结构复杂的社团时都有较大缺欠;现有的加权网络社团发现算法的泛化能力不强.
- 吕天阳谢文艳郑纬民朴秀峰
- 关键词:复杂网络社团发现模块度
- 一种基于自适应最近邻的聚类融合方法被引量:2
- 2012年
- 聚类融合通过把具有一定差异性的聚类成员进行组合,能够得到比单一算法更为优越的结果,是近年来聚类算法研究领域的热点问题之一。提出了一种基于自适应最近邻的聚类融合算法ANNCE,能够根据数据分布密度的不同,为每一个数据点自动选择合适的最近邻选取范围。该算法与已有的基于KNN的算法相比,不仅解决了KNN算法中存在的过多参数需要实验确定的问题,还进一步提高了聚类效果。
- 黄少滨李建刘刚
- 关键词:聚类融合
- 启发式初始化独立的k-均值算法研究被引量:4
- 2012年
- 针对传统k-均值算法对初始聚类中心敏感的问题,提出了启发式初始化独立的k-均值算法。该算法引入prim算法选择k个初始聚类中心,且通过设置阈值参数θ,避免同一类中的多个数据对象同时作为初始聚类中心,否则将导致聚类迭代次数增加,并得到错误的聚类结果。与传统的k-均值算法和基于遗传算法的k-均值聚类算法相比,实验结果表明改进的算法不仅降低了初始聚类中心选取的随机性对聚类性能产生的影响,有效减少了聚类迭代次数,而且降低了离群点对聚类性能的影响,从而验证了算法的可行性和有效性。
- 王会青陈俊杰郭凯
- 关键词:聚类分析K-均值算法PRIM算法聚类中心
- 基于传播免疫的复杂网络可控性研究被引量:11
- 2012年
- 复杂网络控制反映了人类对复杂系统的认识深度和改造能力.最新研究成果基于线性系统控制理论建立了复杂网络可控性的理论架构,能够发现任意拓扑结构的线性时不变复杂网络中控制全部节点状态的最小驱动节点集,但是该模型未考虑免疫节点或失效节点对控制信号传播的阻断.在继承该模型优点的前提下,重新构建了基于传播免疫的复杂网络控制模型.在采用分属于随机免疫和目标免疫两种策略的4个方法确定免疫节点的情况下,分析14个真实网络的可控性.结果表明:如果将网络中度数、介数和紧密度指标较高的节点作为免疫节点,将极大地提高控制复杂网络的难度.从而在一定程度上丰富了以往模型的结论.
- 吕天阳朴秀峰谢文艳黄少滨
- 决策树分类的属性选择方法的研究被引量:17
- 2011年
- 针对ID3算法偏向于选择取值较多的属性作为测试属性的缺点,引入OneR算法选择属性的相关子集进行分类,降低无关属性和重复属性对分类的影响。实验结果表明,与ID3算法相比优化后的方案提高了ID3算法的分类准确率,降低了分类时间,同时克服了ID3算法的取值偏置问题,优化了分类结果。
- 王会青陈俊杰侯晓晶郭凯
- 关键词:决策树ID3算法
- 二分K均值聚类算法优化及并行化研究被引量:23
- 2011年
- 二分K均值聚类算法在二分聚类过程中的初始质心选取速度方面存在不足。为此,提出以极大距离点作为二分聚类初始质心的思想,提升算法的运行速度。研究如何在群集系统中进行快速聚类,根据二分K均值聚类算法的特性,采用数据并行的思想和均匀划分的策略,对算法进行并行化处理。实验结果表明,改进后的算法能获得比较理想的加速比和较高的使用效率。
- 张军伟王念滨黄少滨蔄世明
- 关键词:数据挖掘聚类算法并行化群集系统
- 基于场景的并发系统需求验证方法研究被引量:1
- 2011年
- 为验证并发系统需求设计的正确性,提出一种基于场景的并发系统需求验证方法.首先,用UML顺序图建模并发系统需求场景,通过定义顺序图的操作语义及转换规则,将顺序图的XML描述文件自动转换为Promela程序,而后将描述系统需求的Promela程序和描述系统规约的线性时序逻辑作为模型检测器SPIN的输入,用模型检测的方法自动验证并发系统需求设计的一致性和完备性,最后为证明上述方法的有效性给出一个基于场景的ATM系统需求设计验证实例.实验结果表明,该方法能够有效地发现并发系统需求设计中的错误与不一致,为改进设计提供帮助.
- 张涛黄少滨黄宏涛吕天阳刘刚
- 关键词:并发系统UML顺序图SPIN
- 基于克雷格插值的反例理解方法被引量:2
- 2013年
- 针对错误原因提取效率低的问题,提出一种利用克雷格插值对模型检测器产生的反例进行自动理解的方法.该方法首先从反例失效状态出发推导出其最弱前置条件,然后对初始状态与反例最弱前置条件进行不一致分析,能在线性时间内提取克雷格插值作为反例失效原因,产生的插值能直接用于定位错误事件.实验结果表明,基于克雷格插值的反例理解方法能显著提高反例理解速度,提高软件的调试效率,从而提升软件的可靠性和质量.
- 黄宏涛黄少滨陈志远张涛
- 关键词:反例
- 基于海量数据的基本养老保险体制可持续性实证分析
- 基本养老保险体制的可持续性是攸关国计民生的重大研究课题。当前的研究大多采用定性分析,或利用精算模型进行测算,部分研究以统计数据和抽样数据作为分析基础。由于缺乏大量、真实的基本养老保险数据的支持,因此相关研究很难反映基本养...
- 吕天阳李明星黄少滨邱玉慧
- 关键词:缴费比例退休年龄可持续性海量数据
- 文献传递