随着计算机技术及感知技术的发展及应用,各个领域普遍出现不确定性数据流形态的新型数据,吸引了众多研究者的关注.现有的数据流聚类技术普遍忽略不确定性特征,常导致聚类结果的不合理甚至不可用.为数不多的针对不确定性特征的聚类方法片面考察不确定性,且大多基于K-Means算法,具有先天缺陷.针对这一问题展开研究,提出了不确定度模型下数据流自适应网格密度聚类算法(adaptive density-based clustering algorithm over uncertain data stream,ADC-UStream).对于不确定性特征,该算法在存在级和属性级不确定性统一策略下,构建熵不确定度模型进行不确定性度量,综合考察不确定性.采用网格-密度的聚类算法,基于衰减窗口模型设计时态和空间的自适应密度阈值,以适应不确定性数据流的时态性和非均匀分布特征.实验结果表明,不确定模型下的数据流网格密度自适应聚类算法ADC-UStream在聚类结果质量和聚类效率方面都具有较好的性能.
如何利用社会网络信息来寻找一个合作高效、高质量的团队,已成为热门的研究话题.但现有团队生成问题中对个体拥有技能的度量大多都采用0-1方式,而在实际应用中如何界定个体是否拥有该技能的方法会在很大程度上影响团队完成任务的效率.另外在目前的基于社会网络的团队生成方法研究中,计算个体间关系强度时只考虑个体间曾经合作任务的数目,并没有深入挖掘社会网络条件下个体间的社会关系类别以及个体自身的其他属性,这些因素很大程度上也会影响个体间的社会关系,进而影响个体间的团队合作.针对以上问题,该文首先给出团队生成问题的具体定义和相关概念,给出技能贡献度的定义,并利用社会网络个体间的关系类别和个体间对应社会属性相似度引入一种关系模型来进一步量化团队成员个体间的关系强度;然后根据团队的不同形式分别进行了无领导者团队生成方法的研究和有领导者团队生成方法的研究,并分别提出了MCSTFA算法(Minimum Covering Steiner-based Team Forming Algorithm)和MSCTFA算法(Minimum Set Covering-based Team Forming Algorithm)来寻找最佳无领导者团队以及提出MLDTFA算法(Minimum Leader Distance based Team Forming Algorithm)来寻找最佳领导者和最佳团队.最后,利用DBLP数据集设计和实现实验以验证上述所有方法的可行性和有效性,并从团队合作代价、团队成员数量、团队连通性以及社会网络影响因素对算法的影响对比结果等方面进行比较和分析,实验结果验证了文中所提算法的可行性和高效性.