国家自然科学基金(60803026)
- 作品数:3 被引量:12H指数:1
- 相关作者:王国仁于长永毛克明袁野翟文丹更多>>
- 相关机构:东北大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- k支配能力排序轮廓查询算法
- 随着轮廓查询应用的扩展,轮廓查询被扩展为其他更复杂的查询问题,包括k支配轮廓、reverse轮廓、k最多支配轮廓等等.然而,现存的轮廓查询不符合某些用户需求,还需要研究新的轮廓查询及其相关算法.为了满足用户需求,提出k支...
- 吴俊杰信俊昌王国仁周诗咏
- 关键词:排序不确定性数据
- 文献传递
- 一种新颖的蛋白质序列与其串联质谱的匹配打分算法被引量:1
- 2010年
- 为了有效的利用蛋白质串联质谱数据,提高蛋白质鉴定的准确性,提出一种基于KNN的蛋白质序列与蛋白质串联质谱的匹配打分算法.蛋白质序列与蛋白质串联质谱的匹配打分是蛋白质数据库搜索鉴定过程中的关键技术.然而,现有的算法没有很好的利用蛋白质串联质谱中离子的强度信息.针对此问题,本文根据质谱中离子的类型给出了全体离子的一个合理的划分,进而抽象出一个高维的强度特征向量,在已知的高精度的数据集上建立了强度匹配知识集合,最后基于KNN技术构造了序列和质谱的匹配打分算法.实验结果表明,本文算法更加有效的利用了蛋白质串联质谱的结构信息,提高了蛋白质鉴定的准确性.
- 于长永王国仁毛克明翟文丹
- 关键词:蛋白质鉴定串联质谱数据库搜索
- 利用决策树方法对蛋白质鉴定结果二次评价
- 2010年
- 为了有效地利用蛋白质串联质谱数据,进一步提高蛋白质鉴定的准确性,提出一种基于决策树的蛋白质鉴定结果的二次评价算法.目前,串联质谱已经成为解决蛋白质鉴定问题的最为有效的技术手段.随着蛋白质串联质谱数据的大量聚集,蛋白质鉴定算法也日益增加.然而,现有的蛋白质鉴定算法通常返回数量庞大的结果列表,因此对列表中的鉴定结果进行二次评价是提高蛋白质鉴定准确性的一个重要环节.针对此问题,首先利用频繁模式挖掘方法获得了b离子的特征信息,进而基于决策树理论提出一种蛋白质鉴定结果的二次评价算法-即ReCheck算法.实验结果表明,该算法有效的提高了蛋白质鉴定的准确性.
- 于长永王国仁吴俊杰毛克明
- 关键词:蛋白质鉴定串联质谱数据挖掘决策树
- 基于使用信息和聚类方法的多模式集成
- 数据集成是解决多数据源整合问题的有效手段。如何准确高效地集成多数据源模式具有重要研究意义。本文在用户使用信息的基础上提出一种新颖的基于聚类技术的多模式数据集成方法。首先从数据库的查询日志中为模式属性提取特征向量,并对其进...
- 丁国辉王国仁赵宇海
- 关键词:数据集成特征向量聚类
- 文献传递
- 一种基于投影聚类的无监督表型区分算法
- 高通量微阵列技术与手工表型标定方式间的矛盾导致了基因表达数据的获取与表型确定间的不平衡.然而,已有的表型区分方法大多是有监督的,并且通常忽略了基因间广泛存在的相互作用,根据单个基因的独立区分能力划分样本表型,选择相关基因...
- 王章辉赵宇海王国仁李源
- 关键词:投影聚类基因表达数据序列数据
- 文献传递
- 面向不确定图的概率可达查询
- 图的可达性查询被广泛应用于生物网络、社会网络、本体网络、RDF数据库和XML数据库等.由于对数据操作时引入的噪声和错误使这些图数据具有不确定性,已经有大量的针对不确定RDF和XML数据库的研究.文中使用可能世界语义模型构...
- 袁野王国仁
- 关键词:割集
- 文献传递
- SMR:一种支持高维数据KNN查询的P2P语义覆盖网络
- 高维数据查询处理技术一直是P2P领域的研究热点.现有方法大都存在维护代价大、查询处理性能不高的问题.提出一种有效支持高维数据KNN查询处理的P2P语义覆盖网络——语义多层环SMR(semantic multi-level...
- 丁琳琳乔百友王国仁陈忱
- 关键词:P2P系统覆盖网络KNN查询语义空间
- 文献传递
- 面向不确定图的概率可达查询被引量:11
- 2010年
- 图的可达性查询被广泛应用于生物网络、社会网络、本体网络、RDF数据库和XML数据库等.由于对数据操作时引入的噪声和错误使这些图数据具有不确定性,已经有大量的针对不确定RDF和XML数据库的研究.文中使用可能世界语义模型构建不确定图,基于该模型,研究了概率可达查询(PR).处理PR查询是#P完全问题,对此文中首先给出一个基本随机算法,可快速地估算出可达概率,并且该值有很高的精确度.进一步,文中为随机算法引入条件分布(称为"条件随机算法"),采用图的不相交路径集和割集作为条件概率分布,因此改进的随机算法可准确地并且是在多项式时间内处理查询.最后基于真实不确定图数据的大量实验结果验证了文中的设计.
- 袁野王国仁
- 关键词:割集