吴君浩
- 作品数:6 被引量:39H指数:2
- 供职机构:湖南大学信息科学与工程学院(软件学院)更多>>
- 发文基金:湖南省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于马氏距离的缺失值填充算法被引量:31
- 2005年
- 提出了一种基于马氏距离的填充算法来估计基因表达数据集中的缺失数据。该算法通过基因之间的马氏距离来选择最近邻居基因,并将已得到的估计值应用到后续的估计过程中,然后采用信息论中熵值的概念计算最近邻居的加权系数,得到缺失数据的填充值。实验结果证明了该算法具有有效性,其性能优于其他基于最近邻居法的缺失值处理算法。
- 杨涛骆嘉伟王艳吴君浩
- 关键词:微阵列信息熵
- 基因序列聚类和分类研究
- 随着现代生物技术的不断发展特别是基因组计划的实施,人们不断获取大量的基因序列数据,准确、高效的对基因序列数据进行分析并挖掘出隐藏在其中的对人类有用的信息是非常必要的。聚类和分类技术正是能够对大量基因数据进行分析的技术。本...
- 吴君浩
- 关键词:基因序列聚类隐马尔可夫模型K-均值
- 文献传递
- 基于隐马尔可夫模型的二次k-均值基因序列聚类算法
- 2007年
- 本文提出了一种基于隐马尔可夫模型的二次k-均值聚类算法并实现了对基因序列数据的建模与聚类。算法首先引入了同源基因序列核苷酸比率趋向于一致的生物学特征来对基因序列数据进行初次k-均值聚类,然后利用第一次聚类结果训练出表征序列特征的隐马尔可夫模型,最后采用基于模型的k-均值方法再次聚类。实验结果表明,该算法是可行的,并且具有较好的聚类质量。
- 吴君浩骆嘉伟王艳杨涛杨旭
- 关键词:隐马尔可夫模型基因序列K-均值聚类
- 基于分段与运算的基因表达数据频繁项集挖掘被引量:1
- 2006年
- 本文在研究分析经典关联规则挖掘算法优缺点以及基因表达数据特点的基础上,提出了一种立足于基因表达数据的数据特点,不生成候选项集的基于分段与运算的基因表达数据频繁项集挖掘算法。实验证明该算法能更快速有效地挖掘出频繁项集。
- 王艳骆嘉伟杨涛吴君浩
- 关键词:基因表达数据关联规则挖掘频繁项集
- 利用遗传特征实现微生物基因序列聚类分析
- 2006年
- 文章提出了一种使用微生物遗传特征来进行基因序列聚类的方法。该方法首先从每条基因序列中划分出若干个等差长度的采样片断,然后利用各采样片断的遗传特征DNA(G+C)mol%值来作为基因序列聚类的依据。试验结果表明该方法是可行的,并且具有较好的聚类质量。
- 吴君浩骆嘉伟赵蕊
- 关键词:微生物基因序列K-均值聚类
- 一种结合完全连接的改进Apriori算法被引量:7
- 2006年
- 基于Apriori算法原理,提出一种有效的完全连接条件,在频繁2k项集的集合L2k进行自身Apriori连接得频繁(2k+1)项集的同时,自身完全连接产生未剪枝的候选4k项集;对频繁(2k+1)项集的集合L2k+1,直接对其项集进行完全连接产生未剪枝的候选(4k+2)项集。改进的算法减少了连接的比较次数、迭代运算次数。实验表明该算法在保证无遗漏的情况下有效地提高了Apriori算法的挖掘速度。
- 骆嘉伟王艳杨涛吴君浩
- 关键词:关联规则频繁项集