赵倩
- 作品数:2 被引量:2H指数:1
- 供职机构:西北工业大学计算机学院更多>>
- 发文基金:陕西省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 从基因芯片数据快速有效地挖掘共调控基因
- 2010年
- 针对基因芯片数据高噪音、列(基因)数比行(实验条件)数多几个数量级的特殊性,为了进一步提高从基因芯片数据挖掘共调控基因的时间效率和挖掘结果的有效性,首先根据所有两两基因对之间的Pearson相关系数对原始完整数据集进行分组,然后使用列(基因)枚举方法对各组数据分别进行闭合频繁模式挖掘,并对活化和抑制共调控关系的挖掘分别进行处理。实验结果证明:算法快速有效地挖掘出了两种共调控基因。
- 赵倩尚学群
- 关键词:基因芯片数据
- 基于seeds集和频繁项集挖掘的半监督聚类算法被引量:2
- 2010年
- 半监督聚类在无监督学习中通过对少量监督信息的有效利用提高聚类性能。提出一种基于seeds集的半监督聚类算法,它采用Apiori算法对初始seeds集和扩大规模后seeds集的数据进行频繁项集挖掘,使得数据中存在的噪音数据和误标记数据得到净化、修正,以改善seeds集质量,提高聚类性能。该算法使用带权χ2测试这一数学模型作为分类规则度量指标,以对无标记数据进行类标签值预测。实验结果显示,所提出的结合了频繁项集挖掘和带权χ2测试的基于seeds集的半监督聚类算法不仅改善了seeds集质量,也提高了预测结果的精确度,优化了聚类性能。
- 赵倩尚学群王淼
- 关键词:半监督聚类频繁项集挖掘