广西教育厅科研项目(200808MS062)
- 作品数:5 被引量:25H指数:3
- 相关作者:刘星毅韦小铃韦小玲陈振华曾春华更多>>
- 相关机构:钦州学院桂林电子科技大学更多>>
- 发文基金:广西教育厅科研项目广西壮族自治区自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于欧式距离的最近邻改进算法
- 最近邻算法由于操作简单,效果显著,无论在科研还是实际生活中都具有广泛应用。本文首先解释了最近邻算法在计算两个记录之间距离方面的不足,然后对此提出了改进,真实数据集的实验结果显示,改进后的最近邻算法能取得较好的成绩。
- 刘星毅
- 关键词:最近邻算法欧式距离
- 文献传递
- 加密数据中连接关键词的安全搜索算法被引量:2
- 2009年
- 现有关键词搜索算法只能处理单个关键词,且检索复杂度高。针对该问题提出同时搜索多个连接关键词的加密数据安全搜索算法,该算法把生成"能力"的过程分为线下和线上2个部分,它对多个连接关键词的安全搜索时间比原有算法降低了80%左右,实例分析结果验证了其正确性和有效性。
- 刘星毅
- 关键词:数据库安全加密数据
- 基于欧式距离的最近邻改进算法被引量:12
- 2010年
- 依托欧拉距离,使用杂合距离算法改进Minkowski距离公式,使得最近邻算法能够针对不同实际需要计算两事例距离,适用到属性是混合型的情形,也能避免时序列中出现的错误计算问题。
- 刘星毅韦小铃
- 关键词:欧式距离
- 基于马氏距离和灰色分析的缺失值填充算法被引量:6
- 2009年
- 针对kNN算法中欧氏距离具有密度相关性敏感的缺点,提出综合马氏距离和灰色分析方法代替kNN算法中欧式距离的新算法,应用到缺失数据填充方面。其中马氏距离能解决密度相关明显的数据集,灰色分析方法能处理密度相关不明显的情况。因此,该算法能很好处理任何数据集,实验结果显示,算法在填充结果上明显优于现有的其他算法。
- 刘星毅
- 关键词:数据预处理缺失数据最近邻算法
- 基于性价比的分裂属性选择方法被引量:1
- 2009年
- 代价敏感决策树通常讨论测试代价和误分类代价,在其分类过程中,最关键的是节点分裂属性的选择。分析了代价敏感决策树分类问题目前常见的选择分裂属性方法的优、缺点,提出了综合信息量和测试代价并且最大程度降低误分类代价的分裂属性选择方法,UCI数据集实验结果显示该方法在各个方面好于已有的方法。
- 刘星毅
- 关键词:决策树
- 缺失数据的处理和挑战被引量:5
- 2008年
- 在数据挖掘研究中,缺失数据是一个非常普遍的问题,如何处理缺失数据也是一个热门的研究领域.介绍了缺失数据产生的原因,分类总结了缺失数据的处理方法,最后,提出了处理缺失数据的一些挑战性课题。
- 刘星毅曾春华江南雨陈振华韦小玲
- 关键词:数据预处理缺失数据