国家自然科学基金(61073127) 作品数:4 被引量:42 H指数:3 相关作者: 刘秉权 陈刚 孙承杰 单丽莉 刘铭 更多>> 相关机构: 哈尔滨工业大学 广东科技学院 教育部 更多>> 发文基金: 国家自然科学基金 东莞市科技计划项目 中央高校基本科研业务费专项资金 更多>> 相关领域: 电子电信 一般工业技术 自动化与计算机技术 更多>>
面向信息检索的快速聚类算法 被引量:12 2013年 随着信息检索技术的迅猛发展,针对检索系统的改进已逐渐成为研究的热点.聚类是一种有效的改进策略,通过对检索结果进行聚类,可以使用户快速地定位到自己感兴趣的检索信息所在的类别.然而,传统的检索聚类算法要么运行效率低下,要么类别划分能力不强,使它们无法真正地用于检索系统中.针对此问题,提出了一种新颖的检索聚类算法,该算法首先通过极大极小值理论从检索返回的文档集中抽取多个聚点,并依此形成初始文档类划分结果.在此基础上,算法对初始文档类的特征集合进行细化调整以使类别的划分更加精确;同时对不满足收敛条件的文档类进行层次分裂以解决信息的分层描述问题.实验表明:此算法的时间复杂度与现有的检索聚类技术相差不多,并且由于对特征集合进行迭代调整使得类别的划分更加准确合理. 刘铭 刘秉权 刘远超关键词:权值调整 快速聚类 自组织映射 一种基于CAN-tree快速构建算法 被引量:4 2014年 增量关联挖掘领域是近几年数据挖掘研究的一个热点,而CAN-tree的提出是增量关联挖掘发展的一个重要里程碑.虽然CAN-tree适用于增量关联挖掘,但CAN-tree构建时间长,挖掘效率偏低;针对此问题,提出了一种基于CAN-tree快速构建算法,该算法增加基于哈希表的辅助存储结构,用于减少项目的查找时间,从而提高CANtree的构建速度;增加叶子地址表并修改节点结构及改child指针为parent指针,目的是减少剪枝时间和条件模式基的生成时间,从而提高数据挖掘效率.实验结果表明该算法有效. 陈刚 闫英战 刘秉权关键词:关联规则 一种新型的自适应多叉树抗冲突算法 2013年 针对无线射频识别(Radio Frequency Identification,RFID)系统在识别标签的过程中出现标签碰撞识别效率不高的问题,在传统的自适应多叉树的基础上,提出了一种新型的自适应多叉树(NAMS)的防碰撞算法,该算法在计算碰撞因子选择叉数之前先估算碰撞标签数目N和统计碰撞位数m,直接识别满足N=2m的关系的叶子节点,节省了部分叶子节点的搜索时间;同时引入自动休眠计数机制,平均节省了一半的执行命令数,从而缩短了通信时间.最后对NAMS算法所需总时隙进行理论分析并将该算法用于实验,结果表明,NAMS算法较AMS算法在识别速度和系统吞吐率方面有较大提高. 陈刚 段渊 刘秉权关键词:射频识别 多叉树 文本分类中特征选择方法的比较与改进 被引量:26 2011年 为了在面向旅游领域的文本分类系统中选择有效的分类特征,提高分类性能,本文根据系统采用的训练集、训练过程及分类算法等因素重新对各常用的特征选择方法进行了综合实验评测,比较了五种常用的特征选择方法,对于评测结果最好的三种函数:期望交叉熵、信息增益和互信息,通过理论分析和科学实验,分别提出了不同的改进方法.实验结果表明改进的期望交叉熵方法在本应用中能够最有效地提高系统的分类性能. 单丽莉 刘秉权 孙承杰关键词:文本分类 期望交叉熵