梁作鹏 作品数:10 被引量:122 H指数:5 供职机构: 东南大学计算机科学与工程学院 更多>> 发文基金: 江苏省科技攻关计划 江苏省高技术研究计划项目 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 理学 文化科学 更多>>
一种基于遗传算法的TTP问题求解算法 被引量:53 2003年 提出并实现了一种高校自动排课算法 ,利用遗传算法建立数据模型 ,定义一个四维的染色体编码方式和包含学生人数、教室座位、特殊课程、教师、班级、一门课的时间间隔等因数的适应度函数 .通过切片算子 ,生成指定要求的基因型个体 ,用交叉算子和变异算子对基因型个体进行运算 ,再利用选择算子选择适应度函数值较高的染色体编码方案 ,最后对优化的染色体按指定方向切片 ,生成教师课表、学生课表和教室课表 .对某高校的真实数据进行实验 ,结果显示无一例教室、教师、班级冲突 ,在PⅢ866PC机上运行 ,耗时为 2 3 2 3 .5 73s.该算法可以推广到车辆调度、会议安排。 业宁 梁作鹏 董逸生关键词:时间表 遗传算法 高校 数据模型 一种基于结构信息总结树的XML文档聚类方法 被引量:4 2005年 提出一种有效的XML文档结构信息表达方法,用数字化的结构总结树SST对XML文档的结构信息进行编码,在此基础上给出结构距离的定义,并采用遗传算法对XML文档进行聚类.实验证明该方法分类准确率高,易于实现,且不需先验的DTD知识. 梁作鹏 吴文明 董逸生关键词:XML文档 结构信息 聚类方法 DTD 遗传算法 准确率 数据仓库系统中一种改进的维层次聚集Cube存储结构 被引量:8 2005年 提出利用Cube中的维层次(dimensionhierarchy)聚集技术来创建高性能的维层次聚集Cube(dimensionhierarchyaggregatecube,DHAC).充分利用DHAC已保存的维层次信息,对Cube中多维数据的查询和更新效率进行了优化,并且支持Cube的上探、下钻等语义操作.在DHAC中进行数据插入和删除等数据更新时,由下向上用更新前后的差值对受到更新结点影响的所有祖先结点进行增量更新.实现了在插入新维或维层次时不需要重新构建聚集Cube就可以实现Cube的模式更新.对维层次聚集Cube与传统Cube进行了算法性能分析和比较,理论分析和实验结果都表明,所提出的DHAC性能最佳. 梁作鹏 胡孔法 董逸生 陈崚关键词:数据仓库系统 CUBE 多维联机分析处理 PBC:一种基于路径的XML文档聚类方法 被引量:5 2005年 提出了一种基于路径的XML文档结构聚类方法(PBC).与其他方法直接计算XML文档结构距离不同,该方法通过对文档包含的路径聚类,间接完成文档的聚类.首先,包含某一路径的文档集合形成初始类,并用该路径作为初始类的标识.然后,用层次聚类方法根据设定的标准,合并初始类,直至结束.类的标识信息是类中文档包含的路径,结果直观,容易理解.算法的复杂度是O(n),其中n是文档的大小.相关实验证明该算法不但能保证聚类结果准确,而且能大幅度提高计算的速度. 梁作鹏 业宁 董逸生关键词:XML 信息检索 文档聚类 基于蚁群算法的Web站点导航 被引量:8 2003年 提出了一种Web站点的导航方法.首先利用蚁群算法对已经存在的Web日志进行训练,构造一个有向图,该有向图的节点和边保存了网页与网页间的链接概率和用户行为规则.利用训练结果,预测访问网站的用户行为,根据其行为推荐网页,最后的测试结果表明该方法比单纯的概率分析和关联规则具有更高的精度. 业宁 梁作鹏 董逸生关键词:蚁群算法 网页 WEB日志 数据挖掘 有向图 一种SVM非线性回归算法 被引量:13 2005年 提出了一种新的基于分类的SVM非线性回归算法(CSVR),首先将Y扩展为Y+ε和Y-ε两个数据集,再将n维输入空间X中的数据连同Y+ε和Y-ε组成n+1维空间χ中的两类数据,并用Z∈{+1,-1}来标识两类数据,再利用标准的SVM二分类算法求解。利用该算法对一系列的基准函数进行测试,取得了令人满意的结果。该算法对噪声数据不敏感,具有较好的鲁棒性,并且可以根据实际需要设定ε的大小,防止出现过拟合现象。该算法由于不需要先验地建立一个参数未知的回归模型,因此可以用在其他传统统计回归算法失效的场合。 业宁 梁作鹏 董逸生 王厚立关键词:非线性 支持向量机 A method for publishing relational schema into DTD 2003年 This paper focuses on exporting relational data into extensible markup language (XML). First, the characteristics of both relational schemas represented by E-R diagrams and XML document type definitions (DTDs) are analyzed. Secondly, the corresponding mapping rules are proposed. At last an algorithm based on edge tables is presented. There are two key points in the algorithm. One is that the edge table is used to store the information of the relational dictionary, and this brings about the efficiency of the algorithm. The other is that structural information can be obtained from the resulting DTDs and other applications can optimize their query processes using the structural information. 梁作鹏 王晓玲 徐立臻 董逸生关键词:DTD 面向Web的XML检索关键技术研究 Web作为一个全球化信息空间,蕴含着海量的信息和知识。随着Web上资源的日趋丰富,各种基于Web的信息检索服务应运而生并得到了迅速发展。实践证明,Web搜索引擎是一个非常有用的信息检索工具。但对任一用户查询,搜索引擎都将... 梁作鹏关键词:XML 索引结构 信息检索 文档聚类 文献传递 XML的柔性近似检索 本文提出一种查询 Web 上 XML 信息的方法。该方法支持结构和内容的联合查询,支持任意粒度的返回结果,支持基于内容信息的相关性计算。提出支持该方法实现的索引结构,集成了结构索引和内容索引,用广义后缀树来存储文档集合的... 梁作鹏 徐立臻 董逸生关键词:XML 信息检索 广义后缀树 查询处理 索引结构 文献传递 一种Web用户行为聚类算法 被引量:31 2004年 提出了一种新的路径相似度系数计算方法 ,并使之与雅可比相似系数结合 ,用于计算用户访问行为的相似度 ,在此基础之上又提出了一种分析 Web用户行为的聚类算法 (FCC) ,通过挖掘 Web日志 ,找出具有相似行为的 Web用户 .由于 FCC聚类算法过滤了小于指定阈值的相似度系数 ,大大缩小了数据规模 ,很好地解决了其他聚类算法 (如层次聚类 )在高维空间聚类时的“维数灾难”问题 ,最后的实验结果很好 . 业宁 李威 梁作鹏 董逸生关键词:WEB日志 数据挖掘 聚类 相似度