张瀚韬
- 作品数:2 被引量:10H指数:2
- 供职机构:北京建筑工程学院电气与信息工程学院计算机科学与技术系更多>>
- 发文基金:北京市教委科技发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于MFP方法的Web用户访问模式的模式发现被引量:2
- 2007年
- 针对Web用户访问模式问题,采用最大频繁访问路径(MFP)方法可以挖掘出更有普遍意义的模式。给出一种新的用户访问模式树WUAP-tree结构,并采用E-OEM模型,综合考虑了页面拓扑结构及用户浏览路径等多个数据源,进一步提出了一种Web访问模式挖掘算法WUAP-mine。该算法不用产生候选集和递归,只对事务数据库进行一次扫描,对WUAP-tree结构进行深度优先遍历一次,就可从WUAP-tree结构上直接查询出Web用户频繁访问模式。最后,从理论和实践上推导和验证了它的有效性和高效性。
- 吕橙魏楚元张瀚韬
- 关键词:WEB用户访问模式点击流
- 基于OEM模型的半结构化数据的模式发现被引量:8
- 2006年
- 随着Web数据和数据集成技术的飞速发展,半结构化数据越来越引起人们的重视。半结构化数据是指那些具有隐含结构或结构不严谨的自描述数据。它不同于传统数据中的模式,它是先有数据后有模式,而且半结构化数据的模式是用于描述数据的结构信息而不是对数据结构进行强制约束。为此,半结构化数据的模式发现就成为知识发现的首要步骤。采用了层次数据的概念,提出了分层事务数据库和“累加变换”的计数原则,并据此提出了基于SHDP-tree树结构的SHDP-mine算法和挖掘出半结构、层次数据的基本模式。最后从理论和实验分析和验证了它的有效性和高效性。
- 吕橙魏楚元张瀚韬
- 关键词:OEM模型