杨凡丁
- 作品数:4 被引量:15H指数:2
- 供职机构:浙江理工大学信息电子学院更多>>
- 相关领域:自动化与计算机技术经济管理更多>>
- 一种基于页面兴趣度的关联规则研究被引量:1
- 2009年
- 给出了页面兴趣度的定义,并针对传统的Apriori关联规则算法必须经过大量反复扫描数据库才能产生候选项集的问题,提出了一种改进算法。此算法将数据库经过预处理后,对事务数据库进行分段,比较时可不针对所有事务记录,从而减少比较时间。最后将页面兴趣度应用于改进的Apriori算法中,形成一种基于页面兴趣度的关联规则算法——I_NEW_AR算法。实验结果表明,该算法不仅提高了挖掘效率,而且应用于网上推荐系统具有较好的准确率。
- 刘建东刘建平严奉华杨凡丁
- 关键词:页面兴趣度WEB数据挖掘关联规则
- 改进的Web访问日志会话识别算法被引量:12
- 2008年
- 针对Web日志挖掘中的会话识别问题,分别对Timeout方法、参引长度法进行改进,提出了一种改进的会话识别方法。该方法运用网站的拓扑结构信息,动态设定各页面的时间间隔阀值,使页面时间间隔阀值同页面的重要程度结合起来。同时通过灵活界定内容页,并针对内容页,提出了一些启发式规则,突破了"参引长度法"所固有的一个会话中只包含一个内容页的瓶颈。该方法提高了会话识别的准确度,实验结果表明是有效的。
- 严奉华刘建平杨凡丁
- 关键词:WEB日志挖掘数据预处理会话启发式规则
- 基于关联规则的WEB使用挖掘及其在电子商务中的应用研究
- 由于应用性数据的爆炸式增长(如商业分析),及计算机的软硬件技术的发展日趋完备,近几年来数据挖掘已经成为应用最广泛的数据分析工具。数据挖掘需要配合许多其它领域的技术才能得到完善有效的结果,其中包括机器学习,人工智能,统计学...
- 杨凡丁
- 关键词:数据挖掘WEB使用挖掘关联规则电子商务决策支持
- 文献传递
- 浏览行为数据在Web用法挖掘中的应用被引量:2
- 2008年
- 网站用户的浏览行为的不确定性导致从现有的Web日志文件挖掘出的事务模式来预测用户行为越来越困难。引入一种新的数据类型浏览行为数据(BAD)用于提高Web用法挖掘的质量,BAD是一种特殊的浏览数据,如"复制","滚动","另存为",并且没有被日志文件所记录,并给出了BAD的定义。为了象Web日志文件一样记录BAD,介绍并使用一种现有的在线数据收集模块来捕获用户BAD。通过一个电子商务程序的实例说明BAD能增加现有Web事务挖掘算法的有效性。
- 杨凡丁刘建平严奉华
- 关键词:浏览行为