张珠玉
- 作品数:3 被引量:12H指数:2
- 供职机构:山东师范大学信息科学与工程学院更多>>
- 发文基金:山东省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 改进的访问统计方法及对用户兴趣度的计算被引量:9
- 2011年
- 为解决传统的以点击量为标准的网络访问统计方法对网络访问量表示不准确的问题,分析了现有的两种统计方法,提出了一种改进的网络访问统计方法。在点击量的基础上,引入用户停留时间,并把两种统计量进行合并,设计了一个兼有点击量和停留时间两种衡量尺度的表示网络访问量的统计量。把改进的网络访问统计方法引入到对用户兴趣度的计算,并提出了改进的用户兴趣度量化定义,实验结果表明,改进的网络访问统计方法对用户兴趣度的表示更加合理有效。
- 张珠玉刘培玉朱振方迟学芝
- 关键词:访问统计用户兴趣度用户访问行为点击量
- 聚类算法及其在日志数据处理中的应用研究
- 随着科学技术飞速进步,我国计算机网络事业得到极大发展和普及。网络对我们工作、生活和学习的影响无处不在,给我们带来了无比的方便与快捷。然而,计算机网络在给我们带来便利的同时,也引起了各种计算机网络安全问题。在应对这些安全问...
- 张珠玉
- 关键词:聚类算法数据挖掘
- 基于网格的TCP网络日志二次聚类算法被引量:3
- 2011年
- 为了处理网络日志规模过大及其相关问题,根据TCP传输协议的特征,提出一种基于网格的TCP网络日志二次聚类算法(Grid-based TCP Two-step Clustering,GTTC)。通过分析TCP连接过程,采用划分网格的方式把每一条TCP报文日志进行网格内初次聚类,再把初次聚类簇进行网格间二次聚类,最后生成表达整个TCP连接的唯一的日志记录。该算法结合数据库技术,不需预设类簇个数k,可以自主决定生成的类簇。另外,该算法还可以处理实际的动态数据,实现增量式聚类,删除已聚类数据,处理新来网络日志。真实的网络环境测试证明,该算法既大大压缩了TCP日志记录存储量,又保证了日志记录的完整性和准确性,并且不影响用户的正常网络通信。
- 张珠玉刘培玉迟学芝
- 关键词:TCP网络日志网格聚类