郝珺
- 作品数:3 被引量:8H指数:2
- 供职机构:西安铁路局更多>>
- 发文基金:中央高校基本科研业务费专项资金陕西省交通科技项目国家自然科学基金更多>>
- 相关领域:交通运输工程自动化与计算机技术更多>>
- 高速公路收费数据中环境-运营特征关联规则挖掘被引量:3
- 2015年
- 针对传统关联规则挖掘算法在海量高速公路收费数据挖掘交通规律时存在的运算冗余、复杂度高、代价大等问题,提出一种改进的Apriori算法,可获得收费数据中环境特征与运营特征间的关联规则。首先将收费数据特征属性划分为收费站信息、时间信息、气象信息、运营信息4类,并进一步划分为环境特征域与运营特征域,从而构建收费数据特征模型;其次提出基于目标域的关联规则挖掘算法,在传统Apriori算法频繁项集产生过程中,根据期望规则结构以及已知规则后件,过滤无效项集,形成仅包含目标域的关联规则;最后,讨论了高速公路收费数据挖掘中的数据清理、离散化与数据拟合等问题,并在西宝(西安—宝鸡)高速公路收费数据集上进行了验证。试验结果表明:提出的方法时、空代价优于传统算法,能有效减少频繁项集数量,规则置信度在93%以上;试验中得到收费站位置、通行时间、气温及是否免费日等环境特性对车辆运行速度和收费站通行率的影响规则,这些规则可为高速公路交通控制及信息服务提供支持。
- 杜瑾郝珺樊海玮
- 关键词:交通工程交通信息关联规则目标域
- 一种基于频繁序列匹配的交通状态趋势预测方法
- 2014年
- 海量的交通流数据中一定隐藏着某些潜在的交通状态演变规律,然而少有研究能以实验的方法支持这种观点。本文提出一种基于频繁序列匹配的交通状态趋势预测方法:首先,介绍交通状态序列模型及序列切分处理,其次,提出投影压缩序列相似度计算方法及序列匹配算法,第三,讨论基于频繁序列匹配的交通序列预测算法。通过真实采集数据验证本文提出的方法可行有效。
- 杜瑾郝珺成菊芳
- 关键词:交通流频繁序列模式
- 基于簇形均衡评估的高速公路收费数据聚类被引量:5
- 2016年
- 高速公路收费数据是一种高维、海量、分布特征未知的数据集,因此难以选择何种算法和参数最适合此类数据的聚类.针对此问题,提出一种基于簇形均衡的聚类评估指标IBCS,对各簇的形状、分布、密度和尺寸等多种形态进行均衡综合评估.该指标根据数据集稀疏程度自适应调整邻域置信区间来度量簇结构的分散度和分离度;度量密度使得IBCS具有面向数据集的算法选择能力;度量簇大小避免簇划分过于悬殊的问题.UCI数据集上多种候选算法评估比较实验验证了该指标灵活有效,能获得准确簇数并合理划分.最后,基于IBCS评估的西宝高速公路收费数据聚类结果表明,采用K-means算法,簇数为5时聚类模式最佳.
- 杜瑾郝珺樊海玮
- 关键词:智能交通数据挖掘聚类算法