裴丹 作品数:53 被引量:88 H指数:6 供职机构: 清华大学 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 国家重点基础研究发展计划 更多>> 相关领域: 自动化与计算机技术 电子电信 经济管理 更多>>
支持多模态网络的可扩展异构服务功能链并行编排部署系统 2022年 针对如何在万台服务器规模的多模态数据中心网络内,实现秒级的服务功能链扩容编排部署问题,提出一种可扩展的异构服务功能链并行编排部署(SHOD)系统。SHOD系统对数据中心进行分区,并采用资源使用量最小化的并行编排器设计,从而将服务功能链扩容编排时间降低至秒级。SHOD系统采用满足单一权职原则的中介者设计模式,实现了对异构设备的可扩展的编排部署和服务功能链建链。实验结果表明,SHOD系统的扩容编排时间下降至Daisy的1/12,同时仅引入1.5倍的CPU占用率开销。 陈浩 杨芫 徐明伟 徐明伟 尤艺霖关键词:可扩展性 搜索服务响应时间异常诊断 2024年 较低的网络服务响应时间对提升用户体验至关重要.以搜索引擎这一典型的网络服务场景为例,服务提供商应确保网络服务(搜索)响应时间在1 s以内.在实践中,服务响应时间会受到用户浏览器、运营商、页面加载方式等诸多服务属性的影响.为了进行针对性的优化,服务提供商需要找出使服务响应时间过长的规则,即一些属性的组合.然而现有研究工作遇到了3方面挑战:1)搜索日志数据量大;2)搜索日志数据分布不平衡;3)要求泛化度高的规则.因此设计了Miner(multi-dimensional extraction of rules),一种新型服务响应时间异常诊断框架.Miner使用自步采样机制应对第1个挑战和第2个挑战.针对第3个挑战,Miner使用Corels算法挖掘出泛化率高且召回率高的规则.使用2家国内顶级搜索引擎服务提供商的响应时间日志数据评估了Miner性能,结果显示Miner的泛化率和召回率均高于现有方法,并证明了Miner挖掘出的规则可被运维人员采纳并做针对性的优化. 夏思博 马明华 金鹏翔 崔丽月 张圣林 金娃 孙永谦 裴丹关键词:网络服务质量 搜索引擎 数据挖掘 一种基于贝叶斯优化的异常检测算法的推荐方法及装置 本发明公开了基于贝叶斯优化的异常检测算法的推荐方法及装置,该方法包括,获取采集到的KPI时间序列数据,并确定KPI时间序列数据对应的分类结果,获取分类结果对应的最佳配置,并基于最佳配置通过贝叶斯优化进行搜索得到目标配置候... 裴丹 蔚兆洋基于压缩感知的多指标时间序列异常检测方法和装置 本申请提出一种基于压缩感知的多指标时间序列异常检测方法和装置,涉及数据处理技术领域,其中,方法包括:获取待检测的多个分组多指标时间序列矩阵;对每个分组的多指标时间序列矩阵进行抗异常采样,获取多个采样矩阵;基于压缩感知对多... 裴丹 马明华文献传递 关键性能指标数据的异常检测方法及装置 本发明提出一种关键性能指标数据的异常检测方法及装置,其中,方法包括:对待检测的第一关键性能指标数据进行基线提取,得到第一基线;计算所述第一基线与预先确定的至少一个类别对应的聚类中心的距离,并根据所述距离确定所述第一基线所... 裴丹 李之涵文献传递 基于聚类的多维数据热点发现算法 被引量:6 2019年 数据热点发现的目标是找出数据集中的区域,并以易于人理解的方式将其展示出来.本文针对同时包含数值型特征和类别型特征的多维数据设计了数据热点发现算法,该算法的核心是改进CLTree设计的聚类算法CLTree+.本文改进了CLTree,使其能够直接对同时包含数值型特征和类别型特征的数据进行聚类,并提升了具有周期性性质的数值型特征的聚类效果.除此之外,相比CLTree,CLTree+还大幅度提升了计算效率,使其可以用于处理大规模数据. CLTree+被应用于某大型互联网公司的业务数据,成功找出了若干个数据热点,并以易于理解的特征取值组合的方式将这些信息展示出来. 邹磊 朱晶 聂晓辉 苏亚 裴丹 孙宇关键词:聚类 数据挖掘 决策树 多维数据分析 一种基于OLTP数据库系统的告警根因分析方法及装置 本申请提出的基于OLTP数据库系统的告警根因分析方法、装置及存储介质中,基于告警信息中的告警发生时间生成候选基础指标组,利用候选基础指标组和关键指标组构建目标因果图,计算目标因果图中的每个基础指标组对应节点的告警根因得分... 裴丹 卢香琳文献传递 面向云数据中心多语法日志通用异常检测机制 被引量:11 2020年 得益于自然语言处理和机器学习方法的快速发展,基于日志对云数据中心软硬件系统进行自动异常检测变得越来越流行.无监督学习方法不需要标记异常日志,但通常存在准确性较低、仍需标注大量正常日志的问题.尽管有监督学习方法的准确性较高,但由于不同软硬件系统产生不同类型的、语法各异的日志,导致有监督学习方法需要为每一类型日志标注足够多的异常日志以训练相应的异常检测模型,这极大地增加了标注异常日志的人力成本.与此同时,不同类型日志在发生异常时往往具有相同或相似的语义.因此,提出了一种跨日志类型的通用异常检测机制——LogMerge.该机制通过学习多语法日志的语义相似性,可实现日志异常模式的跨日志类型迁移,从而大大减少了异常标注开销.LogMerge采用词嵌入方法先后构建单词和模板的向量,然后使用聚类方法将语义相同或相近的模板聚成一类,解决了不同类型日志语法不同带来的挑战.此外,LogMerge结合CNN与LSTM方法构建异常检测模型,既有效提取了日志序列的前后依赖性,又显著降低了日志序列中噪声带来的影响.使用公开日志数据集的实验表明,相比于当前的有监督学习方法和无监督学习方法,LogMerge取得了更高的准确性.实验还验证了LogMerge能够显著减少异常标注工作量——在目标类型日志异常标注较少时,依然能够取得较高的准确性. 张圣林 李东闻 孙永谦 孟伟彬 张宇哲 张玉志 刘莹 裴丹关键词:日志 异常检测 CNN 一种基于多模态数据依赖关系的故障诊断方法和装置 本发明公开了一种基于多模态数据依赖关系的故障诊断方法和装置,该方法包括:构建分层依赖关系图,对指标层依赖关系图的节点指标进行故障检测;将故障发生前的第一预设时间段的数据作为训练集,第二预设时间段的数据作为测试集,根据训练... 裴丹 李明杰 卢香琳基于压缩感知的多指标时间序列异常检测方法和装置 本申请提出一种基于压缩感知的多指标时间序列异常检测方法和装置,涉及数据处理技术领域,其中,方法包括:获取待检测的多个分组多指标时间序列矩阵;对每个分组的多指标时间序列矩阵进行抗异常采样,获取多个采样矩阵;基于压缩感知对多... 裴丹 马明华文献传递