SBD算法详解与相关python代码

2023-10-15 04:40

本文主要是介绍SBD算法详解与相关python代码,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本文为原创,转载请注明出处,谢谢!

https://blog.csdn.net/qq_22135585/article/details/108830390

 

当涉及到延时情况,如kpi数据,在判断两两特征相关性的时候就不得不考虑SBD算法了。

通过SBD算法,我们可以在不清楚延迟的情况下找到两组数据的相关性,以下来进行详细讲解。

 

SBD算法

       对于时间序列X()及时间序列Y(),两序列间的存在时延为s的关系,计算两条曲线相似度的SBD距离算法如下:

                  

                  NCC(X,Y)=

                  SBD(X,Y)=1-NCC(X,Y)

 

      其中,NCC为序列X,Y的标准化互相关系数,NCC的取值范围在-1到1之间,与皮尔森相关系数类似。 所以最终计算的SBD算法结果在0到2之间,越靠近0时,两组数据相关性越强。当SBD为0时,说明序列X,Y波动曲线一致,为同一序列。在后面的代码中,考虑到输出NCC的值更有统计学意义,因此就直接输出NCC了。

 

      由于SBD算法计算的是距离,因此在计算距离前我们需要进行Z-score归一化处理。

      细心的朋友可以发现,当延迟为0时,归一化后该算法中的ncc值相当于在计算皮尔森相关系数。

      SBD算法的缺点就是计算量大,在类似KPI场景数据量庞大的时候,SBD算法可能无法得到支撑。

      但是,在涉及告警根因分析等问题时,SBD能自动的判断出延迟的位数。

      我们可以通过对比延时的大小,从而准确地判断出故障根因。

  

   注意事项:使用算法时切记要在告警点附近使用!!注意避开周期性的数据,不然可能会出现关联偏差。

 

   好了,废话不多说,这里为大家分享下我写的算法函数:

#SBD距离算法
def calcSBDncc(x,y,s):assert len(x)==len(y)assert isinstance(s,int)length_ = len(x)pow_x = 0pow_y = 0ccs = 0for i in range(length_-s):ccs +=  x[i+s]*y[i]pow_x += math.pow(x[i+s],2)pow_y += math.pow(y[i],2)dist_x =math.pow(pow_x,0.5)dist_y =math.pow(pow_y,0.5)dist_xy = dist_x*dist_yncc = ccs/dist_xyreturn ncc
def calcSBD(x,y,s=None):assert len(x)==len(y)if  s==None:length_ = len(x)ncc_list = []for i in range(int(length_*0.5)):  #这里的0.5保证至少有一半的数据用于相关性的计算了ncc_list.append(calcSBDncc(x,y,i))ncc = max(ncc_list)delay = ncc_list.index(max(ncc_list))sbd = 1 - nccelse:ncc = calcSBDncc(x,y,s)delay = s  #作为告警延时数传递sbd = 1 - ncc #sbd 数据在0-2之间,这里还是返回ncc 更适合相关性解释return ncc,delay

 

 

第一次写原创,请多指教。如果有不明白的地方,欢迎有兴趣的朋友留言交流!

这篇关于SBD算法详解与相关python代码的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/215392

相关文章

Spring Security基于数据库验证流程详解

Spring Security 校验流程图 相关解释说明(认真看哦) AbstractAuthenticationProcessingFilter 抽象类 /*** 调用 #requiresAuthentication(HttpServletRequest, HttpServletResponse) 决定是否需要进行验证操作。* 如果需要验证,则会调用 #attemptAuthentica

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

python: 多模块(.py)中全局变量的导入

文章目录 global关键字可变类型和不可变类型数据的内存地址单模块(单个py文件)的全局变量示例总结 多模块(多个py文件)的全局变量from x import x导入全局变量示例 import x导入全局变量示例 总结 global关键字 global 的作用范围是模块(.py)级别: 当你在一个模块(文件)中使用 global 声明变量时,这个变量只在该模块的全局命名空

康拓展开(hash算法中会用到)

康拓展开是一个全排列到一个自然数的双射(也就是某个全排列与某个自然数一一对应) 公式: X=a[n]*(n-1)!+a[n-1]*(n-2)!+...+a[i]*(i-1)!+...+a[1]*0! 其中,a[i]为整数,并且0<=a[i]<i,1<=i<=n。(a[i]在不同应用中的含义不同); 典型应用: 计算当前排列在所有由小到大全排列中的顺序,也就是说求当前排列是第

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

OpenHarmony鸿蒙开发( Beta5.0)无感配网详解

1、简介 无感配网是指在设备联网过程中无需输入热点相关账号信息,即可快速实现设备配网,是一种兼顾高效性、可靠性和安全性的配网方式。 2、配网原理 2.1 通信原理 手机和智能设备之间的信息传递,利用特有的NAN协议实现。利用手机和智能设备之间的WiFi 感知订阅、发布能力,实现了数字管家应用和设备之间的发现。在完成设备间的认证和响应后,即可发送相关配网数据。同时还支持与常规Sof

sqlite3 相关知识

WAL 模式 VS 回滚模式 特性WAL 模式回滚模式(Rollback Journal)定义使用写前日志来记录变更。使用回滚日志来记录事务的所有修改。特点更高的并发性和性能;支持多读者和单写者。支持安全的事务回滚,但并发性较低。性能写入性能更好,尤其是读多写少的场景。写操作会造成较大的性能开销,尤其是在事务开始时。写入流程数据首先写入 WAL 文件,然后才从 WAL 刷新到主数据库。数据在开始

【数据结构】——原来排序算法搞懂这些就行,轻松拿捏

前言:快速排序的实现最重要的是找基准值,下面让我们来了解如何实现找基准值 基准值的注释:在快排的过程中,每一次我们要取一个元素作为枢纽值,以这个数字来将序列划分为两部分。 在此我们采用三数取中法,也就是取左端、中间、右端三个数,然后进行排序,将中间数作为枢纽值。 快速排序实现主框架: //快速排序 void QuickSort(int* arr, int left, int rig

活用c4d官方开发文档查询代码

当你问AI助手比如豆包,如何用python禁止掉xpresso标签时候,它会提示到 这时候要用到两个东西。https://developers.maxon.net/论坛搜索和开发文档 比如这里我就在官方找到正确的id描述 然后我就把参数标签换过来