Not All Microseconds are Equal研读笔记

2023-11-09 01:11

本文主要是介绍Not All Microseconds are Equal研读笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 文章信息
  • 文章内容
    • 设计思路
    • 探测数据包生成器
    • 数据包延迟估计器

文章信息

M. Lee, N. Duffield, and R. R. Kompella, “Not all microseconds are equal: fine-grained per-flow measurements with reference latency interpolation,” in Proceedings of the ACM SIGCOMM 2010 conference on SIGCOMM - SIGCOMM ’10, New Delhi, India, 2010, p. 27, doi: 10.1145/1851182.1851188.

文章内容

设计思路

这篇文章介绍了一种用于测量流级别的网络延迟的方案 RLI (Reference Latency Interpolation). RLI主要受到以下这一现象的启发, 即数据包的传输延迟在时间上和空间上具有局部性. 具体而言, 就是对于通过同一条链路的数据包, 如果他们通过这条链路的时间相近, 那么他们的传输延迟也是相仿的. 这个很好理解, 因为数据包的传输延迟主要来自于他们在网络设备中的排队延迟, 而相邻的数据包在网络设备中所观察到的队列长度是相近的, 这就导致了他们经历的网络传输延迟也相近. 因此, 我们可以在信息流中插入一系列的探测数据包, 这些数据包中携带了发送方的本地时间戳. 接收方受到这些探测数据包以后, 可以根据其中携带的时间戳以及本地时间来计算出这些数据包的传输延迟, 并用这些延迟来推测出两个相邻探测数据包之间的普通数据包的传输延迟. 同时, 我们通过对普通数据包进行采样, 可以获得网络中数据流的信息, 而采样的数据包的传输延迟可以通过RLI获得, 所以这些数据流的传输延迟也就可以通过RLI获得.

这一方法的一大优势是, 它不需要对数据包进行修改, 而且它可以用于任何的数据流测量算法, 比如NetFlow等.

RLI包含了两个组件, 即探测数据包生成器, 以及数据包延迟估计器. 其中, 探测数据包生成器可以根据网络带宽的使用情况来实时计算探测数据包的生成频率, 从而使得网络不会因为探测数据包的频繁发送而过载, 同时当网络带宽利用率较低的时候可以发送较多的探测数据包, 从而提高网络延迟测量的精度. 在获得探测数据包的网络延迟以后, 数据高延迟估计器可以探测数据包的网络延迟来估计普通数据包的传输延迟, 并最终计算数据流的延迟.

探测数据包生成器

探测数据包生成器的主要任务是根据当前的网络状况来计算探测数据包的发送速率. 每当发送了一个探测数据包以后, 生成器就会立即计算一个新的探测数据包发送速率, 而这一速率可以直接映射成为发送下一个探测数据包所需要的等待时间. 具体算法如算法1所示. 这里我们对算法1进行一个简要的介绍.

我们将两个探测数据包发送时间之间的时间间隔成为探测间隔. 假设上一个探测间隔 (即刚才发送的探测数据包和它之前的探测数据包之间的时间间隔)之内经过被测链路的流量为 c b c_b cb字节, 上一个探测间隔长度为 d r p d_{rp} drp秒, 链路的带宽为 l c l_c lc, 所以从上一个探测数据包到刚才发送的探测数据包这段时间内链路的带宽利用率为:
u i n s t a n t ← c b / d r p / l c u_{instant}\gets c_b/d_{rp}/l_c uinstantcb/drp/lc

我们对链路的带宽利用率做平滑处理. 令 0 < α < 1 0< \alpha < 1 0<α<1, u e s t u_{est} uest为链路的带宽利用率, 则考虑上一个探测间隔的带宽利用率以后, 我们得到新的带宽利用率如下:
u e s t ← u i n s t a n t ⋅ α + u e s t ⋅ ( 1 − α ) u_{est}\gets u_{instant}\cdot\alpha + u_{est}\cdot (1-\alpha) uestuinstantα+uest(1α).

我们预先设定了链路带宽利用率的最大值 u m a x u_{max} umax和最小值 u m i n u_{min} umin, 因此如果我们计算出的当前带宽利用率 u e s t u_{est} uest超过了 [ u m i n , u m a x ] [u_{min}, u_{max}] [umin,umax]的范围, 则我们需要对 u e s t u_{est} uest进行修正. 我们修正 u e s t u_{est} uest的方式如下 (实际上我们用 u e f f u_{eff} ueff来代替了 u e s t u_{est} uest, 此外算法1中并没有体现修正的过程):
u e f f ← min ⁡ { u m a x , u e f f } u e f f ← max ⁡ { u m i n , u e f f } u_{eff} \gets \min\{u_{max}, u_{eff}\}\\ u_{eff} \gets \max\{u_{min}, u_{eff}\} ueffmin{umax,ueff}ueffmax{umin,ueff}

最后我们计算探测数据包的发送速率. 我们预先设定了探测数据包的最大发送速率 r m a x r_{max} rmax和最小发送速率 r m i n r_{min} rmin. 链路的带宽利用率越高, 则探测数据包的发送速率越低, 当链路的带宽利用率为 u m a x u_{max} umax, 探测数据包的发送速率为 r m i n r_{min} rmin; 链路的带宽利用率越低, 则探测数据包的发送速率越高, 当链路的带宽利用率为 u m i n u_{min} umin时, 探测数据包的发送速率为 r m a x r_{max} rmax. 具体的计算探测数据包发送速率的方法如下:
r e f f ← r m i n + ( r m a x − r m i n ) ⋅ 1 − ( u e f f − u m i n u m a x − u m i n ) 2 r_{eff}\gets r_{min} + (r_{max} - r_{min})\cdot\sqrt{1 - (\frac{u_{eff} - u_{min}}{u_{max} - u_{min}})^2} reffrmin+(rmaxrmin)1(umaxuminueffumin)2
在这里插入图片描述

数据包延迟估计器

接收方有一个存放数据包的缓冲区. 当接收方收到一个探测数据包以后, 它就会对这个探测数据包之后到达的(被采样的)正常数据包进行缓存, 直到下一个探测数据包到达. 一旦接收方受到了两个探测数据包, 它就会根据这两个探测数据包的传输延迟对这两个探测数据包之间的正常数据包的传输延迟进行估计. 具体而言, 探测间隔左右两侧的探测数据包的到达时间分别为 τ l \tau_l τl τ r \tau_r τr, 它们的传输延迟分别为 d l d_l dl d r d_r dr, 当前我们要估计其传输延迟的数据包的到达时间为 τ a \tau_a τa, 则易得这个数据包的传输延迟的估计值为:
d l + τ a − τ l τ r − τ l ⋅ ( d r − d l ) d_l + \frac{\tau_a - \tau_l}{\tau_r - \tau_l}\cdot (d_r - d_l) dl+τrτlτaτl(drdl)
所以当前数据包的到达时间越接近 τ l \tau_l τl, 则它的传输延迟估计值越接近 d l d_l dl; 它的到达时间越接近 τ r \tau_r τr, 则它的传输延迟估计值越接近 d r d_r dr.

原文中, 在估计一个数据包的传输延迟的时候, 它还增加了一个修正项, 即它同时考虑了网络设备将一个数据包进行串行化 (serilization)所用的时间. 假设探测数据包的长度为 b b b, 待测数据包的长度为 b a b_a ba, 链路带宽为 l c l_c lc, 则他们的串行化时间之差为:
b a − b l c \frac{b_a - b}{l_c} lcbab

所以最终对数据包的传输延迟的估计值为
d ^ ← d l + τ a − τ l τ r − τ l ⋅ ( d r − d l ) + b a − b l c \hat{d} \gets d_l + \frac{\tau_a - \tau_l}{\tau_r - \tau_l}\cdot (d_r - d_l) +\frac{b_a - b}{l_c} d^dl+τrτlτaτl(drdl)+lcbab

每一个数据包都对应于一个数据流; 我们为每个数据流维护了三个计数器, c , m , v c, m, v c,m,v. 每当得到一个数据包的传输延迟的估计值 d ^ \hat{d} d^以后, 我们就更新这个数据包所对应的流的统计数据如下:
c ← c + 1 , m ← m + d ^ , v ← v + d ^ 2 c\gets c + 1, m \gets m + \hat{d}, v\gets v + \hat{d}^2 cc+1,mm+d^,vv+d^2
最后, 数据流的均值和方差为:
μ ← m / c , σ 2 ← v / m − μ 2 \mu\gets m/c, \sigma^2\gets v/m - \mu^2 μm/c,σ2v/mμ2
(原文中认为 σ 2 ← v / m 2 − μ 2 \sigma^2\gets v/m^2 - \mu^2 σ2v/m2μ2, 但是我认为原文中的方法是错误的.)

这篇关于Not All Microseconds are Equal研读笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/373408

相关文章

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

数学建模笔记—— 非线性规划

数学建模笔记—— 非线性规划 非线性规划1. 模型原理1.1 非线性规划的标准型1.2 非线性规划求解的Matlab函数 2. 典型例题3. matlab代码求解3.1 例1 一个简单示例3.2 例2 选址问题1. 第一问 线性规划2. 第二问 非线性规划 非线性规划 非线性规划是一种求解目标函数或约束条件中有一个或几个非线性函数的最优化问题的方法。运筹学的一个重要分支。2

【C++学习笔记 20】C++中的智能指针

智能指针的功能 在上一篇笔记提到了在栈和堆上创建变量的区别,使用new关键字创建变量时,需要搭配delete关键字销毁变量。而智能指针的作用就是调用new分配内存时,不必自己去调用delete,甚至不用调用new。 智能指针实际上就是对原始指针的包装。 unique_ptr 最简单的智能指针,是一种作用域指针,意思是当指针超出该作用域时,会自动调用delete。它名为unique的原因是这个

查看提交历史 —— Git 学习笔记 11

查看提交历史 查看提交历史 不带任何选项的git log-p选项--stat 选项--pretty=oneline选项--pretty=format选项git log常用选项列表参考资料 在提交了若干更新,又或者克隆了某个项目之后,你也许想回顾下提交历史。 完成这个任务最简单而又有效的 工具是 git log 命令。 接下来的例子会用一个用于演示的 simplegit

记录每次更新到仓库 —— Git 学习笔记 10

记录每次更新到仓库 文章目录 文件的状态三个区域检查当前文件状态跟踪新文件取消跟踪(un-tracking)文件重新跟踪(re-tracking)文件暂存已修改文件忽略某些文件查看已暂存和未暂存的修改提交更新跳过暂存区删除文件移动文件参考资料 咱们接着很多天以前的 取得Git仓库 这篇文章继续说。 文件的状态 不管是通过哪种方法,现在我们已经有了一个仓库,并从这个仓

忽略某些文件 —— Git 学习笔记 05

忽略某些文件 忽略某些文件 通过.gitignore文件其他规则源如何选择规则源参考资料 对于某些文件,我们不希望把它们纳入 Git 的管理,也不希望它们总出现在未跟踪文件列表。通常它们都是些自动生成的文件,比如日志文件、编译过程中创建的临时文件等。 通过.gitignore文件 假设我们要忽略 lib.a 文件,那我们可以在 lib.a 所在目录下创建一个名为 .gi

取得 Git 仓库 —— Git 学习笔记 04

取得 Git 仓库 —— Git 学习笔记 04 我认为, Git 的学习分为两大块:一是工作区、索引、本地版本库之间的交互;二是本地版本库和远程版本库之间的交互。第一块是基础,第二块是难点。 下面,我们就围绕着第一部分内容来学习,先不考虑远程仓库,只考虑本地仓库。 怎样取得项目的 Git 仓库? 有两种取得 Git 项目仓库的方法。第一种是在本地创建一个新的仓库,第二种是把其他地方的某个

Git 的特点—— Git 学习笔记 02

文章目录 Git 简史Git 的特点直接记录快照,而非差异比较近乎所有操作都是本地执行保证完整性一般只添加数据 参考资料 Git 简史 众所周知,Linux 内核开源项目有着为数众多的参与者。这么多人在世界各地为 Linux 编写代码,那Linux 的代码是如何管理的呢?事实是在 2002 年以前,世界各地的开发者把源代码通过 diff 的方式发给 Linus,然后由 Linus