数据中心传输(5):分流同质流量消除不确定性

2024-04-12 05:20

本文主要是介绍数据中心传输(5):分流同质流量消除不确定性,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

数据中心传输(1):云数据中心传输的出路
数据中心传输(2):再谈数据中心网络传输
数据中心传输(3):数据中心网络不是互联网
数据中心传输(4):提升网络传输性能的误区

本文接着上面这些继续,希望这是倒数第二篇。

统计复用网络要用统计的方式去规划使用,将所有流量扔进一个只携带 buffer,没有任何 arq,不支持任何 qos 的网络就足以保证可用性,剩下还要做啥,无非是想让传输效率更高罢了。

吞吐是资源决定的,但抖动可以优化。抖动的根源是不同尺度的统计特征相互影响所致,隔离不同的统计尺度就行了。

统计的本质是概率,而概率是精确度的度量,概率是精确度量的反面。统计复用网络本质上在处理突发,而突发无论从频度还是长度而言都是概率,如果拥有这些概率的分布特征,自然就获得了更高精确度,处理突发就会高效。

如果通过数据采集分析获知数据中心有 20% 流量持续时间 1~5us,有 30% 流量持续时间 100~120us,有 30% 流量持续时间 2000us 以上,我们就有理由将这 3 类流量视为该数据中心特征流量,为其分别创建通道,并将符合这些特征的流量导入各自通道,最小化了方差。

我一再强调的按突发长度分流,分流,分流,记住这不是一个算法,不用纠结它怎么实现,它很简单后面会说,这个分流只是一个前置动作,把统计方差缩小,用同质交换弹性。

提高统计复用效率的本质在于消除不确定性,因材施教。

因材施教的反面是有教无类,哪个好?把学霸和学渣放在一个班级,试图因材施教,要怎么做?即使把资源倾向学霸,学渣还是会扰乱秩序而影响学霸,把资源分给学渣,也不会被有效利用。按照统计复用原则,他们就应该在一个班,但显然这极其低效,因为学霸和学渣之间没有共识,还是得按成绩分班才高效。

分流类似分班,目标是让同一通道流量对拥塞和丢包原因有共识,剩下的拥塞控制该怎么玩还怎么玩。既然要优化了,为啥还非要死守着把所有流量丢进一个网络这基本信条,试图通过一个万能的算法自适应对待它们呢。想因材施教,首先应把相似长度的流量丢进一个网络通道。

分流的核心主要是要把短突发流量和 capacity–searching 流量隔离,一旦隔离,短突发通道配置小带宽,大 buffer,capacity–searching 通道配置大带宽,小 buffer 就能解决大部分问题。若不隔离,不管配置多大带宽,多大 buffer 都还是乱糟糟,主要还是两类流量对 buffer 用法没有共识,短突发流量用 buffer 做暂存,而 capacity–searching 流量则借 buffer 做 probe(无论 aimd 还是 bbr),二者的干扰后果可想而知,短突发流量瞬间占满 buffer 又瞬间腾出,capacity–searching 流量会因此抖动(无论主动退避还是丢包重传,或者仅仅被挤压),而 capacity-searching 流量在统计意义上会持续稳定占据一定量 buffer(甚至 buffer 倾向于将满未满),这将降低 buffer 吸收突发的能力而造成短突发丢包。

现有的 queuing policy,qos 倾向于包分类 enqueue,然后在 queue 间执行调度,而分类标准或主观或无法表示流量特征,多数仅仅根据业务重要性区分了优先级,太复杂等于无。

我们讨论操作系统调度时,作为统计复用系统,将所有进程,中断无差别扔到所有 cpu 上就能保证可用性,但我们也曾亲眼目睹小包中断是如何拖慢计算进程的,本质上也还是长任务和短任务对时间片没有共识,放在一起调度当然就有问题,任何调度策略都帮不了,那么显然就是设置优先级,绑核对不对,但为什么绑核效果并没那么好。优先级,绑核无异于网络中的优先级队列,资源预留,这破坏了统计复用基础,比较时兴的做法反而是 cgroup,想想为什么。

网络也需要一个 cgroup 的机制,至于流量如何往里面扔,那是另一个问题。

前提一定是获得数据中心的流量分布特征。业务在 send 的时候自己肯定知道长度,按 getlength 的结果打签即,或者干脆事先硬编码,getlength 在 1~5mtu 之间的 send 进入通道 1 用 homa,getlength 在 6~10mtu 的进入通道 2 用硬 pacing,而 1000~5000mtu 的则使用 cubic,bbr。总之还是要在传输频度和长度两个维度量化从 “紧急重要” 到 “不紧急不重要” 的流量类型。

短突发流量往往没有足够的时间来感知和响应拥塞而适应带宽,用足够大的 buffer 缓存它们就是最简单的方法,而大象流存活时间足够久,以至于有足够时间探测适应带宽并公平收敛,因此用较小的 buffer 就能满足。甚至只让 buffer 大小与通道流量长度负相关,根本不需要配置任何调度规则都能预期有好的效果。

别做弹性。流量不可预期的话根本做不到弹性自适应。觉得短突发通道大 buffer 在很长时间闲置浪费而为其它通道提供弹性,又拐回到了老路,引入的复杂性将直接抵消弹性的收益甚至会代偿。能固化资源的就别指望弹性自适应,随机环境中任何算法都斗不过概率,要弄巧成拙的,当然,有 kpi 压力的另说。

只有一个原则,网络是报文要尽快离开的地方,源目之间,专线最短,任何花哨的算法策略都是添堵,多想想怎么模拟专线。如果实在怕被开除,非得卷点啥,那就试试开大会,写论文,写写公众号吧。

浙江温州皮鞋湿,下雨进水不会胖。

这篇关于数据中心传输(5):分流同质流量消除不确定性的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/896210

相关文章

小型数据中心是什么?如何建设?

在数字化时代,小型数据中心正成为许多企业和组织加强数据管理和服务扩展的理想选择。与传统大型数据中心相比,小型数据中心以其灵活性、高效性和相对较低的运营成本吸引着越来越多的关注。然而,要成功建设一个小型数据中心,并确保其安全、可靠和高效运行,需要综合考虑多个关键因素和最佳实践。本文将深入探讨小型数据中心的定义、关键要点以及建设过程中的注意事项,帮助您全面理解和规划这一重要的IT基础设施。 小型数据

一份LLM资源清单围观技术大佬的日常;手把手教你在美国搭建「百万卡」AI数据中心;为啥大模型做不好简单的数学计算? | ShowMeAI日报

👀日报&周刊合集 | 🎡ShowMeAI官网 | 🧡 点赞关注评论拜托啦! 1. 为啥大模型做不好简单的数学计算?从大模型高考数学成绩不及格说起 司南评测体系 OpenCompass 选取 7 个大模型 (6 个开源模型+ GPT-4o),组织参与了 2024 年高考「新课标I卷」的语文、数学、英语考试,然后由经验丰富的判卷老师评判得分。 结果如上图所

探索蓝牙协议的奥秘:用ESP32实现高质量蓝牙音频传输

蓝牙(Bluetooth)是一种短距离无线通信技术,广泛应用于各种电子设备之间的数据传输。自1994年由爱立信公司首次提出以来,蓝牙技术已经经历了多个版本的更新和改进。本文将详细介绍蓝牙协议,并通过一个具体的项目——使用ESP32实现蓝牙音频传输,来展示蓝牙协议的实际应用及其优点。 蓝牙协议概述 蓝牙协议栈 蓝牙协议栈是蓝牙技术的核心,定义了蓝牙设备之间如何进行通信。蓝牙协议

说一说三大运营商的流量类型,看完就知道该怎么选运营商了!

说一说三大运营商的流量类型,看完就知道该怎么选运营商了?目前三大运营商的流量类型大致分为通用流量和定向流量,比如: 中国电信:通用流量+定向流量 电信推出的套餐通常由通用流量+定向流量所组成,通用流量比较多,一般都在100G以上,而且电信套餐长期套餐较多,大多无合约期,自主激活的卡也是最多的,适合没有通话需求的朋友办理。 中国移动:通用流量+定向流量 移动推出的套餐通常由通用流量+定向

TCP 可靠传输的工作原理

转载地址:https://my.oschina.net/xinxingegeya/blog/485233 感谢原作者 TCP 可靠传输的工作原理 ARQ(Automatic Repeat-reQuest)(自动重传请求) 停止等待ARQ协议 连续ARQ协议   停止等待ARQ协议 全双工通信的双发既是发送方也是接收方。下面为了讨论问题的方便,我们仅考虑A发送数据而B接受数据

微软搁置水下数据中心项目——项目纳蒂克相比陆地服务器故障更少

“我的团队努力了,并且成功了,”CO+I负责人诺埃尔·沃尔什说。 微软已悄然终止了始于2013年的水下数据中心(UDC)项目“纳蒂克”。该公司向DatacenterDynamics确认了这一消息,微软云运营与创新部门负责人诺埃尔·沃尔什表示:“我不会在世界任何地方建造海底数据中心。”她随后补充道:“我的团队进行了这个项目,而且效果很好。我们学到了很多关于海平面以下操作的知识,包括振动对服务器的影

H264 视频文件 帧格式 传输封装等 杂碎

rfc3984  Standards Track [Page 2] RFC 3984 RTP Payload Format for H.264 Video February 2005 1.  按照RFC3984协议实现H264视频流媒体 nalu单元 包起始 0x 00 00 00 01 H.264 NAL格式及分析器 http://hi.baidu.com/zsw%5Fdavy/b ...

RTP:实时传输协议详解(转)

实时传输协议RTP 1.RTP协议: RTP( Real-time Transport Protocol)协议最初是在70年代为了尝试传输声音文件,把包分成几部分用来传输语音,时间标志和队列号。经过一系列发展,RTP第一版本在1991年8月由美国的一个实验室发布了。到本世纪1996年形成了标准的的版本。很多著名的公司如Netscape ,就宣称“Netscape LiveMedia”是基于RTP协

mediasoup源码分析(七)transport传输

transport传输 一、Tansport 转发到Producer二、RtpStreamRecv 处理收到的包三、数据传输到Router,再分发到Consumertips 一、Tansport 转发到Producer Transport收到数据packet后,会解析出packet中所带的ssrc字段,然后基于ssrc找到该数据的Producer。 Transport::Re

嵌入式实验---实验六 I2C传输实验

一、实验目的 1、掌握STM32F103I2C传输程序设计流程; 2、熟悉STM32固件库的基本使用。 二、实验原理 1、本案例利用I/O端口通过KEY01按键来控制STM32F103R6向24C02写入“hello”,通过另外一个按键KEY02来控制STM32F103R6从24C02读取“hello”(对应十六进制为“68 65 6c 6f”),并通过一个I2C模拟器显示相关信息。同时,