浅谈bucket x out of y on condition

2023-11-22 09:40
文章标签 浅谈 bucket condition

本文主要是介绍浅谈bucket x out of y on condition,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

首先,我们先来理解"X"表达的是什么 

       这里的"x"表达的是在把原本的桶分成 份后的顺序的第 个,来个简单的例子:例如有个表被分成了4个buckets,那么这个时候运行 bucket 1 out of  4 on id(我们暂时默认以id分),这句话表示就是把原本的buckets分成4份,取第一份的数据,即取第一桶的数据。到这里只是最简单的形式。

然后我们来看"Y" 表达的是什么

此时可以分为两类:1.Y>buckets的数目    2.Y<buckets的数目

结合x一起来看第一种情况:假设buckets数目有4个,Y=8,x=2

那么这时候很明显只有4个不够8个,这时候它会切分成8份,简单来说会把每一个bucket平均分成两份。下面重点来了,这8个会怎么排序呢? (我简单的画个草图)

他会形成A1,B1 , C1 , D1 , A2 , B2 , C2 , D2以这样的顺序排序。

可以进行验证的:例如我用bucket 1 out of 4 on id,结果如下(我的表用id分成了4个桶)

 

 

可以看到(截取出来的一个字段信息),很明显这是第一个桶内的信息(参考我上面开头刚说的)

employee_id_buckets3.employee_id  
-----------------------------------
124                                            |
120                         
116                         
112 
108                        
104                            
100   

如果我用bucket 5 out of 8 on id 时,结果如下:

employee_id_buckets3.employee_id  
-----------------------------------
124                                            |
116                         
108                        
100   

这里可以看出这是第一个桶内的部分信息。

再来看看我刚刚用的两条命令

select * from employee_id_buckets3 tablesample(bucket 1 out of 4 on employee_id);
select * from employee_id_buckets3 tablesample(bucket 5 out of 8 on employee_id);

一对比,效果很显然,A2在分成8份时,排序时第五位。

结合x一起来看第二种情况:假设buckets数目有4个,Y=2,x=2

如果你上面搞懂了,这个就很简单了。

这时候bucket会合成2份,也就是参数Y的值。那么这时候要明白他是如何分的:如果我们把4个桶编号成A,B,C,D,

那么会他会从前往后分发,先把份数满足,然后多的,在从头分发,所以形成了AC,BD两份

select * from employee_id_buckets3 tablesample(bucket 1 out of 2 on employee_id);

他会取第一个桶内的数据。就是AC两个桶的数据。

这篇关于浅谈bucket x out of y on condition的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/409226

相关文章

浅谈主机加固,六种有效的主机加固方法

在数字化时代,数据的价值不言而喻,但随之而来的安全威胁也日益严峻。从勒索病毒到内部泄露,企业的数据安全面临着前所未有的挑战。为了应对这些挑战,一种全新的主机加固解决方案应运而生。 MCK主机加固解决方案,采用先进的安全容器中间件技术,构建起一套内核级的纵深立体防护体系。这一体系突破了传统安全防护的局限,即使在管理员权限被恶意利用的情况下,也能确保服务器的安全稳定运行。 普适主机加固措施:

浅谈PHP5中垃圾回收算法(Garbage Collection)的演化

前言 PHP是一门托管型语言,在PHP编程中程序员不需要手工处理内存资源的分配与释放(使用C编写PHP或Zend扩展除外),这就意味着PHP本身实现了垃圾回收机制(Garbage Collection)。现在如果去PHP官方网站(php.net)可以看到,目前PHP5的两个分支版本PHP5.2和PHP5.3是分别更新的,这是因为许多项目仍然使用5.2版本的PHP,而5.3版本对5.2并不是完

浅谈java向上转型和乡下转型

首先学习每一种知识都需要弄明白这知识是用来干什么使用的 简单理解:当对象被创建时,它可以被传递给这些方法中的任何一个,这意味着它依次被向上转型为每一个接口,由于java中这个设计接口的模式,使得这项工作不需要程序员付出任何特别的努力。 向上转型的作用:1、为了能够向上转型为多个基类型(由此而带来的灵活性) 2、使用接口的第二个原因却是与使用抽象基类相同,防止客户端创建该类的对象,并确保这仅仅

【Spring Boot】 SpringBoot自动装配-Condition

目录 一、前言二、 定义2.1 @Conditional2.2 Condition2.2.1 ConditionContext 三、 使用说明3.1 创建项目3.1.1 导入依赖3.1.2 添加配置信息3.1.3 创建User类3.1.4 创建条件实现类3.1.5 修改启动类 3.2 测试3.2.1 当user.enable=false3.2.2 当user.enable=true 3.3

【前端安全】浅谈XSS攻击和防范

定义 XSS是跨站脚本攻击(Cross Site Scripting),为不和层叠样式表(Cascading Style Sheets, CSS)的缩写混淆,故将跨站脚本攻击缩写为XSS。 恶意攻击者往Web页面里插入恶意Script代码,当用户浏览该页之时,嵌入其中Web里面的Script代码会被执行,从而达到恶意攻击用户的目的。 分类 大分类小分类原理非存储DOM型① 不需要经过服务器

Java并发:互斥锁,读写锁,Condition,StampedLock

3,Lock与Condition 3.1,互斥锁 3.1.1,可重入锁 锁的可重入性(Reentrant Locking)是指在同一个线程中,已经获取锁的线程可以再次获取该锁而不会导致死锁。这种特性允许线程在持有锁的情况下,可以递归地调用自身的同步方法或代码块,而不会因为再次尝试获取相同的锁而被阻塞。显然,通常的锁都要设计成可重入的。否则就会发生死锁。 synchronized关键字,就是

水处理过滤器运行特性及选择原则浅谈

过滤属于流体的净化过程中不可缺的处理环节,主要用于去除流体中的颗粒物或其他悬浮物。水处理过滤器的原理是利用有孔介质,从流体中去除污染物,使流体达到所需的洁净度水平。         水处理过滤器的滤壁是有一定厚度的,也就是说过滤器材具有深度,以“弯曲通 道”的形式对去除污染物起到了辅助作用。过滤器是除去液体中少量固体颗粒的设备,当流体进入置有一定规格滤网的滤筒后,其杂质被阻挡,而

浅谈NODE的NPM命令和合约测试开发工具HARDHAT

$ npm install yarn -g  # 将模块yarn全局安装 $ npm install moduleName # 安装模块到项目目录下 默认跟加参数 --save 一样 会在package文件的dependencies节点写入依赖。   $ npm install -g moduleName # -g 的意思是将模块安装到全局,具体安装到磁盘哪个位置,要看 npm root -g

浅谈SOC片上系统LoRa-STM32WLE5数据安全防御机制

随着物联网设备的普及,数以亿计的设备正在通过无线网络进行通信,传输大量的敏感数据。这种大规模的设备联网带来了便捷性,但也伴随着巨大的安全风险。SoC片上系统通过将无线通信、处理器、存储和安全机制集成在同一个芯片中,为物联网应用提供了高度集成的解决方案。这种设计大大简化了硬件开发流程,同时提高了设备的整体性能和安全性。SoC不仅能够满足长距离、低功耗的无线通信需求,还能通过先进的加密技术,确保数据在

浅谈RabbitMQ的基石—高级消息队列协议(AMQP)

点击上方蓝色字体,选择“设为星标” 回复”资源“获取更多资源 大数据技术与架构 点击右侧关注,大数据开发领域最强公众号! 大数据真好玩 点击右侧关注,大数据真好玩!     前言 自从去年做了不少流式系统(Flink也好,Spark Streaming也好)对接RabbitMQ的实时作业。之前一直都在Kafka的领域里摸爬滚打,对RabbitMQ只是有浅薄的了解而已。随着自己逐渐把R