HASH JION AND NESTED JION

2024-01-30 16:48

文章标签 nested hash jion

本文主要是介绍HASH JION AND NESTED JION，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

关于HASH_JION的原理

我们在做hash_join关联的时候，一般会有两张表，

其中较小的表我们叫做：build input

较大的表我们叫做:probe input ;

那么oracle是如何让这两张表做关联的呢？

首先，oracle会选择build input，将其读入到内存中，

这里oracle会给hash_join一块单独的内存叫hash area，

如果build input小于指定的hash area则，再对probe input做hash 链接

如果我们的build input大于指定的hash area，

则build input和probe input做分区处理，将这两个划分到

不同的分区中去，如果划分后大小合适的话，则读入到hash area中做hash处理

如果划分后还是比较大的话，oracle会做nested—loops hash join处理，

直到符合hash area的大小。

详细资料： http://hwhuang.iteye.com/blog/1479076

ABOUT NESTED JOIN

这个连接的方法中有驱动表（外部表）的概念。

其实这个连接就是2层的嵌套循环问题，所以外层的循环表越小越好，

这样从理论上来说循环的次数将会减少，这也就是我们为什么将小表或者row source较小的表

作为外层循环表的理论依据。因为在正确的选择中这样的处理方式从理论上来说将会减少I/O的数量

但是这个也不是绝对的依据。

我们决定的那张表为驱动表也就是外部表对SQL的执行效率有重要的影响，其内部的连接方式是：

row source1的row1-->probe row source2（驱动表，外部表）

row source1的row2-->probe row source2（驱动表，外部表）

row source1的row3-->probe row source2（驱动表，外部表）

从它的运行原理上我们也能够看到row source2选择的重要性。

当然如果row source1比较小的话，这种执行方式的效率也会更高。

一般情况下row source1通过index去访问row source2的话效率也会更高，当然前提是row source2必须有index。

row source1去匹配row source2的所有行，如果有匹配的结果，则将其放入将要返回的结果集中。

看到这里，我们可能会想到，使用这种方式，原理上我们一定需要遵守两种最简单的条件，当然如果

不满足的话也没关系，只不过性能上会差一些吧，

（1）我们在选择驱动表（外表）的时候尽量的选择小一些的，这样理论上物理的I/O将将会少一些。

（2）尽量的在驱动表上建立索引，这样的话查询的效率会高一些。

这篇关于HASH JION AND NESTED JION的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！