HASH JION AND NESTED JION

2024-01-30 16:48
文章标签 nested hash jion

本文主要是介绍HASH JION AND NESTED JION,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!


关于HASH_JION的原理
我们在做hash_join关联的时候,一般会有两张表,
其中较小的表我们叫做:build input
较大的表我们叫做:probe input ;
那么oracle是如何让这两张表做关联的呢?
首先,oracle会选择build input,将其读入到内存中,
这里oracle会给hash_join一块单独的内存叫hash area,
如果build input小于指定的hash area则,再对probe input做hash 链接
如果我们的build input大于指定的hash area,
则build input和probe input做分区处理,将这两个划分到
不同的分区中去,如果划分后大小合适的话,则读入到hash area中做hash处理
如果划分后还是比较大的话,oracle会做nested—loops hash join处理,
直到符合hash area的大小。
详细资料: http://hwhuang.iteye.com/blog/1479076
ABOUT NESTED JOIN
这个连接的方法中有驱动表(外部表)的概念。
其实这个连接就是2层的嵌套循环问题,所以外层的循环表越小越好,
这样从理论上来说循环的次数将会减少,这也就是我们为什么将小表或者row source较小的表
作为外层循环表的理论依据。因为在正确的选择中这样的处理方式从理论上来说将会减少I/O的数量
但是这个也不是绝对的依据。
我们决定的那张表为驱动表也就是外部表对SQL的执行效率有重要的影响,其内部的连接方式是:
row source1的row1-->probe row source2(驱动表,外部表)
row source1的row2-->probe row source2(驱动表,外部表)
row source1的row3-->probe row source2(驱动表,外部表)
从它的运行原理上我们也能够看到row source2选择的重要性。
当然如果row source1比较小的话,这种执行方式的效率也会更高。
一般情况下row source1通过index去访问row source2的话效率也会更高,当然前提是row source2必须有index。
row source1去匹配row source2的所有行,如果有匹配的结果,则将其放入将要返回的结果集中。
看到这里,我们可能会想到,使用这种方式,原理上我们一定需要遵守两种最简单的条件,当然如果
不满足的话也没关系,只不过性能上会差一些吧,
(1)我们在选择驱动表(外表)的时候尽量的选择小一些的,这样理论上物理的I/O将将会少一些。
(2)尽量的在驱动表上建立索引,这样的话查询的效率会高一些。
 

这篇关于HASH JION AND NESTED JION的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/660891

相关文章

Redis的Hash类型及相关命令小结

《Redis的Hash类型及相关命令小结》edisHash是一种数据结构,用于存储字段和值的映射关系,本文就来介绍一下Redis的Hash类型及相关命令小结,具有一定的参考价值,感兴趣的可以了解一下... 目录HSETHGETHEXISTSHDELHKEYSHVALSHGETALLHMGETHLENHSET

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

hdu1043(八数码问题,广搜 + hash(实现状态压缩) )

利用康拓展开将一个排列映射成一个自然数,然后就变成了普通的广搜题。 #include<iostream>#include<algorithm>#include<string>#include<stack>#include<queue>#include<map>#include<stdio.h>#include<stdlib.h>#include<ctype.h>#inclu

康拓展开(hash算法中会用到)

康拓展开是一个全排列到一个自然数的双射(也就是某个全排列与某个自然数一一对应) 公式: X=a[n]*(n-1)!+a[n-1]*(n-2)!+...+a[i]*(i-1)!+...+a[1]*0! 其中,a[i]为整数,并且0<=a[i]<i,1<=i<=n。(a[i]在不同应用中的含义不同); 典型应用: 计算当前排列在所有由小到大全排列中的顺序,也就是说求当前排列是第

hdu1496(用hash思想统计数目)

作为一个刚学hash的孩子,感觉这道题目很不错,灵活的运用的数组的下标。 解题步骤:如果用常规方法解,那么时间复杂度为O(n^4),肯定会超时,然后参考了网上的解题方法,将等式分成两个部分,a*x1^2+b*x2^2和c*x3^2+d*x4^2, 各自作为数组的下标,如果两部分相加为0,则满足等式; 代码如下: #include<iostream>#include<algorithm

usaco 1.2 Milking Cows(类hash表)

第一种思路被卡了时间 到第二种思路的时候就觉得第一种思路太坑爹了 代码又长又臭还超时!! 第一种思路:我不知道为什么最后一组数据会被卡 超时超了0.2s左右 大概想法是 快排加一个遍历 先将开始时间按升序排好 然后开始遍历比较 1 若 下一个开始beg[i] 小于 tem_end 则说明本组数据与上组数据是在连续的一个区间 取max( ed[i],tem_end ) 2 反之 这个

uva 10029 HASH + DP

题意: 给一个字典,里面有好多单词。单词可以由增加、删除、变换,变成另一个单词,问能变换的最长单词长度。 解析: HASH+dp 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstring>#include <cmath>#inc

整数Hash散列总结

方法:    step1  :线性探测  step2 散列   当 h(k)位置已经存储有元素的时候,依次探查(h(k)+i) mod S, i=1,2,3…,直到找到空的存储单元为止。其中,S为 数组长度。 HDU 1496   a*x1^2+b*x2^2+c*x3^2+d*x4^2=0 。 x在 [-100,100] 解的个数  const int MaxN = 3000

POJ 1198 双广+Hash

此题采用双广可从bfs的O(16^8)降低到O(2*16^4); 坐标0-7,刚好3位存储, 需要24位存储四个坐标(x,y),也就是[0,2^24) 。 很好的一题。 import java.io.BufferedReader;import java.io.InputStream;import java.io.InputStreamReader;import

C# Hash算法之MD5、SHA

MD5我们用的还是比较多的,一般用来加密存储密码。但是现在很多人觉MD5可能不太安全了,所以都用上了SHA256等来做加密(虽然我觉得都差不多,MD5还是能玩)。 还是跟上一篇说的一样,当一个算法的复杂度提高的同时肯定会带来效率的降低,所以SHA和MD5比较起来的话,SHA更安全,MD5更高效。 由于HASH算法的不可逆性,所以我认为MD5和SHA主要还是应用在字符串的"加密"上。 由于