本文主要是介绍SQL join和EXISTS效率,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
先看两个查询,查询目的是在a表中找出b表出现的vid
1.join查询
select a.vid, a.attach_url, a.attach_url_type, a.create_time
from ods_truck.tl_vehicle_attach_log ajoin (select distinct vidfrom ods_truck.tl_truck_log_20240613where oprater in ('remove', 'delete')and cast(oprater_time as bigint) < unix_timestamp('20210101', 'yyyyMMdd') * 1000
) b on a.vid = b.vid;
2.exists查询
select a.vid, a.attach_url, a.attach_url_type, a.create_time
from ods_truck.tl_vehicle_attach_log a
where exists (select 1from ods_truck.tl_truck_log_20240613 bwhere a.vid = b.vidand oprater in ('remove', 'delete')and cast(oprater_time as bigint) < unix_timestamp('20210101', 'yyyyMMdd') * 1000)
exists 解释
exists 和 not exists 用于判断B表结果集是否在A表存在,这个使用select 1
原因是exists 不需要判断具体的列,只需要知道有没有结果集返回
- exists 有结果集返回为真
- not exists 没有结果集返回为真
这里使用select 1
没有查询所有的列,优化了查询效率
比较效率
第一种join
- 优点:子查询先执行,只保留了满足条件的vid的去重集合,减少了主查询时需要比较的记录数,如果vid上有索引,可能会更高效。
- 缺点:如果子查询返回大量不同的vid,则JOIN操作可能消耗较多资源
第二个查询(EXISTS方式)
- 优点:EXISTS通常在找到第一个匹配项后就会停止后续的行搜索,因此对于外层表的每一行,内层查询不会全表扫描,这在内层表数据量大时非常高效。
- 缺点:对于每个外层表的行,都需要执行一次内层查询,如果外层表非常大,这可能会导致较高的查询成本
总结
一般而言,如果内层查询(即满足特定条件的vid)返回的结果集较小,且外层表较大,EXISTS可能会更高效,因为它避免了不必要的全表扫描。相反,如果内层查询返回的结果集相对较大,而外层表较小,预先计算并JOIN去重结果集的方法可能会更优。
实际效率还需根据具体的数据库系统优化器、索引策略、数据分布等因素来确定,建议在实际环境中进行性能测试来决定最佳方案。
这篇关于SQL join和EXISTS效率的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!