Teradata 之top n与sample n

2023-12-15 15:08

文章标签 top sample teradata

本文主要是介绍Teradata 之top n与sample n，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

Teradata取n条样本数据的方法有两种：

select top x * from table;
select * from table sample n;

那么二者有什么区别呢？说明如下：

TOP N
如果有Order By关键字首先要对数据库的数据进行排序，然后获取N条数据或者抽样比率为N；
如果没有Order By关键字，要做一次STAT FUNCTION的全AMP收集，然后选择某一个或者几个AMP 来抽取数据。

Sample N
首先要对数据库的数据进行全表扫描，然后获取N数据；
采用的是Sampling的形式。

性能比较：
当数据量比较小的时候，TOP N的速度要比Sample的速度快；
当数据量比较大的时候，Sample N的速度要比TOP的速度快。

测试：

Explain select top 10 * from PD_PORTAL.TOPIC_COMP_DETAIL

1) First, we lock a distinct PD_PORTAL."pseudo table" for read on a
RowHash to prevent global deadlock for PD_PORTAL.TOPIC_COMP_DETAIL.
2) Next, we lock PD_PORTAL.TOPIC_COMP_DETAIL for read.
3) We do an all-AMPs STAT FUNCTION step from
PD_PORTAL.TOPIC_COMP_DETAIL by way of an all-rows scan with no
residual co

这篇关于Teradata 之top n与sample n的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/496872。 23002807@qq.com

相关文章

PostgreSQL 17即将发布，新功能Top 3

PostgreSQL 17即将发布，新功能Top 3

按照计划，PostgreSQL 17 即将在 2024 年 9 月 26 日发布，目前已经发布了第一个 RC 版本，新版本的功能增强可以参考 Release Notes。本文给大家分享其中 3 个重大的新增功能。 MERGE 语句增强 MERGE 语句是 PostgreSQL 15 增加的一个新功能，它可以在单个语句中实现 INSERT、UPDATE 以及 DELETE 操作，非常适合数据

阅读更多...

AIGC与数据分析融合，引领商业智能新变革（TOP企业实践）

AIGC与数据分析融合，引领商业智能新变革（TOP企业实践）

AIGC与数据分析融合，引领商业智能新变革（TOP企业实践）前言AIGC与数据分析融合前言在当今数字化时代，数据已成为企业发展的核心资产，而如何从海量数据中挖掘出有价值的信息，成为了企业面临的重要挑战。随着人工智能技术的飞速发展，AIGC（人工智能生成内容）与数据分析的融合为企业提供了新的解决方案。阿里巴巴作为全球领先的科技公司，一直致力于探索和应用前沿技术，以提升企业

阅读更多...

linux top命令介绍以及使用

linux top命令介绍以及使用

文章目录介绍 `top` 命令1. `top` 的基本功能2. 如何启动 `top`3. `top` 的输出解释系统概况任务和 CPU 使用情况内存和交换空间进程信息 4. 常用操作总结查看逻辑CPU的个数查看系统运行时间介绍 top 命令 top 是一个在类 Unix 系统中广泛使用的命令行工具，用于实时显示系统的资源使用情况。它提供了有关 CPU、内存、进程等的详细

阅读更多...

优化采样参数提升大语言模型响应质量：深入分析温度、top_p、top_k和min_p的随机解码策略

优化采样参数提升大语言模型响应质量：深入分析温度、top_p、top_k和min_p的随机解码策略

当向大语言模型(LLM)提出查询时，模型会为其词汇表中的每个可能标记输出概率值。从这个概率分布中采样一个标记后，我们可以将该标记附加到输入提示中，使LLM能够继续输出下一个标记的概率。这个采样过程可以通过诸如 temperature 和 top_p 等参数进行精确控制。但是你是否曾深入思考过temperature和top_p参数的具体作用？本文将详细解析并可视化定义LLM输出行为的

阅读更多...

[LeetCode] 692. Top K Frequent Words

[LeetCode] 692. Top K Frequent Words

题：https://leetcode.com/problems/top-k-frequent-words/ 题目大意对于 string[] words，输出出现频率前k高的 word，顺序为 word 出现的频率由高到低，频率相同的 word 按字符排序。思路其实是对words中的所有word进行一个排序。排序有两个规则： 1.word 在 words中出现的次数。 2.

阅读更多...

解决树莓派IOError: [Errno Invalid sample rate] -9997 采样率16K错误

解决树莓派IOError: [Errno Invalid sample rate] -9997 采样率16K错误

树莓派在基于pyaudio录音的时候会提示如上错误，这主要是使用的树莓派声卡不支持当前的采用率，没关系，其实在alsa架构下我们可以通过声卡的插件实现转换。在树莓派下家目录创建一个声卡隐藏配置文件 .asoundrc。特别说明，不要在你的pyaudio里面设置打开声卡的编号因为下面的配置已经配置了。 1.安装 sudo apt-get install pulseaudio 2.在家目录创

阅读更多...

系统设计：Top K Problem (Heavy Hitters)

系统设计：Top K Problem (Heavy Hitters)

System Design Interview - Top K Problem (Heavy Hitters) https://www.youtube.com/watch?v=kx-XDoPjoHw&t=1068s

阅读更多...

【高校科研前沿】三峡大学黄进副教授等人在环境科学Top期刊JCP发文：人类活动如何在气候变化下影响和降低生态敏感性：以中国长江经济带为例

【高校科研前沿】三峡大学黄进副教授等人在环境科学Top期刊JCP发文：人类活动如何在气候变化下影响和降低生态敏感性：以中国长江经济带为例

文章简介论文名称：How human activities affect and reduce ecological sensitivity under climate change: Case study of the Yangtze River Economic Belt, China（人类活动如何在气候变化下影响和降低生态敏感性：以中国长江经济带为例）第一作者及单位

阅读更多...

Js中window.parent ,window.top,window.self详解

Js中window.parent ,window.top,window.self详解

在应用有frameset或者iframe的页面时，parent是父窗口，top是最顶级父窗口（有的窗口中套了好几层frameset或者iframe），self是当前窗口， opener是用open方法打开当前窗口的那个窗口。 window.self 功能：是对当前窗口自身的引用。它和window属性是等价的。语法：window.self 注：window、self、windo

阅读更多...

sql优化------查询整个表按照某个字段排序后的前几条Top-N SQL

sql优化------查询整个表按照某个字段排序后的前几条Top-N SQL

1.下图通过执行计划可以看出，查看大表前n条数据其实就是Oracle中实现TOP N 后续补充

阅读更多...