Qlik Sense : Crosstable在数据加载脚本中使用交叉表

2024-04-12 08:12

本文主要是介绍Qlik Sense : Crosstable在数据加载脚本中使用交叉表,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

什么是Crosstable?

交叉表是常见的表格类型,特点是在两个标题数据正交列表之间显示值矩阵。如果要将数据关联到其他数据表格,交叉表通常不是最佳数据格式。

本主题介绍了如何逆透视交叉表,即,在数据加载脚本中使用 LOAD 语句的 crosstable 前缀将部分交叉表转置为行。也就是所谓的行转列。

CrossTable实战 1

使用一个限定列逆透视交叉表

交叉表通常位于许多限定列之后,这些列将被直接读取。在此例中,有一个限定列 Year,以及每个月的销售数据矩阵。

使用一个限定列的交叉表
YearJanFebMarAprMayJun
2008456578127822
2009112322224585
2010655622791256
2011452432785515
2012455635786882

如果此表格只是简单加载到 Qlik Sense,结果将为Year使用一个字段,每个月份各一字段。通常,这并非您希望看到的结果。您可能更希望生成三个字段:

  • 在此例中,在上述表格中限定列 Year 使用绿色标记。
  • 在此例中,使用黄色标记的 Jan - Jun 月份表示属性字段。可以适当地将此字段命名为 Month。
  • 数据矩阵值使用蓝色标记。在此例中,它们表示销售数据,因此可以适当地将此字段命名为 Sales。

通过将 crosstable 前缀添加到 LOAD 或 SELECT 语句可实现此操作,例如:

crosstable (Month, Sales) LOAD * from ex1.xlsx;

这可以在 Qlik Sense 中创建以下表格:

使用交叉表前缀的表格已添加至 LOAD 或 SELECT 语句
YearMonthSales
2008一月45
2008二月65
2008三月78
2008四月12
2008五月78
2008六月22
2009一月11
2009二月23
.........

使用两个限定列逆透视交叉表

在此例中,左边有两个限定列,紧跟矩阵列之后。

使用两个限定列的交叉表
SalesmanYearJanFebMarAprMayJun
A2008456578127822
A2009112322224585
A2010655622791256
A2011452432785515
A2012455635786882
B2008577790249034
B2009233534345797
B2010776834912468
B2011573644906727
B2012576847908094

限定列的数量可表述为 crosstable 前缀的第三个参数,如下所述:

crosstable (Month, Sales, 2) LOAD * from ex2.xlsx;

这可以在 Qlik Sense 中创建下列结果:

使用限定列的表可表述为交叉表前缀的第三个参数
SalesmanYearMonthSales
A2008一月45
A2008二月65
A2008三月78
A2008四月12
A2008五月78
A2008六月22
A2009一月11
A2009二月23
............

了解更多Crosstable

  • Crosstableicon-default.png?t=N7T8https://help.qlik.com/zh-CN/sense/November2023/Subsystems/Hub/Content/Sense_Hub/Scripting/ScriptPrefixes/crosstable.htm

 

Crosstable实战 2

crosstable 加载前缀用于转置“交叉表”或“透视表”结构化数据。使用电子表格源时,通常会遇到以这种方式构造的数据。crosstable 加载前缀的输出和目的是将此类结构转换为规则的面向列的表等价物,因为这种结构通常更适合 Qlik Sense 中的分析。

交叉表转换后数据结构为交叉表及其等效结构的示例

左侧显示交叉表的示例。

语法:  

crosstable (attribute field name, data field name [ , n ] ) ( loadstatement | selectstatement )

参数
参数说明
attribute field name描述要转置的水平方向维度的所需输出字段名称(标题行)。
data field name

所需的输出字段名称,用于描述要转置的维度的水平方向数据(标题行下方的数据值矩阵)。

n

要被转换成常规形式的表格前面的限定符字段数量或未更改的维度。默认值为 1。

此脚本函数与以下函数相关:

相关函数
函数交互
Generic一种转换加载前缀,用于获取实体属性值结构化数据集,并将其转换为常规关系表结构,将遇到的每个属性分离为新的字段或数据列。

示例 1 – 转换数据透视销售数据(简单)

加载脚本和结果

概述

打开数据加载编辑器,并将下面的第一加载脚本添加到新选项卡。

第一个加载脚本包含一个数据集,crosstable 脚本前缀稍后将应用于该数据集,其中应用 crosstable 的部分已注释掉。这意味着注释语法用于在加载脚本中禁用此部分。

第二个加载脚本与第一个加载脚本相同,但应用了未注释 crosstable(通过删除注释语法启用)。脚本以这种方式显示,以突出显示该脚本函数在转换数据中的价值。

第二加载脚本(应用的函数)

tmpData:
//Crosstable (MonthText, Sales)
Load * inline [
Product, Jan 2021, Feb 2021, Mar 2021, Apr 2021, May 2021, Jun 2021
A, 100, 98, 103, 63, 108, 82
B, 284, 279, 297, 305, 294, 292
C, 50, 53, 50, 54, 49, 51];//Final:
//Load Product,
//Date(Date#(MonthText,'MMM YYYY'),'MMM YYYY') as Month,
//Sales//Resident tmpData;//Drop Table tmpData;复制代码到剪贴板

有关使用内联加载的详细信息,请参见内联加载。

结果

加载数据并打开工作表。创建新表并将这些字段添加为维度:

  • Product

  • Jan 2021

  • Feb 2021

  • Mar 2021

  • Apr 2021

  • May 2021

  • Jun 2021

结果表
产品2021 年 1 月2021 年 2 月2021 年 3 月2021 年 4 月2021 年 5 月2021 年 6 月
A100981036310882
B284279297305294292
C505350544951

该脚本允许创建一个交叉表,每个月一列,每个产品一行。按照目前的格式,该数据不容易分析。最好将所有数字放在一个字段中,将所有月份放在另一个字段中,放在一个三列表格中。下一节将解释如何对交叉表进行这种转换。

第二加载脚本(应用的函数)

通过删除 // 来取消对脚本的注释。加载的脚本应如下所示:

tmpData:
Crosstable (MonthText, Sales)
Load * inline [
Product, Jan 2021, Feb 2021, Mar 2021, Apr 2021, May 2021, Jun 2021
A, 100, 98, 103, 63, 108, 82
B, 284, 279, 297, 305, 294, 292
C, 50, 53, 50, 54, 49, 51];Final:
Load Product,
Date(Date#(MonthText,'MMM YYYY'),'MMM YYYY') as Month,
SalesResident tmpData;Drop Table tmpData;复制代码到剪贴板

有关使用内联加载的详细信息,请参见内联加载。

结果

加载数据并打开工作表。创建新表并将这些字段添加为维度:

  • Product

  • Month

  • Sales

结果表
产品销售额值
AJan 2021100
AFeb 202198
AMar 2021103
AApr 202163
AMay 2021108
AJun 202182
BJan 2021284
BFeb 2021279
BMar 2021297
BApr 2021305
BMay 2021294
BJun 2021292
CJan 202150
CFeb 202153
CMar 202150
CApr 202154
CMay 202149
CJun 202151

应用脚本前缀后,交叉表将转换为一个垂直表,其中一列用于 Month,另一列用于 Sales。这提高了数据的可读性。

示例 2 – 将数据透视销售目标数据转换为垂直表结构(中等)

加载脚本和图表表达式

概述

打开数据加载编辑器,并将下面的加载脚本添加到新选项卡。

加载脚本包含:

  • 加载到名为目标的表中的数据集。

  • crosstable 加载前缀,将数据透视的销售人员姓名转换为其自己的字段,标记为 Sales Person。

  • 关联的销售目标数据,该数据被结构化为一个名为 Target 的字段。

加载脚本

SalesTargets:
CROSSTABLE([Sales Person],Target,1)
LOAD
*
INLINE [
Area, Lisa, James, Sharon
APAC, 1500, 1750, 1850
EMEA, 1350, 950, 2050
NA, 1800, 1200, 1350
];复制代码到剪贴板

结果

加载数据并打开工作表。创建新表并将这些字段添加为维度:

  • Area

  • Sales Person

添加该度量:

=Sum(Target)

结果表
面积图销售员=Sum(Target)
APACJames1750
APACLisa1500

APAC

Sharon1850
EMEAJames950
EMEALisa1350
EMEASharon2050
NAJames1200
NALisa1800
NASharon1350

如果要将数据的显示复制为数据透视输入表,可以在工作表中创建等效的数据透视表。

执行以下操作:

  1. 将刚刚创建的表复制并粘贴到工作表中。
  2. 将透视表图表对象拖动到新创建的表副本的顶部。选择转换。
  3. 单击  完成编辑。
  4. 将 Sales Person 字段从垂直列架拖动到水平列架。

下表显示了初始表格形式的数据,如 Qlik Sense 中所示:

原始结果表,如 Qlik Sense 中所示
面积图销售员=Sum(Target)
总计-13800
APACJames1750
APACLisa1500

APAC

Sharon1850
EMEAJames950
EMEALisa1350
EMEASharon2050
NAJames1200
NALisa1800
NASharon1350

等效数据透视表类似如下,每个销售人员姓名的列包含在较大的 Sales Person 行中:

带水平透视 Sales Person 字段的等效透视表
面积图JamesLisaSharon
APAC175015001850
EMEA95013502050
NA135013501350

显示为表和等效数据透视表的数据示例,该透视表具有水平透视的 Sales Person

使用交叉表函数进行数据转换的示例。

示例 3 – 将数据透视销售和目标数据转换为垂直表结构(高级)

加载脚本和图表表达式

概述

打开数据加载编辑器,并将下面的加载脚本添加到新选项卡。

加载脚本包含:

  • 表示销售和目标数据的数据集,按地区和月份组织。这将加载到名为 SalesAndTargets 的表中。

  • crosstable 加载前缀。这用于将 Month Year 维度取消透视到专用字段中,以及将销售和目标金额矩阵转换到名为 Amount 的专用字段中。

  • 使用文本到日期转换特性 date# 将 Month Year 字段从文本转换为适当的日期。此日期转换 Month Year 字段通过 Join 加载前缀连接回 SalesAndTarget 表中。

加载脚本

SalesAndTargets:
CROSSTABLE(MonthYearAsText,Amount,2)
LOAD*
INLINE [
Area	Type	Jan-22	Feb-22	Mar-22	Apr-22	May-22	Jun-22	Jul-22	Aug-22	Sep-22	Oct-22	Nov-22	Dec-22
APAC	Target	425	425	425	425	425	425	425	425	425	425	425	425
APAC	Actual	435	434	397	404	458	447	413	458	385	421	448	397
EMEA	Target	362.5	362.5	362.5	362.5	362.5	362.5	362.5	362.5	362.5	362.5	362.5	362.5
EMEA	Actual	363.5	359.5	337.5	361.5	341.5	337.5	379.5	352.5	327.5	337.5	360.5	334.5
NA	Target	375	375	375	375	375	375	375	375	375	375	375	375
NA	Actual	378	415	363	356	403	343	401	365	393	340	360	405
] (delimiter is '\t');tmp:
LOAD DISTINCT MonthYearAsText,date#(MonthYearAsText,'MMM-YY') AS [Month Year]
RESIDENT SalesAndTargets;JOIN (SalesAndTargets)
LOAD * RESIDENT tmp;DROP TABLE tmp;
DROP FIELD MonthYearAsText;复制代码到剪贴板

结果

加载数据并打开工作表。创建新表并将这些字段添加为维度:

  • Area

  • Month Year

使用标签 Actual 创建以下度量值:

=Sum({<Type={'Actual'}>} Amount)

同时创建此度量,具有标签 Target:

=Sum({<Type={'Target'}>} Amount)

结果表(裁剪)
面积图年度月份实际目标
APACJan-22435425
APACFeb-22434425

APAC

Mar-22397425
APACApr-22404425
APACMay-22458425
APACJun-22447425
APACJul-22413425
APACAug-22458425
APACSep-22385425
APACOct-22421425
APACNov-22448425
APACDec-22397425
EMEAJan-22363.5362.5
EMEAFeb-22359.5362.5

如果要将数据的显示复制为数据透视输入表,可以在工作表中创建等效的数据透视表。

执行以下操作:

  1. 将刚刚创建的表复制并粘贴到工作表中。
  2. 将透视表图表对象拖动到新创建的表副本的顶部。选择转换。
  3. 单击  完成编辑。
  4. 将 Month Year 字段从垂直列架拖动到水平列架。
  5. 将 Values 项目从水平列架拖动到垂直列架。

下表显示了初始表格形式的数据,如 Qlik Sense 中所示:

原始结果表(裁剪),如 Qlik Sense 中所示
面积图年度月份实际目标
总计-1381213950
APACJan-22435425
APACFeb-22434425

APAC

Mar-22397425
APACApr-22404425
APACMay-22458425
APACJun-22447425
APACJul-22413425
APACAug-22458425
APACSep-22385425
APACOct-22421425
APACNov-22448425
APACDec-22397425
EMEAJan-22363.5362.5
EMEAFeb-22359.5362.5

等效数据透视表类似如下,每个单独年度月份的列包含在较大的 Month Year 行中:

带水平透视 Month Year 字段的等效透视表(裁剪)
面积(值)Jan-22Feb-22Mar-22Apr-22May-22Jun-22Jul-22Aug-22Sep-22Oct-22Nov-22Dec-22
APAC - 实际435434397404458447413458385421448397
APAC - 目标425425425425425425425425425425425425
EMEA - 实际363.5359.5337.5361.5341.5337.5379.5352.5327.5337.5360.5334.5
EMEA - 目标362.5362.5362.5362.5362.5362.5362.5362.5362.5362.5362.5362.5
NA - 实际378415363356403343401365393340360405
NA - 目标375375375375375375375375375375375375

显示为表和等效数据透视表的数据示例,该透视表具有水平透视的 Month Year

显示为表和等效数据透视表的数据示例,该透视表具有水平透视的年度月份字段

这篇关于Qlik Sense : Crosstable在数据加载脚本中使用交叉表的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/896581

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

关于数据埋点,你需要了解这些基本知识

产品汪每天都在和数据打交道,你知道数据来自哪里吗? 移动app端内的用户行为数据大多来自埋点,了解一些埋点知识,能和数据分析师、技术侃大山,参与到前期的数据采集,更重要是让最终的埋点数据能为我所用,否则可怜巴巴等上几个月是常有的事。   埋点类型 根据埋点方式,可以区分为: 手动埋点半自动埋点全自动埋点 秉承“任何事物都有两面性”的道理:自动程度高的,能解决通用统计,便于统一化管理,但个性化定

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

Hadoop数据压缩使用介绍

一、压缩原则 (1)运算密集型的Job,少用压缩 (2)IO密集型的Job,多用压缩 二、压缩算法比较 三、压缩位置选择 四、压缩参数配置 1)为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器 2)要在Hadoop中启用压缩,可以配置如下参数

Makefile简明使用教程

文章目录 规则makefile文件的基本语法:加在命令前的特殊符号:.PHONY伪目标: Makefilev1 直观写法v2 加上中间过程v3 伪目标v4 变量 make 选项-f-n-C Make 是一种流行的构建工具,常用于将源代码转换成可执行文件或者其他形式的输出文件(如库文件、文档等)。Make 可以自动化地执行编译、链接等一系列操作。 规则 makefile文件

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传