企业如何使用SNP Glue将SAP与Snowflake集成?

2024-04-12 14:20

本文主要是介绍企业如何使用SNP Glue将SAP与Snowflake集成?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

SNP Glue是SNP的集成技术,适用于任何云平台。它最初是围绕SAP和Hadoop构建的,现在已经发展为一个集成平台,虽然它仍然非常专注SAP,但可以将几乎任何数据源与任何数据目标集成。

我们客户非常感兴趣的数据目标之一是Snowflake。Snowflake是一个基于云的数据仓库平台,旨在处理和分析大量数据。它是一种软件即服务(SaaS)解决方案,允许组织使用云基础设施存储、管理和分析数据,而无需管理底层硬件或软件。

SNP Glue,Snowflake,Snowflake集成

企业如何使用SNP Glue和Snowflake?

下面是一个使用SNP Glue将SAP与Snowflake集成的实际客户示例:

想象一下,一家总部位于德国,但在全球范围内运营的大公司。他们有30多个SAP生产系统,他们从中获取数据(主要使用SAP自己的SLT)。它的范围是巨大的,我们谈论的是每个系统数以万计的表。现在,通过SNP Glue,我们可以获取所有这些数据,并使用Glue自己的CDC(更改数据捕获)——有时与SLT的增量捕获一起使用,将所有SAP数据包括不断更改的数据复制到云端的基于Snowflake的数据仓库中。

为什么公司会使用Snowflake?

Snowflake基于SQL的关键特性“弹性”(即可伸缩性),并附带了强大的数据处理特性来覆盖ETL(提取-转换-加载)中的“T”,这对于现代集成体系结构(主要是关于ELT而不是ETL)来说很有意义,只是为了解耦数据集成和数据转换的复杂性。简而言之,Snowflake是数据平台(以前称为数据仓库)的某种程度上与云无关的SaaS产品。

Snowflake支持通过连接器和api与各种数据科学和人工智能工具集成。你可以使用流行的人工智能库和框架与Snowflake一起构建和训练模型。

用简单的话来总结:Snowflake是一个在集群系统上的非常强大的数据库,它是按规模构建的,并提供了大量的优势。

保留你的选择余地

话虽如此,每个超大规模企业都有一个相互竞争的技术,例如redshift (AWS)、Synapse(微软)、Big Query (GC),甚至DataBricks。在众多技术优势中,Snowflake有一些优势,其中之一是它是真正与云无关的,因此不会将客户推向供应商锁定。

客户使用SNP Glue与基于云的数据仓库集成,选择Snowflake是因为它是一个真正的SaaS解决方案,像数据库一样理解SQL(但像Hadoop一样扩展),并且像数据库一样快速返回数据。

使您的SAP数据集成更容易

有了SNP Glue,就有可能实现SAP与Snowflake之间的本地集成。显而易见的起点是与安全性和身份验证的技术集成。然后是“真正的”数据集成,从模式创建开始:SNP Glue可以分析SAP数据源并在Snowflake上创建相应的数据模型。

数据复制可以是表驱动的(即基于表的数据复制,有或没有增量捕获),也可以是事件驱动的(在这种情况下,您将使用Snowpipe进行数据流)。

是什么让Snowpipe这么酷?

表驱动的数据集成是经典的集成方法,它是全表加载,然后是增量捕获(又名CDC)和近实时数据复制。在初始满负载之后,传输相当小的数据包。这一切通常都是基于经典数据库表,而不是业务对象。根据数据传输的频率(可能会产生非常小的包),可以实现近乎实时的提取和数据集成,但这将以Snowflake上频繁的所谓增量合并为代价。

Snowpipe允许在新数据到达时将数据连续加载到Snowflake表中。这对于需要为分析、报告或其他应用程序提供新信息的场景特别有用。Snowpipe可以与各种工具和工作流集成,使其可用于实时分析、报告和其他数据驱动型应用程序。

为了恰当地结束这篇文章,我想用一句古老的“最后一句话”作为结束语:正在构建SNP Glue以本地集成SAP数据和Snowflake的同一个团队正在使用Snowflake的应用程序框架在Snowflake上开发一个本地应用程序。我们的目标是在Snowflake上实现(并极大地改进)包括delta合并在内的数据流,即将更新的记录集成到数据仓库中。

这篇关于企业如何使用SNP Glue将SAP与Snowflake集成?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/897381

相关文章

详解Vue如何使用xlsx库导出Excel文件

《详解Vue如何使用xlsx库导出Excel文件》第三方库xlsx提供了强大的功能来处理Excel文件,它可以简化导出Excel文件这个过程,本文将为大家详细介绍一下它的具体使用,需要的小伙伴可以了解... 目录1. 安装依赖2. 创建vue组件3. 解释代码在Vue.js项目中导出Excel文件,使用第三

Linux alias的三种使用场景方式

《Linuxalias的三种使用场景方式》文章介绍了Linux中`alias`命令的三种使用场景:临时别名、用户级别别名和系统级别别名,临时别名仅在当前终端有效,用户级别别名在当前用户下所有终端有效... 目录linux alias三种使用场景一次性适用于当前用户全局生效,所有用户都可调用删除总结Linux

java图像识别工具类(ImageRecognitionUtils)使用实例详解

《java图像识别工具类(ImageRecognitionUtils)使用实例详解》:本文主要介绍如何在Java中使用OpenCV进行图像识别,包括图像加载、预处理、分类、人脸检测和特征提取等步骤... 目录前言1. 图像识别的背景与作用2. 设计目标3. 项目依赖4. 设计与实现 ImageRecogni

Java中Springboot集成Kafka实现消息发送和接收功能

《Java中Springboot集成Kafka实现消息发送和接收功能》Kafka是一个高吞吐量的分布式发布-订阅消息系统,主要用于处理大规模数据流,它由生产者、消费者、主题、分区和代理等组件构成,Ka... 目录一、Kafka 简介二、Kafka 功能三、POM依赖四、配置文件五、生产者六、消费者一、Kaf

python管理工具之conda安装部署及使用详解

《python管理工具之conda安装部署及使用详解》这篇文章详细介绍了如何安装和使用conda来管理Python环境,它涵盖了从安装部署、镜像源配置到具体的conda使用方法,包括创建、激活、安装包... 目录pytpshheraerUhon管理工具:conda部署+使用一、安装部署1、 下载2、 安装3

Mysql虚拟列的使用场景

《Mysql虚拟列的使用场景》MySQL虚拟列是一种在查询时动态生成的特殊列,它不占用存储空间,可以提高查询效率和数据处理便利性,本文给大家介绍Mysql虚拟列的相关知识,感兴趣的朋友一起看看吧... 目录1. 介绍mysql虚拟列1.1 定义和作用1.2 虚拟列与普通列的区别2. MySQL虚拟列的类型2

使用MongoDB进行数据存储的操作流程

《使用MongoDB进行数据存储的操作流程》在现代应用开发中,数据存储是一个至关重要的部分,随着数据量的增大和复杂性的增加,传统的关系型数据库有时难以应对高并发和大数据量的处理需求,MongoDB作为... 目录什么是MongoDB?MongoDB的优势使用MongoDB进行数据存储1. 安装MongoDB

关于@MapperScan和@ComponentScan的使用问题

《关于@MapperScan和@ComponentScan的使用问题》文章介绍了在使用`@MapperScan`和`@ComponentScan`时可能会遇到的包扫描冲突问题,并提供了解决方法,同时,... 目录@MapperScan和@ComponentScan的使用问题报错如下原因解决办法课外拓展总结@

mysql数据库分区的使用

《mysql数据库分区的使用》MySQL分区技术通过将大表分割成多个较小片段,提高查询性能、管理效率和数据存储效率,本文就来介绍一下mysql数据库分区的使用,感兴趣的可以了解一下... 目录【一】分区的基本概念【1】物理存储与逻辑分割【2】查询性能提升【3】数据管理与维护【4】扩展性与并行处理【二】分区的

使用Python实现在Word中添加或删除超链接

《使用Python实现在Word中添加或删除超链接》在Word文档中,超链接是一种将文本或图像连接到其他文档、网页或同一文档中不同部分的功能,本文将为大家介绍一下Python如何实现在Word中添加或... 在Word文档中,超链接是一种将文本或图像连接到其他文档、网页或同一文档中不同部分的功能。通过添加超