01_Apache Flink是什么,Apache Flink的优势,Apache Flink用户,Flink介绍(流场景使用案例、正确性保证、API分层体系、Operational Focus等)

本文主要是介绍01_Apache Flink是什么,Apache Flink的优势,Apache Flink用户,Flink介绍(流场景使用案例、正确性保证、API分层体系、Operational Focus等),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1.1. Apache Flink是什么?
1.1.1. Apache Flink的优势
1.1.2. Apache Flink用户
1.1.3. Flink介绍
1.1.3.1.流场景使用案例
1.1.3.2.正确性保证
1.1.3.3. API分层体系
1.1.3.4. Operational Focus
1.1.3.5. 适用于各种应用场景Scales to any use case
1.1.3.6.高性能

1.1.Apache Flink是什么?

作为没有接触过Flink的人,当听到外界说的Flink的时候,就想知道它能做什么,作为笔者,同样有这样的疑问,为了消除疑问,我也迫不及待的在下班后开始了看官网的学习历程。

Apache Flink官网:https://flink.apache.org/

Apache Flinke是一个”统一的大数据分析和机器学习引擎”、”统一的大数据分析和流计算引擎”、”统一的大数据分析和批计算引擎”

Flink说自己是”下一代大数据处理引擎”,看来海口夸的很大啊,称自己是”下一代”。作为Apache Flink小白的我是不明觉厉啊。好吧,我到底要看看它是多么牛逼。以下是Apache Flink的一段介绍:
“Apache Flink是一个分布式大数据处理引擎,可对有限数据流和无线数据流进行状态计算。可部署在各种集群环境,对各种大小的数据规模进行快速计算”。

盗用它的一张图,来瞅瞅它:
在这里插入图片描述

1.1.1.Apache Flink的优势

Apache Flink 为用户提供了更强大的计算能力和更易用的编程接口。优势项有:

批流统一:Runtime 和 SQL层批流统一,提供高吞吐延迟计算能力和更强大的SQL支持。
生态兼容:与Hadoop Yarn / Apache Mesos / Kubernetes集成,并且支持单机模式运行。
性能卓越:性能卓越的批处理与流处理支持。
规模计算:作业可被分解成上千个任务,分布在集群中并发执行。

1.1.2.Apache Flink用户

Apache Flink的用户有:阿里巴巴,腾讯,华为,网易,滴滴,饿了么,携程,360,顺丰科技,爱奇艺,美团,唯品会,ebay,ERICSSON.

1.1.3.Flink介绍

1.1.3.1.流场景使用案例

数据驱动的应用
批流数据分析
数据通道和ETL (更多:https://flink.apache.org/usecases.html)

1.1.3.2.正确性保证

Exactly-once状态一致性保证
事件时间处理
复杂的late date处理(更多:https://flink.apache.org/flink-applications.html#building-blocks-for-streaming-applications)

1.1.3.3. API分层体系

统一SQL支持Stream和Batch数据处理
DataSteam API & DataSet API
ProcessFunction(Time & State)(更多:https://flink.apache.org/flink-applications.html#layered-apis)

1.1.3.4. Operational Focus

部署灵活
高可用配置
Savepoint (更多:https://flink.apache.org/flink-operations.html)

1.1.3.5. 适用于各种应用场景Scales to any use case

架构可扩展
超大state支持
增量checkpointing (更多:https://flink.apache.org/flink-architecture.html#run-applications-at-any-scale)

1.1.3.6.高性能

低延时
高吞吐
内存计算(更多:https://flink.apache.org/flink-architecture.html#leverage-in-memory-performance)

这篇关于01_Apache Flink是什么,Apache Flink的优势,Apache Flink用户,Flink介绍(流场景使用案例、正确性保证、API分层体系、Operational Focus等)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/918148

相关文章

MySQL 中的 JSON 查询案例详解

《MySQL中的JSON查询案例详解》:本文主要介绍MySQL的JSON查询的相关知识,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录mysql 的 jsON 路径格式基本结构路径组件详解特殊语法元素实际示例简单路径复杂路径简写操作符注意MySQL 的 J

Java学习手册之Filter和Listener使用方法

《Java学习手册之Filter和Listener使用方法》:本文主要介绍Java学习手册之Filter和Listener使用方法的相关资料,Filter是一种拦截器,可以在请求到达Servl... 目录一、Filter(过滤器)1. Filter 的工作原理2. Filter 的配置与使用二、Listen

Pandas使用AdaBoost进行分类的实现

《Pandas使用AdaBoost进行分类的实现》Pandas和AdaBoost分类算法,可以高效地进行数据预处理和分类任务,本文主要介绍了Pandas使用AdaBoost进行分类的实现,具有一定的参... 目录什么是 AdaBoost?使用 AdaBoost 的步骤安装必要的库步骤一:数据准备步骤二:模型

使用Pandas进行均值填充的实现

《使用Pandas进行均值填充的实现》缺失数据(NaN值)是一个常见的问题,我们可以通过多种方法来处理缺失数据,其中一种常用的方法是均值填充,本文主要介绍了使用Pandas进行均值填充的实现,感兴趣的... 目录什么是均值填充?为什么选择均值填充?均值填充的步骤实际代码示例总结在数据分析和处理过程中,缺失数

如何使用 Python 读取 Excel 数据

《如何使用Python读取Excel数据》:本文主要介绍使用Python读取Excel数据的详细教程,通过pandas和openpyxl,你可以轻松读取Excel文件,并进行各种数据处理操... 目录使用 python 读取 Excel 数据的详细教程1. 安装必要的依赖2. 读取 Excel 文件3. 读

Python Transformers库(NLP处理库)案例代码讲解

《PythonTransformers库(NLP处理库)案例代码讲解》本文介绍transformers库的全面讲解,包含基础知识、高级用法、案例代码及学习路径,内容经过组织,适合不同阶段的学习者,对... 目录一、基础知识1. Transformers 库简介2. 安装与环境配置3. 快速上手示例二、核心模

解决Maven项目idea找不到本地仓库jar包问题以及使用mvn install:install-file

《解决Maven项目idea找不到本地仓库jar包问题以及使用mvninstall:install-file》:本文主要介绍解决Maven项目idea找不到本地仓库jar包问题以及使用mvnin... 目录Maven项目idea找不到本地仓库jar包以及使用mvn install:install-file基

Python使用getopt处理命令行参数示例解析(最佳实践)

《Python使用getopt处理命令行参数示例解析(最佳实践)》getopt模块是Python标准库中一个简单但强大的命令行参数处理工具,它特别适合那些需要快速实现基本命令行参数解析的场景,或者需要... 目录为什么需要处理命令行参数?getopt模块基础实际应用示例与其他参数处理方式的比较常见问http

JAVA保证HashMap线程安全的几种方式

《JAVA保证HashMap线程安全的几种方式》HashMap是线程不安全的,这意味着如果多个线程并发地访问和修改同一个HashMap实例,可能会导致数据不一致和其他线程安全问题,本文主要介绍了JAV... 目录1. 使用 Collections.synchronizedMap2. 使用 Concurren

C 语言中enum枚举的定义和使用小结

《C语言中enum枚举的定义和使用小结》在C语言里,enum(枚举)是一种用户自定义的数据类型,它能够让你创建一组具名的整数常量,下面我会从定义、使用、特性等方面详细介绍enum,感兴趣的朋友一起看... 目录1、引言2、基本定义3、定义枚举变量4、自定义枚举常量的值5、枚举与switch语句结合使用6、枚