本文主要是介绍01_Apache Flink是什么,Apache Flink的优势,Apache Flink用户,Flink介绍(流场景使用案例、正确性保证、API分层体系、Operational Focus等),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
1.1. Apache Flink是什么?
1.1.1. Apache Flink的优势
1.1.2. Apache Flink用户
1.1.3. Flink介绍
1.1.3.1.流场景使用案例
1.1.3.2.正确性保证
1.1.3.3. API分层体系
1.1.3.4. Operational Focus
1.1.3.5. 适用于各种应用场景Scales to any use case
1.1.3.6.高性能
1.1.Apache Flink是什么?
作为没有接触过Flink的人,当听到外界说的Flink的时候,就想知道它能做什么,作为笔者,同样有这样的疑问,为了消除疑问,我也迫不及待的在下班后开始了看官网的学习历程。
Apache Flink官网:https://flink.apache.org/
Apache Flinke是一个”统一的大数据分析和机器学习引擎”、”统一的大数据分析和流计算引擎”、”统一的大数据分析和批计算引擎”
Flink说自己是”下一代大数据处理引擎”,看来海口夸的很大啊,称自己是”下一代”。作为Apache Flink小白的我是不明觉厉啊。好吧,我到底要看看它是多么牛逼。以下是Apache Flink的一段介绍:
“Apache Flink是一个分布式大数据处理引擎,可对有限数据流和无线数据流进行状态计算。可部署在各种集群环境,对各种大小的数据规模进行快速计算”。
盗用它的一张图,来瞅瞅它:
1.1.1.Apache Flink的优势
Apache Flink 为用户提供了更强大的计算能力和更易用的编程接口。优势项有:
批流统一:Runtime 和 SQL层批流统一,提供高吞吐延迟计算能力和更强大的SQL支持。
生态兼容:与Hadoop Yarn / Apache Mesos / Kubernetes集成,并且支持单机模式运行。
性能卓越:性能卓越的批处理与流处理支持。
规模计算:作业可被分解成上千个任务,分布在集群中并发执行。
1.1.2.Apache Flink用户
Apache Flink的用户有:阿里巴巴,腾讯,华为,网易,滴滴,饿了么,携程,360,顺丰科技,爱奇艺,美团,唯品会,ebay,ERICSSON.
1.1.3.Flink介绍
1.1.3.1.流场景使用案例
数据驱动的应用
批流数据分析
数据通道和ETL (更多:https://flink.apache.org/usecases.html)
1.1.3.2.正确性保证
Exactly-once状态一致性保证
事件时间处理
复杂的late date处理(更多:https://flink.apache.org/flink-applications.html#building-blocks-for-streaming-applications)
1.1.3.3. API分层体系
统一SQL支持Stream和Batch数据处理
DataSteam API & DataSet API
ProcessFunction(Time & State)(更多:https://flink.apache.org/flink-applications.html#layered-apis)
1.1.3.4. Operational Focus
部署灵活
高可用配置
Savepoint (更多:https://flink.apache.org/flink-operations.html)
1.1.3.5. 适用于各种应用场景Scales to any use case
架构可扩展
超大state支持
增量checkpointing (更多:https://flink.apache.org/flink-architecture.html#run-applications-at-any-scale)
1.1.3.6.高性能
低延时
高吞吐
内存计算(更多:https://flink.apache.org/flink-architecture.html#leverage-in-memory-performance)
这篇关于01_Apache Flink是什么,Apache Flink的优势,Apache Flink用户,Flink介绍(流场景使用案例、正确性保证、API分层体系、Operational Focus等)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!