Flink Forward Asia 2020 第二天小记

2024-05-02 07:48

本文主要是介绍Flink Forward Asia 2020 第二天小记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

发一下昨天 14 号 Flink Forward Asia 的记录,关于前天的请查看 Flink Forward Asia 2020 第一天小记

14号上午

好未来 批流融合

数据中台全景图

实时平台

批流融合

ODS 实时化

SQL 开发

混合云部署

作业和消费的 kafka 或者写入的存储引擎是否在同一个集群?怎么解决跨云带宽问题?怎么解决跨云网络延迟导致的作业性能损失?

天猫流批一体

流批一体架构

dataphin

流批一体挑战

  • 流批两种执行,结果要一致

  • 追历史数据的情况下,结果要完全一致

  • 趋势图和业务表现要完全一致

实践效果

未来规划

网易游戏

基于 flink 的 etl 场景

痛点

  • 异构数据源

  • 变换的数据 schema

  • 离线实时数据一致

  • 赃数据

ETL 作业执行流程

在 taskmanager 端有线程去轮训配置中心的配置规则,从而可以避免作业的启停

设计

pipeline

根据配置(source/sink/流表)去决定整个作业的 pipeline

元数据持久化方案

整个 etl 的架构其实还是和 HDSpaceX 类似

小米

整体架构

平台功能

自动 DDL

这个我在内部也强调过这个问题,自动拉取元数据来自动生成 DDL,对接不同的系统 schema 拉取元数据,这样自动生成 DDL 很方便

管理 udf

  • 兼容 hive udf

  • 自定义 udf 平台

编写 udf,提交 pr,CI/CD,上传 udf,写入 DB

  • udf 版本管理

在线调试

完善生态

常见 source/sink/维表 组件

监控告警

metrics report 到 消息队列(talos)和 falcon

日志展示

log4j 新增 appender 把日志数据打到 kafka 后,搜集到 es,用 kibana 查看日志

作业智能诊断

底层开发人员固定,开发作业数量增速太快,运维难度越来越大

  • 稳定性提升

  • 用户文档

  • 培训和分享

14号下午

Flink Pulsar 批流融合

Pulsar 架构

BookKeeper 存储数据

分区中的 segment

不同分去可以单独为每个分区设置不同的 segment 大小?

统一存储视图

segment read,实时读和读历史接口不一样?

Flink 和 Pulsar 融合

  • 根据 segment 来查询

  • source/sink

  • pulsar catalog

  • 突破 topic 分区数量,Flink 可以设置超过分区数量的并行度

  • 直接读取底层的 segment

Flink Hudi Kylin 构建湖仓一体

Hudi 插件化架构

hudi 和 flink

  • 两个 pr 代码竟然快上万行

  • 支持多引擎的话,解耦有很多难点

  • 解耦的时候去 spark 化

Flink On K8S

on yarn 的架构

on k8s

  • flink on k8s 的几种部署模式

  • flink k8s 原生的 ha,不再依赖 zk

  • 网络的挑战

  • 多租户挑战

Yunikorn

调度

贝壳

平台架构

实时数仓架构

SQL 调试

数据血缘

基于 Apache Flink 的实时监控告警系统关于数据中台的深度思考与总结(干干货)日志收集Agent,阴暗潮湿的地底世界
2020 继续踏踏实实的做好自己

公众号(zhisheng)里回复 面经、ClickHouse、ES、Flink、 Spring、Java、Kafka、监控 等关键字可以查看更多关键字对应的文章。
点个赞+在看,少个 bug ????

这篇关于Flink Forward Asia 2020 第二天小记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/953750

相关文章

usaco 1.3 Mixing Milk (结构体排序 qsort) and hdu 2020(sort)

到了这题学会了结构体排序 于是回去修改了 1.2 milking cows 的算法~ 结构体排序核心: 1.结构体定义 struct Milk{int price;int milks;}milk[5000]; 2.自定义的比较函数,若返回值为正,qsort 函数判定a>b ;为负,a<b;为0,a==b; int milkcmp(const void *va,c

ZOJ Monthly, August 2014小记

最近太忙太忙,只能抽时间写几道简单题。不过我倒是明白要想水平提高不看题解是最好的了。 A  我只能死找规律了,无法证明 int a[50002][2] ;vector< vector<int> > gmax , gmin ;int main(){int n , i , j , k , cmax , cmin ;while(cin>>n){/* g

Codeforces Round #261 (Div. 2)小记

A  XX注意最后输出满足条件,我也不知道为什么写的这么长。 #define X first#define Y secondvector<pair<int , int> > a ;int can(pair<int , int> c){return -1000 <= c.X && c.X <= 1000&& -1000 <= c.Y && c.Y <= 1000 ;}int m

2014 Multi-University Training Contest 8小记

1002 计算几何 最大的速度才可能拥有无限的面积。 最大的速度的点 求凸包, 凸包上的点( 注意不是端点 ) 才拥有无限的面积 注意 :  凸包上如果有重点则不满足。 另外最大的速度为0也不行的。 int cmp(double x){if(fabs(x) < 1e-8) return 0 ;if(x > 0) return 1 ;return -1 ;}struct poin

2014 Multi-University Training Contest 7小记

1003   数学 , 先暴力再解方程。 在b进制下是个2 , 3 位数的 大概是10000进制以上 。这部分解方程 2-10000 直接暴力 typedef long long LL ;LL n ;int ok(int b){LL m = n ;int c ;while(m){c = m % b ;if(c == 3 || c == 4 || c == 5 ||

2014 Multi-University Training Contest 6小记

1003  贪心 对于111...10....000 这样的序列,  a 为1的个数,b为0的个数,易得当 x= a / (a + b) 时 f最小。 讲串分成若干段  1..10..0   ,  1..10..0 ,  要满足x非递减 。  对于 xi > xi+1  这样的合并 即可。 const int maxn = 100008 ;struct Node{int

Regionals 2004 Asia - Beijing Argus 小根堆

点击打开链接 小根堆 import java.io.BufferedReader;import java.io.InputStream;import java.io.InputStreamReader;import java.io.PrintWriter;import java.math.BigInteger;import java.util.StringTokeni

Java基础回顾系列-第二天-面向对象编程

面向对象编程 Java类核心开发结构面向对象封装继承多态 抽象类abstract接口interface抽象类与接口的区别深入分析类与对象内存分析 继承extends重写(Override)与重载(Overload)重写(Override)重载(Overload)重写与重载之间的区别总结 this关键字static关键字static变量static方法static代码块 代码块String类特

Flink任务重启策略

概述 Flink支持不同的重启策略,以在故障发生时控制作业如何重启集群在启动时会伴随一个默认的重启策略,在没有定义具体重启策略时会使用该默认策略。如果在工作提交时指定了一个重启策略,该策略会覆盖集群的默认策略默认的重启策略可以通过 Flink 的配置文件 flink-conf.yaml 指定。配置参数 restart-strategy 定义了哪个策略被使用。常用的重启策略: 固定间隔 (Fixe