本文主要是介绍大数据的技术栈-逐步完善,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
目录
1.hadoop
a.HDFS分布式文件系统
b.Yarn集群资源管理器
c.MapReduce sql引擎
d.Impala sql引擎
e.工具概观
2.数据仓库知识
a.Hive数据库
1)Hive Sql
2)数据库结构
b.Doris数据库
3.混合处理框架SPARK
a.Spark
b.集群架构
4.数仓模型知识
5.开发工具
a.Dbeaver
b.Idea
6.kafka
7.实时处理框架flink
转职开始做大数据了,逐步跟着学习的脚本把知识变成自己的
1.hadoop
a.HDFS分布式文件系统
b.Yarn集群资源管理器
前端工作流异常时候 yarn检查异常信息-CSDN博客
c.MapReduce sql引擎
d.Impala sql引擎
e.工具概观
2.数据仓库知识
a.Hive数据库
1)Hive Sql
2)数据库结构
b.Doris数据库
3.混合处理框架SPARK
a.Spark
1)SCALA
Scala中的选项(Options )-CSDN博客
b.集群架构
使用spark进行递归的可行方案-CSDN博客
spark读取和保存本机文件-CSDN博客
本机spark 通idea连接Oracle的坑-CSDN博客
4.数仓模型知识
a.分层逻辑
b.模型规范
c.指标检查
5.开发工具
a.Dbeaver
b.Idea
windows idea本地执行spark sql避坑-CSDN博客
6.kafka
7.实时处理框架flink
这篇关于大数据的技术栈-逐步完善的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!