大数据方向另一个十年开启 |《硬刚系列》第一版完结

2024-09-06 19:08

本文主要是介绍大数据方向另一个十年开启 |《硬刚系列》第一版完结,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《硬刚Presto|Presto原理&调优&面试&实战全面升级版》

《硬刚Apache Iceberg | 技术调研&在各大公司的实践应用大总结》

《硬刚ClickHouse | 4万字长文ClickHouse基础&实践&调优全视角解析》

《硬刚数据仓库|SQL Boy的福音之数据仓库体系建模&实施&注意事项小总结》

《硬刚Hive | 4万字基础调优面试小总结》

《硬刚用户画像(一) | 标签体系下的用户画像建设小指南》

《硬刚用户画像(二) | 基于大数据的用户画像构建小百科全书》

《我们在学习Spark的时候,到底在学习什么?

我们在学习Flink的时候,到底在学习什么?》

我先声明一下,有些文章我没有标记原创,任何未经本人授权转载一律追究侵权责任。

【硬刚系列】是针对某一个框架/知识点进行的系统性总结和学习,基本上也是个人学习的必要路径。个人会从一个框架/知识点入手进行全方位的立体整合。

争取一篇文章能介绍清楚来龙去脉和重点难点,读者根据需要去针对性的学习。

上面是当初我立Flag的时候,写的简介。第一个版本主要针对一些OLAP框架为主吧。我个人感觉基本目的都达到了。

上面的每篇文章都参考了10篇以上的我的个人笔记和外部资料。有些非常经典的论文在我的收藏夹里躺了超过3年之久。

有些文章的名字可能没有「硬刚」字眼,但是行文思路基本上也是按照原来的设想进行的。

与自己是一种总结。与读者是一种输入。

大家都有收获,岂不美哉?

写了这么久文章,除了恰饭的时候,一直保持着旺盛的精力和强大的输出,有时候也真是疲倦,感觉找不到什么方向去突破。

现在的大数据行业细分也秉持了10年的刚刚出现的时候的姿态一直在向前发展,未来可能有些方向会慢慢消亡,或者从传统的定义进化。

比如传统的BI岗位,这个岗位已经开始慢慢在消亡,和传统的离线数据仓库&实时数据仓库进行了有机的融合。再比如,原来有个岗位叫做 ETL,也慢慢要淡出大家视野了,因为技能的局限性和可替代性太强?

最近的一年来,Flink社区仍然保持比较旺盛的活力,更多的原因是因为社区的推动,与开发者不过是个工具,与阿里是技术影响力和商业化考量。

数据湖方向发展方兴未艾,都想攀上Flink社区的大树。未来谨慎看好吧,因为并未给一家业务主导的公司带来实质性的改变。

最近Apache社区停更了Sqoop,阿帕奇社区的几个项目在阶段性的完成了它的使命后最终都落幕了。比如刚刚停更的Sqoop,可能还有些同学在用的Kettle,还有我很早接触过的一个Falcon,它们早就该消失在历史的滚滚洪流中了。

自今年4月1日起,Apache软件基金会宣布将至少19个开源项目撤回到他们的Attic,其中13个与大数据相关,10个属于Hadoop生态系统。这种事情的发生基本也可以宣布大数据领域的黄金十年(2010-2020年)结束了。

很多同学可能都没有仔细了解过大数据这个细分方向的历史,但是没有关系,下一个十年你们有机会一起见证了。

我之前还写过一篇《2021年,开发者的落日》,从我个人感情角度讲,不太想写这种唱衰的文章,但是我看到一些现象就会引发思考。

居安思危也许是人类经过百万年的进化得以统治地球的原因吧。

周末一个星球里的校招应届生找到我,关于学习路线和未来发展方向的问题。

我觉得我又有新的方向了,大数据行业马上要迎来井喷式增长的10年,大量从业人员从学校开始涌入。也代表这个行业走向历史的拐点了。

从野蛮发展到科班式培养,更多的应届生愿意从事这个行业,也是好事儿。

我觉得他们缺一个引路人,比如我。

好了,本次分享就到这里了。欢迎大家「点赞」「分享」「在看」。

我是王知无,一个大数据领域的硬核原创作者。关注技术提升&个人成长&职场进阶,欢迎关注。

这篇关于大数据方向另一个十年开启 |《硬刚系列》第一版完结的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1142870

相关文章

Redis的数据过期策略和数据淘汰策略

《Redis的数据过期策略和数据淘汰策略》本文主要介绍了Redis的数据过期策略和数据淘汰策略,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 目录一、数据过期策略1、惰性删除2、定期删除二、数据淘汰策略1、数据淘汰策略概念2、8种数据淘汰策略

轻松上手MYSQL之JSON函数实现高效数据查询与操作

《轻松上手MYSQL之JSON函数实现高效数据查询与操作》:本文主要介绍轻松上手MYSQL之JSON函数实现高效数据查询与操作的相关资料,MySQL提供了多个JSON函数,用于处理和查询JSON数... 目录一、jsON_EXTRACT 提取指定数据二、JSON_UNQUOTE 取消双引号三、JSON_KE

Python给Excel写入数据的四种方法小结

《Python给Excel写入数据的四种方法小结》本文主要介绍了Python给Excel写入数据的四种方法小结,包含openpyxl库、xlsxwriter库、pandas库和win32com库,具有... 目录1. 使用 openpyxl 库2. 使用 xlsxwriter 库3. 使用 pandas 库

SpringBoot定制JSON响应数据的实现

《SpringBoot定制JSON响应数据的实现》本文主要介绍了SpringBoot定制JSON响应数据的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们... 目录前言一、如何使用@jsonView这个注解?二、应用场景三、实战案例注解方式编程方式总结 前言

使用Python在Excel中创建和取消数据分组

《使用Python在Excel中创建和取消数据分组》Excel中的分组是一种通过添加层级结构将相邻行或列组织在一起的功能,当分组完成后,用户可以通过折叠或展开数据组来简化数据视图,这篇博客将介绍如何使... 目录引言使用工具python在Excel中创建行和列分组Python在Excel中创建嵌套分组Pyt

在Rust中要用Struct和Enum组织数据的原因解析

《在Rust中要用Struct和Enum组织数据的原因解析》在Rust中,Struct和Enum是组织数据的核心工具,Struct用于将相关字段封装为单一实体,便于管理和扩展,Enum用于明确定义所有... 目录为什么在Rust中要用Struct和Enum组织数据?一、使用struct组织数据:将相关字段绑

在Mysql环境下对数据进行增删改查的操作方法

《在Mysql环境下对数据进行增删改查的操作方法》本文介绍了在MySQL环境下对数据进行增删改查的基本操作,包括插入数据、修改数据、删除数据、数据查询(基本查询、连接查询、聚合函数查询、子查询)等,并... 目录一、插入数据:二、修改数据:三、删除数据:1、delete from 表名;2、truncate

Java实现Elasticsearch查询当前索引全部数据的完整代码

《Java实现Elasticsearch查询当前索引全部数据的完整代码》:本文主要介绍如何在Java中实现查询Elasticsearch索引中指定条件下的全部数据,通过设置滚动查询参数(scrol... 目录需求背景通常情况Java 实现查询 Elasticsearch 全部数据写在最后需求背景通常情况下

开启mysql的binlog日志步骤详解

《开启mysql的binlog日志步骤详解》:本文主要介绍MySQL5.7版本中二进制日志(bin_log)的配置和使用,文中通过图文及代码介绍的非常详细,需要的朋友可以参考下... 目录1.查看是否开启bin_log2.数据库会把日志放进logs目录中3.查看log日志总结 mysql版本5.71.查看

Java中注解与元数据示例详解

《Java中注解与元数据示例详解》Java注解和元数据是编程中重要的概念,用于描述程序元素的属性和用途,:本文主要介绍Java中注解与元数据的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参... 目录一、引言二、元数据的概念2.1 定义2.2 作用三、Java 注解的基础3.1 注解的定义3.2 内