谈谈大数据工程师的鄙视链

2024-01-25 06:48
文章标签 数据 工程师 谈谈 鄙视

本文主要是介绍谈谈大数据工程师的鄙视链,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

老婆漂亮的程序员,鄙视老婆不漂亮的程序员。

 

有老婆的程序员,鄙视没有老婆的程序员。

 

有女朋友的程序员,鄙视单身程序狗。

 

在单身狗之间,才有语言、编辑器和操作系统的互相鄙视。

 

 

看人家甜甜蜜蜜的,单身狗的你还不抓紧了找个妹子。

 

那么对于数据工程师来说,是不是也存在类似的一条鄙视链呢,今天我们不谈技术,我们谈谈技术背后的大数据工程师不同岗位之间的鄙视链:

 

大数据 ETL 开发工程师:

 

  • 负责数据仓库 ETL (数据的抽取、转换和导入)流程开发;

 

 

  • 精通 Hive SQL,掌握基本的 HQL 优化技能;

 

  • 熟练使用 MySQL/Postgres 等数据库;

 

  • 有Hadoop基础知识,熟练掌握PHP / Python / Java任一语言;

 

    (大数据金字塔的最底端,职业瓶颈非常有限)

 

大数据开发工程师:

 

  • 熟悉 Linux,熟悉 shell,perl,python,php 等脚本语言的一种或多种;

 

  • 扎实的 Java 基础编程,熟悉传统数据库 MySQL;

 

  • 熟悉 Hadoop,HBase,Hive,Spark,Storm 任意一项或多项技术;

 

 

 

  • 有大规模数据处理和日志处理经验的优先;

 

 

大数据开发工程师+数据平台J2EE开发工程师:

 

  • 数据平台J2EE开发工程师:3-5年的 Java 开发经验;

 

  • 慢慢往大数据方向来转,懂一点儿大数据的基础知识;

 

  • Hadoop、Spark、Storm、HBase 至少知道是怎么回事,能写一点简单的程序;

 

  • J2EE精通,提交计算任务(指定参数)、通过界面查看漂亮的报表和表格;

 

 

 

大数据平台高级开发工程师:

 

  • 精通 Hadoop、Spark、Storm(源码级别的),Kafka、Flume、ZooKeeper;

 

  • 精通 J2EE 技术,开源框架(Spring MVC、Spring、MyBatis);

 

  • 精通 MySQL 性能调优,Java 虚拟机(JVM)调优;

 

 

  • 高并发系统架构(NoSQL、Redis、Memcached、Nginx、负载均衡、分布式);

 

大数据平台高级架构师:

 

  • 研究与跟踪大数据新技术发展方向,针对公司大数据业务进行框架设计;  

 

  • 负责公司大数据产品的技术选型、设计、研发和维护,参与产品从立项到交付的全生命周期工作;

 

  • 参与研发团队的日常技术交流与分享,为其他同事提供技术指导与帮助;

 

 

  • 深入了解业务需求与业务逻辑,同产品、业务相关同事密切沟通和配合;

 

  • 研究未来数据模型和计算框架的创新与落地(数据计算框架轻量化、建立数据模型等);

   

高端,高端,高端

大数据数据挖掘与机器学习工程师:

 

  • 一步一步往上走,走到大数据平台高级架构师级别;

 

  • 对数据结构和算法设计有较为深刻的理解;

 

  • 精通各种机器学习与数据挖掘的算法;(Spark MLlib,机器学习,GraphX,图计算,Hadoop Mahout);

 

  • 反作弊研发经验、用户行为分析、社群关系挖掘;

 

  • 个性化推荐系统,用户意愿度分级系统,预测热卖产品走势,用户增长率等;

 

 

 

走到大数据金字塔的最顶端,用技术去直接为企业创造价值和利润,公司可以直接根据这些人计算出来的一些数据、方案等,去科学决策,调整公司的战略,是直接对公司的利润的提升、市场占有率的增加是有帮助的。

 

写在最后的话:

 

不管你智商多高,技术多牛逼,最重要的是要会落地,针对存在的问题提出解决方案,给公司创造价值,只有这样才能给自己带来实打实的回报,不然都是浮云啊。

 

其实很多时候是产品业务推动着技术人员的进步,比如某一天我们开发的产品就爆红了,带来了大量的用户访问,那你是不是就要着手解决高并发,海量数据存储等问题。

 

在没有碰到问题前,技术人员很多时候并不会意识到潜在的问题,就是在这样解决了一个又一个的问题之后,我们踩过了 N 个坑之后的经验就是我们成长的见证。

 

 

 

 

推荐阅读:

 

想成为云计算大数据Spark高手,看这里!戳我阅读

年薪50W的Java程序员转大数据学习路线戳我阅读

大数据人工智能发展趋势与前景  戳我阅读

最全最新的大数据系统交流路径!!戳我阅读

2019最新!大数据工程师就业薪资,让人惊艳!戳我阅读

这篇关于谈谈大数据工程师的鄙视链的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/642420

相关文章

嵌入式软件工程师应聘知识点

嵌入式软件工程师应聘 修改浏览权限 | 删除 数据结构(C语言)部分常考的知识点: 1、局部变量能、全局变量和静态变量 2、堆和栈 3、Const、volatile、define、typedef的用途 4、链表(比如链表的插入、删除和排序) 5、排序(考查冒泡法的较多) 6、可重入函数 、malloc函数 7、指针(常考函数指针,函数指针,数组指针,指针数组和

【服务器运维】MySQL数据存储至数据盘

查看磁盘及分区 [root@MySQL tmp]# fdisk -lDisk /dev/sda: 21.5 GB, 21474836480 bytes255 heads, 63 sectors/track, 2610 cylindersUnits = cylinders of 16065 * 512 = 8225280 bytesSector size (logical/physical)

SQL Server中,查询数据库中有多少个表,以及数据库其余类型数据统计查询

sqlserver查询数据库中有多少个表 sql server 数表:select count(1) from sysobjects where xtype='U'数视图:select count(1) from sysobjects where xtype='V'数存储过程select count(1) from sysobjects where xtype='P' SE

数据时代的数字企业

1.写在前面 讨论数据治理在数字企业中的影响和必要性,并介绍数据治理的核心内容和实践方法。作者强调了数据质量、数据安全、数据隐私和数据合规等方面是数据治理的核心内容,并介绍了具体的实践措施和案例分析。企业需要重视这些方面以实现数字化转型和业务增长。 数字化转型行业小伙伴可以加入我的星球,初衷成为各位数字化转型参考库,星球内容每周更新 个人工作经验资料全部放在这里,包含数据治理、数据要

如何在Java中处理JSON数据?

如何在Java中处理JSON数据? 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿!今天我们将探讨在Java中如何处理JSON数据。JSON(JavaScript Object Notation)作为一种轻量级的数据交换格式,在现代应用程序中被广泛使用。Java通过多种库和API提供了处理JSON的能力,我们将深入了解其用法和最佳

两个基因相关性CPTAC蛋白组数据

目录 蛋白数据下载 ①蛋白数据下载 1,TCGA-选择泛癌数据  2,TCGA-TCPA 3,CPTAC(非TCGA) ②蛋白相关性分析 1,数据整理 2,蛋白相关性分析 PCAS在线分析 蛋白数据下载 CPTAC蛋白组学数据库介绍及数据下载分析 – 王进的个人网站 (jingege.wang) ①蛋白数据下载 可以下载泛癌蛋白数据:UCSC Xena (xena

华为某员工爆料:偷偷跑出去面试,被面试官鄙视了。第一句话就问:华为淘汰的吧,35岁了,这个年龄在华为能混得下去吗?身体没啥毛病吧

“你都35岁了,难不成是被华为淘汰的?在华为混不下去了吧?身体没啥毛病吧,我们这体检可是很严的。” 近日,一位华为员工在朋友圈爆料,自己在面试时遭到了面试官的无理取闹和人身攻击,原因仅仅是因为他35岁了,曾经在华为工作过。 这番话,充满了傲慢与偏见,让人听了义愤填膺。这位面试官的言行,不仅是对求职者的不尊重,更是对职场规则的践踏。 面试本应是双向选择的过程,企业和求职者在相互了解的基

中国341城市生态系统服务价值数据集(2000-2020年)

生态系统服务反映了人类直接或者间接从自然生态系统中获得的各种惠益,对支撑和维持人类生存和福祉起着重要基础作用。目前针对全国城市尺度的生态系统服务价值的长期评估还相对较少。我们在Xie等(2017)的静态生态系统服务当量因子表基础上,选取净初级生产力,降水量,生物迁移阻力,土壤侵蚀度和道路密度五个变量,对生态系统供给服务、调节服务、支持服务和文化服务共4大类和11小类的当量因子进行了时空调整,计算了

【计算机网络篇】数据链路层(12)交换机式以太网___以太网交换机

文章目录 🍔交换式以太网🛸以太网交换机 🍔交换式以太网 仅使用交换机(不使用集线器)的以太网就是交换式以太网 🛸以太网交换机 以太网交换机本质上就是一个多接口的网桥: 交换机的每个接口考研连接计算机,也可以理解集线器或另一个交换机 当交换机的接口与计算机或交换机连接时,可以工作在全双工方式,并能在自身内部同时连通多对接口,使每一对相互通信的计算机都能像

使用Jsoup抓取数据

问题 最近公司的市场部分布了一个问题,到一个网站截取一下医院的数据。刚好我也被安排做。后来,我发现为何不用脚本去抓取呢? 抓取的数据如下: Jsoup的使用实战代码 结构 Created with Raphaël 2.1.0 开始 创建线程池 jsoup读取网页 解析Element 写入sqlite 结束