阿里大数据一次简单而失败的面试题回忆

2024-09-06 19:38

本文主要是介绍阿里大数据一次简单而失败的面试题回忆,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一面

  • 简单介绍一下自己以及自己做过的项目;
  • Java HashMap 是不是线程安全的?为什么?
  • 请用 Java 写个单例模式
  • 知道几种 GC 算法?
  • 如何实现一个高效的单项列表逆向输出?
  • 数据湖和数据仓库有什么区别?
  • 详细介绍下 Flink 的 Checkpoint 执行机制(分布式快照)
  • 算法题:寻找两个正序数组的中位数

二面

  • 如何在两个进程间共享数据?线程呢?
  • 如何在 main 函数里面等待一个线程执行完毕?
  • 用MapReduce手写一个wordcount,
  • 用 MapReduce TopK 怎么实现?
  • Hudi、Iceberg 和 Delta Lake 哪个熟悉?它们之前有什么区别知道吗?
  • 请简述 Hudi 的读写流程。
  • 布隆过滤器的原理知道吗?(在回答 Hudi 写数据的时候提到布隆过滤器,所以面试官问了)。
  • 算法题:合并两个有序链表。三个有序链表合并?K 个呢?

三面

  • Spark Shuffle 读写原理说下,和 MapReduce 的 Shuffle 有什么区别?
  • Hudi 支持流批一起处理吗?他是怎么实现的?
  • Iceberg 知道吗?实现原理你知道吗?
  • Iceberg 的时间旅行是怎么实现的?什么场景下要使用它?
  • Hudi 和 Iceberg 你怎么选?为什么。
  • 算法题:一辆公交车,有 m 站,最多坐 n 人,输入一路上的票信息(即上车下车站),输出会不会超载。

四面

  • 说一下你熟悉的设计模式?
  • synchronized 和 ReentrantLock 区别是什么?
  • 都知道哪些分布式一致性算法?挑一个你熟悉的说下其原理。
  • Join 的实现有哪几种?场景是哪些?
  • 一条 SQL 从提交到拿到结果都经历了什么?
  • 说下你理解的数据湖?
  • Hudi、Iceberg 和 Delta Lake 怎么选择?
  • 请简述一下 Flink CDC 原理

小编把阿里巴巴、腾讯、美团等大厂的Java和大数据面试题整理成了电子书和资源,目录如下: 资源 链接: https://pan.baidu.com/s/1ifHfofjawqD9jn2lvoh0NA 提取码: h79x 另外,微信搜索关注【import_bigdata】,回复【资源】,还有几百G大数据资源下载!

欢迎关注,《大数据成神之路》系列文章

这篇关于阿里大数据一次简单而失败的面试题回忆的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1142934

相关文章

C++初始化数组的几种常见方法(简单易懂)

《C++初始化数组的几种常见方法(简单易懂)》本文介绍了C++中数组的初始化方法,包括一维数组和二维数组的初始化,以及用new动态初始化数组,在C++11及以上版本中,还提供了使用std::array... 目录1、初始化一维数组1.1、使用列表初始化(推荐方式)1.2、初始化部分列表1.3、使用std::

pip install jupyterlab失败的原因问题及探索

《pipinstalljupyterlab失败的原因问题及探索》在学习Yolo模型时,尝试安装JupyterLab但遇到错误,错误提示缺少Rust和Cargo编译环境,因为pywinpty包需要它... 目录背景问题解决方案总结背景最近在学习Yolo模型,然后其中要下载jupyter(有点LSVmu像一个

redis群集简单部署过程

《redis群集简单部署过程》文章介绍了Redis,一个高性能的键值存储系统,其支持多种数据结构和命令,它还讨论了Redis的服务器端架构、数据存储和获取、协议和命令、高可用性方案、缓存机制以及监控和... 目录Redis介绍1. 基本概念2. 服务器端3. 存储和获取数据4. 协议和命令5. 高可用性6.

Redis的数据过期策略和数据淘汰策略

《Redis的数据过期策略和数据淘汰策略》本文主要介绍了Redis的数据过期策略和数据淘汰策略,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 目录一、数据过期策略1、惰性删除2、定期删除二、数据淘汰策略1、数据淘汰策略概念2、8种数据淘汰策略

轻松上手MYSQL之JSON函数实现高效数据查询与操作

《轻松上手MYSQL之JSON函数实现高效数据查询与操作》:本文主要介绍轻松上手MYSQL之JSON函数实现高效数据查询与操作的相关资料,MySQL提供了多个JSON函数,用于处理和查询JSON数... 目录一、jsON_EXTRACT 提取指定数据二、JSON_UNQUOTE 取消双引号三、JSON_KE

JAVA调用Deepseek的api完成基本对话简单代码示例

《JAVA调用Deepseek的api完成基本对话简单代码示例》:本文主要介绍JAVA调用Deepseek的api完成基本对话的相关资料,文中详细讲解了如何获取DeepSeekAPI密钥、添加H... 获取API密钥首先,从DeepSeek平台获取API密钥,用于身份验证。添加HTTP客户端依赖使用Jav

Python给Excel写入数据的四种方法小结

《Python给Excel写入数据的四种方法小结》本文主要介绍了Python给Excel写入数据的四种方法小结,包含openpyxl库、xlsxwriter库、pandas库和win32com库,具有... 目录1. 使用 openpyxl 库2. 使用 xlsxwriter 库3. 使用 pandas 库

SpringBoot定制JSON响应数据的实现

《SpringBoot定制JSON响应数据的实现》本文主要介绍了SpringBoot定制JSON响应数据的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们... 目录前言一、如何使用@jsonView这个注解?二、应用场景三、实战案例注解方式编程方式总结 前言

使用Python在Excel中创建和取消数据分组

《使用Python在Excel中创建和取消数据分组》Excel中的分组是一种通过添加层级结构将相邻行或列组织在一起的功能,当分组完成后,用户可以通过折叠或展开数据组来简化数据视图,这篇博客将介绍如何使... 目录引言使用工具python在Excel中创建行和列分组Python在Excel中创建嵌套分组Pyt

在Rust中要用Struct和Enum组织数据的原因解析

《在Rust中要用Struct和Enum组织数据的原因解析》在Rust中,Struct和Enum是组织数据的核心工具,Struct用于将相关字段封装为单一实体,便于管理和扩展,Enum用于明确定义所有... 目录为什么在Rust中要用Struct和Enum组织数据?一、使用struct组织数据:将相关字段绑