RDDs的特性

2024-09-01 17:32

文章标签 特性 rdds

本文主要是介绍RDDs的特性，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

RDDs的特性

血统关系图

Spark维护这RDDs之间的依赖关系和创建关系，叫做血统关系图

spark使用血统关系图计算每个RDD的需求和恢复丢失的数据

代表着RDD是怎么获得的，而且又做了什么操作

作用：丢失时可以找回

延迟计算：

spark对RDDs的计算是他们第一次使用action操作的时候

处理大数据时非常有用，可以减少数据的传输

spark内部记录metadata表明transformation操作已经被响应了

加载数据也是延迟计算，数据只有在必要时，才被加载进去

RDD.persist() 持久化

默认每次在RDDs上进行action操作时，spark都会重新计算RDDs

如果想重复利用一个RDD，可以使用RDD.persist()

unpersist()方法从缓存中移出

RDD.persist()

缓存级别，

memory only，空间占用高，cpu低

disk only,空间低，CPU高

memory-disk，内存放不下时候，往硬盘里放，空间高，CPU中

memory-disk-ser内存中放不下，往硬盘放，内存中数据是序列化的，空间低，CPU高

这篇关于RDDs的特性的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/1127593。 23002807@qq.com

相关文章

从入门到精通C++11 ＜chrono＞库特性

从入门到精通C++11 ＜chrono＞库特性

《从入门到精通C++11＜chrono＞库特性》chrono库是C++11中一个非常强大和实用的库,它为时间处理提供了丰富的功能和类型安全的接口,通过本文的介绍,我们了解了chrono库的基本概念... 目录一、引言1.1 为什么需要<chrono>库1.2<chrono>库的基本概念二、时间段（Durat

阅读更多...

JDK9到JDK21中值得掌握的29个实用特性分享

JDK9到JDK21中值得掌握的29个实用特性分享

《JDK9到JDK21中值得掌握的29个实用特性分享》Java的演进节奏从JDK9开始显著加快,每半年一个新版本的发布节奏为Java带来了大量的新特性,本文整理了29个JDK9到JDK21中值得掌握的... 目录JDK 9 模块化与API增强1. 集合工厂方法：一行代码创建不可变集合2. 私有接口方法：接口

阅读更多...

C#特性(Attributes)和反射(Reflection)详解

C#特性(Attributes)和反射(Reflection)详解

《C#特性(Attributes)和反射(Reflection)详解》：本文主要介绍C#特性(Attributes)和反射(Reflection),具有很好的参考价值,希望对大家有所帮助,如有错误... 目录特性特性的定义概念目的反射定义概念目的反射的主要功能包括使用反射的基本步骤特性和反射的关系总结特性

阅读更多...

PyTorch高级特性与性能优化方式

PyTorch高级特性与性能优化方式

《PyTorch高级特性与性能优化方式》：本文主要介绍PyTorch高级特性与性能优化方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、自动化机制1.自动微分机制2.动态计算图二、性能优化1.内存管理2.GPU加速3.多GPU训练三、分布式训练1.分布式数据

阅读更多...

SpringBoot3.4配置校验新特性的用法详解

SpringBoot3.4配置校验新特性的用法详解

《SpringBoot3.4配置校验新特性的用法详解》SpringBoot3.4对配置校验支持进行了全面升级,这篇文章为大家详细介绍了一下它们的具体使用,文中的示例代码讲解详细,感兴趣的小伙伴可以参考... 目录基本用法示例定义配置类配置 application.yml注入使用嵌套对象与集合元素深度校验开发

阅读更多...

新特性抢先看! Ubuntu 25.04 Beta 发布:Linux 6.14 内核

新特性抢先看! Ubuntu 25.04 Beta 发布:Linux 6.14 内核

《新特性抢先看!Ubuntu25.04Beta发布:Linux6.14内核》Canonical公司近日发布了Ubuntu25.04Beta版，这一版本被赋予了一个活泼的代号——“Plu... Canonical 昨日（3 月 27 日）放出了 Beta 版 Ubuntu 25.04 系统镜像，代号“Pluc

阅读更多...

Rust中的Drop特性之解读自动化资源清理的魔法

Rust中的Drop特性之解读自动化资源清理的魔法

《Rust中的Drop特性之解读自动化资源清理的魔法》Rust通过Drop特性实现了自动清理机制,确保资源在对象超出作用域时自动释放,避免了手动管理资源时可能出现的内存泄漏或双重释放问题,智能指针如B... 目录自动清理机制：Rust 的析构函数提前释放资源：std::mem::drop android的妙

阅读更多...

五大特性引领创新! 深度操作系统 deepin 25 Preview预览版发布

五大特性引领创新! 深度操作系统 deepin 25 Preview预览版发布

《五大特性引领创新!深度操作系统deepin25Preview预览版发布》今日，深度操作系统正式推出deepin25Preview版本，该版本集成了五大核心特性：磐石系统、全新DDE、Tr... 深度操作系统今日发布了 deepin 25 Preview，新版本囊括五大特性：磐石系统、全新 DDE、Tree

阅读更多...

ActiveMQ—消息特性（延迟和定时消息投递）

ActiveMQ—消息特性（延迟和定时消息投递）

ActiveMQ消息特性：延迟和定时消息投递（Delay and Schedule Message Delivery）转自：http://blog.csdn.net/kimmking/article/details/8443872 有时候我们不希望消息马上被broker投递出去，而是想要消息60秒以后发给消费者，或者我们想让消息没隔一定时间投递一次，一共投递指定的次数。。。类似

阅读更多...

PostgreSQL核心功能特性与使用领域及场景分析

PostgreSQL核心功能特性与使用领域及场景分析

PostgreSQL有什么优点？开源和免费 PostgreSQL是一个开源的数据库管理系统，可以免费使用和修改。这降低了企业的成本，并为开发者提供了一个活跃的社区和丰富的资源。高度兼容 PostgreSQL支持多种操作系统（如Linux、Windows、macOS等）和编程语言（如C、C++、Java、Python、Ruby等），并提供了多种接口（如JDBC、ODBC、ADO.NET等

阅读更多...