调优篇专题

jvm 调优篇

一 jvm调优篇 1.1 查看新生代和老年代的比例输入命令： jinfo -flag NewRatio 17480 1.2 查看新生代，survivor和Eden区比例 1.3 查看jvm调优参数二调优参数 2.1 oom异常通过visual vm查看 2.java dump 大对象 2.2 mat工具进行分析栈的

二、Spark性能优化：资源调优篇

转自：https://blog.csdn.net/u012102306/article/details/51637366 在开发完Spark作业之后，就该为作业配置合适的资源了。Spark的资源参数，基本都可以在spark-submit命令中作为参数设置。很多Spark初学者，通常不知道该设置哪些必要的参数，以及如何设置这些参数，最后就只能胡乱设置，甚至压根儿不设置。资源参数设置的不

一、Spark性能优化：开发调优篇

转自：https://blog.csdn.net/u012102306/article/details/51322209 1、前言在大数据计算领域，Spark已经成为了越来越流行、越来越受欢迎的计算平台之一。Spark的功能涵盖了大数据领域的离线批处理、SQL类处理、流式/实时计算、机器学习、图计算等各种不同类型的计算操作，应用范围与前景非常广泛。在美团•大众点评，已经有很多同学

MySQL性能调优篇(8)-NoSQL与MySQL的比较

MySQL数据库是一种关系型数据库，而NoSQL是一种非关系型数据库。它们在数据存储和处理方式、数据模型和可扩展性等方面存在一些明显的差异。本文将对MySQL数据库和NoSQL进行比较，并介绍它们的优势和劣势。首先，MySQL使用表格的形式来存储数据，采用一对多的关系，并且要求在插入数据之前定义表结构。这种结构化的数据存储方式可以确保数据的一致性和完整性，同时也提供了强大的查询功能。下面是一个

MySQL性能调优篇(10)-数据库备份与恢复策略

MySQL数据库备份与恢复策略数据库备份与恢复是数据库管理中非常重要的一环，对于保障数据的安全性和可靠性起着至关重要的作用。本文将介绍MySQL数据库备份与恢复的策略，包括备份类型、备份方法以及恢复策略。 1. 备份类型 1.1 完整备份完整备份是备份数据库中所有数据和对象的一种方式。它可以创建数据库的一个镜像副本，包括表、索引、存储过程等。完整备份需要较长的时间和磁盘空间，但是恢复时

MySQL性能调优篇(7)-MySQL的集群部署和优化

MySQL的集群部署和优化 MySQL是一种常用的关系型数据库管理系统，可以用于存储和管理大量的结构化数据。为了满足高并发和大规模数据存储需求，MySQL的集群部署和优化变得非常重要。本篇博客将介绍MySQL的集群部署方法和一些优化技巧。一、MySQL集群部署主从复制主从复制是一种非常常见的MySQL集群部署方法，它通过将一个MySQL实例作为主服务器，其他实例作为从服务器来实现数据的

MySQL性能调优篇(6)-主从复制的配置与管理

MySQL数据库主从复制是一种常用的数据复制和高可用性解决方案。它允许将一个MySQL主服务器上的数据自动复制到多个从服务器上，从而提供了数据冗余备份、读写分离等优势。本文将详细介绍MySQL数据库主从复制的配置与管理。 1. 原理概述 MySQL主从复制是基于二进制日志（Binary Log）实现的。主服务器将写操作记录在二进制日志中，并将这些日志传输给从服务器进行重放，从而使从服务器上的数

MySQL性能调优篇(3)-缓存的优化与清理

MySQL数据库缓存的优化与清理数据库缓存在MySQL中扮演着非常重要的角色，它可以显著提高数据库的性能和响应速度。在本篇博客中，我们将介绍如何优化和清理MySQL数据库的缓存，以进一步提高数据库的效率。优化缓存 1. 适当调整缓存大小 MySQL数据库的缓存大小对性能有着直接的影响。通过修改以下两个参数，可以调整缓存的大小： innodb_buffer_pool_size：适用于I

MySQL性能调优篇(2)-数据库统计信息的收集

MySQL是一个开源的关系型数据库管理系统，被广泛应用于各种规模的企业和网站。而数据库统计信息的收集对于数据库性能调优和监控非常重要。本文将介绍MySQL数据库中的统计信息的收集方式及其用途，以及如何使用相关命令和工具进行统计信息收集。一、什么是数据库统计信息数据库统计信息主要指数据库中包含关于表、索引、列以及其他数据库对象的元数据，通过收集这些统计信息，可以了解数据库中数据的分布情况、索

MySQL性能调优篇(1)-分析执行计划的方法

MySQL是一种常用的关系型数据库管理系统，它的性能优化对于数据处理的效率和性能至关重要。在优化MySQL数据库的过程中，分析执行计划是一个重要的步骤。执行计划是查询优化器在执行SQL语句时生成的一种解析树或操作流程图，用于描述MySQL数据库系统按照哪种方式执行查询操作。本文将介绍如何使用MySQL的语法来分析执行计划，并提供详细的示例。在MySQL中，我们可以使用EXPLAIN关键字来分析

04：JVM调优篇（6）

目录一、说一说JVM的内存模型二、JAVA类加载的全过程是怎样的？什么是双亲委派机制？有什么作用？三、怎么确定一个对象到底是不是垃圾？什么是GC Root? 四、JVM有哪些垃圾回收算法？五、JVM有哪些垃圾回收器？他们都是怎么工作的？什么是STW？他都发生在哪些阶段？什么是三色标记？如何解决错标记和漏标记的问题？为什么要设计这么多的垃圾回收器？六、如何进行JVM调优？JV

Hadoop3教程（三十五）：（生产调优篇）HDFS小文件优化与MR集群简单压测

文章目录（168）HDFS小文件优化方法（169）MapReduce集群压测参考文献（168）HDFS小文件优化方法小文件的弊端，之前也讲过，一是大量占用NameNode的空间，二是会使得寻址速度变慢。另外，过多的小文件，在进行MR的时候，会生成过多切片，从而启动过多的MapTask，很容易造成，启动MapTask的时间比MapTask计算的时间还长，浪费资源。那怎

Hadoop3教程（三十六）：（生产调优篇）企业开发场景中的参数调优案例概述

文章目录（170）企业开发场景案例HDFS参数调优MapReduce参数调优YARN参数调优执行程序参考文献（170）企业开发场景案例这章仅做兴趣了解即可。需求：从1G数据中，统计每个单词出现次数。服务器3台，每台配置4G内存，4核CPU，4线程。需求分析： 1G / 128m = 8个MapTask；1个ReduceTask；1个mrAppMaster 平均

Hadoop3教程（三十六）：（生产调优篇）企业开发场景中的参数调优案例概述

文章目录（170）企业开发场景案例HDFS参数调优MapReduce参数调优YARN参数调优执行程序参考文献（170）企业开发场景案例这章仅做兴趣了解即可。需求：从1G数据中，统计每个单词出现次数。服务器3台，每台配置4G内存，4核CPU，4线程。需求分析： 1G / 128m = 8个MapTask；1个ReduceTask；1个mrAppMaster 平均

Hadoop3教程（三十五）：（生产调优篇）HDFS小文件优化与MR集群简单压测

文章目录（168）HDFS小文件优化方法（169）MapReduce集群压测参考文献（168）HDFS小文件优化方法小文件的弊端，之前也讲过，一是大量占用NameNode的空间，二是会使得寻址速度变慢。另外，过多的小文件，在进行MR的时候，会生成过多切片，从而启动过多的MapTask，很容易造成，启动MapTask的时间比MapTask计算的时间还长，浪费资源。那怎

Hadoop3教程（三十二）：（生产调优篇）NameNode故障恢复与集群的安全模式

文章目录（159）NameNode故障处理（160）集群安全模式&磁盘修复集群安全模式磁盘修复等待安全模式参考文献（159）NameNode故障处理如果NameNode进程挂了并且存储的数据也丢失了，如何恢复NameNode？首先，我们可以通过以下代码来模拟故障：（1）kill -9 NameNode进程 [atguigu@hadoop102 current]$

Hadoop3教程（三十二）：（生产调优篇）NameNode故障恢复与集群的安全模式

文章目录（159）NameNode故障处理（160）集群安全模式&磁盘修复集群安全模式磁盘修复等待安全模式参考文献（159）NameNode故障处理如果NameNode进程挂了并且存储的数据也丢失了，如何恢复NameNode？首先，我们可以通过以下代码来模拟故障：（1）kill -9 NameNode进程 [atguigu@hadoop102 current]$

Hadoop3教程（三十一）：（生产调优篇）异构存储

文章目录（157）异构存储概述概述异构存储的shell操作（158）异构存储案例实操参考文献（157）异构存储概述概述异构存储，也叫做冷热数据分离。其中，经常使用的数据被叫做是热数据，不经常使用的数据被叫做冷数据。把冷热数据，分别存储在不同的存储介质里，从而达到对每个介质的利用率最高，从而实现整体最佳性能，或者说性价比更高（比如说高性能硬盘放经常使用的数据）。

Hadoop3教程（二十九）：（生产调优篇）集群扩容及缩容（白名单与黑名单）

文章目录（150）添加白名单（151）服役新服务器（152）服务器间数据均衡（153）黑名单退役服务器参考文献这一章还算是比较重要的。（150）添加白名单白名单：在白名单里的主机IP地址，就可以用来存储数据以及互相之间的通信等。一般企业都会配置集群白名单，防止黑客攻击。相应的，集群里也有黑名单，下几节会讲。配置白名单步骤如下，仅做了解，所以直接复制的教程内

Hadoop3教程（三十）：（生产调优篇）纠删码

文章目录（155）纠删码原理纠删码原理纠删码相关命令纠删码策略解释（156）纠删码案例实操参考文献（155）纠删码原理纠删码原理默认情况下，一个文件在HDFS里会保留3个副本，以此提高数据的可靠性（容灾），但也带来了2倍的存储上的冗余开销。于是Hadoop3.x引入了纠删码，采用计算的方式来提高数据的可靠性，可以节省50%左右的存储空间。如上图（黄色部分）

Hadoop3教程（二十七）：（生产调优篇）HDFS读写压测

文章目录（146）HDFS压测环境准备（147）HDFS读写压测写压测读压测参考文献（146）HDFS压测环境准备对开发人员来讲，压测这个技能很重要。假设你刚搭建好一个集群，就可以直接投入生产了吗？那当然不行，还需要对集群进行压测，一方面是测试集群的读写性能，多大的数据耗时多久才能读写完成，另一方面也是测试集群是否会崩溃。 HDFS的读写性能主要受网络和磁盘的影