异构存储（冷热数据分离）

本文主要是介绍异构存储（冷热数据分离），希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

异构存储主要解决不同的数据，存储在不同类型的硬盘中，达到最佳性能的问题。

异构存储Shell操作

（1）查看当前有哪些存储策略可以用

[lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies

（2）为指定路径（数据存储目录）设置指定的存储策略

hdfs storagepolicies -setStoragePolicy -path xxx -policy xxx

（3）获取指定路径（数据存储目录或文件）的存储策略

hdfs storagepolicies -getStoragePolicy -path xxx

（4）取消存储策略；执行改命令之后该目录或者文件，以其上级的目录为准，如果是根目录，那么就是HOT

hdfs storagepolicies -unsetStoragePolicy -path xxx

（5）查看文件块的分布

bin/hdfs fsck xxx -files -blocks -locations

（6）查看集群节点

hadoop dfsadmin -report

配置文件信息

（1）为hadoop102节点的hdfs-site.xml添加如下信息

<property><name>dfs.replication</name><value>2</value>
</property>
<property><name>dfs.storage.policy.enabled</name><value>true</value>
</property>
<property><name>dfs.datanode.data.dir</name> <value>[SSD]file:///opt/module/hadoop-3.1.4/hdfsdata/ssd,[RAM_DISK]file:///opt/module/hadoop-3.1.4/hdfsdata/ram_disk</value>
</property>

（2）为hadoop103节点的hdfs-site.xml添加如下信息

<property><name>dfs.replication</name><value>2</value>
</property>
<property><name>dfs.storage.policy.enabled</name><value>true</value>
</property>
<property><name>dfs.datanode.data.dir</name><value>[SSD]file:///opt/module/hadoop-3.1.4/hdfsdata/ssd,[DISK]file:///opt/module/hadoop-3.1.4/hdfsdata/disk</value>
</property>

（3）为hadoop104节点的hdfs-site.xml添加如下信息

<property><name>dfs.replication</name><value>2</value>
</property>
<property><name>dfs.storage.policy.enabled</name><value>true</value>
</property>
<property><name>dfs.datanode.data.dir</name><value>[RAM_DISK]file:///opt/module/hdfsdata/ram_disk,[DISK]file:///opt/module/hadoop-3.1.4/hdfsdata/disk</value>
</property>

（4）为hadoop105节点的hdfs-site.xml添加如下信息

<property><name>dfs.replication</name><value>2</value>
</property>
<property><name>dfs.storage.policy.enabled</name><value>true</value>
</property>
<property><name>dfs.datanode.data.dir</name><value>[ARCHIVE]file:///opt/module/hadoop-3.1.4/hdfsdata/archive</value>
</property>

（5）为hadoop106节点的hdfs-site.xml添加如下信息

<property><name>dfs.replication</name><value>2</value>
</property>
<property><name>dfs.storage.policy.enabled</name><value>true</value>
</property>
<property><name>dfs.datanode.data.dir</name><value>[ARCHIVE]file:///opt/module/hadoop-3.1.4/hdfsdata/archive</value>
</property>

注意：当我们将目录设置为COLD并且我们未配置ARCHIVE存储目录的情况下，不可以向该目录直接上传文件，会报出异常。

数据准备

（1）启动集群

[lytfly@hadoop102 hadoop-3.1.4]$ hdfs namenode -format
[lytfly@hadoop102 hadoop-3.1.4]$ myhadoop.sh start

（1）并在HDFS上创建文件目录

[lytfly@hadoop102 hadoop-3.1.4]$ hadoop fs -mkdir /hdfsdata

（2）并将文件资料上传

[lytfly@hadoop102 hadoop-3.1.4]$ hadoop fs -put /opt/module/hadoop-3.1.4/NOTICE.txt /hdfsdata

这篇关于异构存储（冷热数据分离）的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

异构存储（冷热数据分离）

异构存储Shell操作

（1）查看当前有哪些存储策略可以用

（2）为指定路径（数据存储目录）设置指定的存储策略

（3）获取指定路径（数据存储目录或文件）的存储策略

（4）取消存储策略；执行改命令之后该目录或者文件，以其上级的目录为准，如果是根目录，那么就是HOT

（5）查看文件块的分布

（6）查看集群节点

配置文件信息

（1）为hadoop102节点的hdfs-site.xml添加如下信息

（2）为hadoop103节点的hdfs-site.xml添加如下信息

（3）为hadoop104节点的hdfs-site.xml添加如下信息

（4）为hadoop105节点的hdfs-site.xml添加如下信息

（5）为hadoop106节点的hdfs-site.xml添加如下信息

数据准备

（1）启动集群

（1）并在HDFS上创建文件目录

（2）并将文件资料上传

相关文章

MyBatis-Plus通用中等、大量数据分批查询和处理方法

SpringBoot3.X 整合 MinIO 存储原生方案

SQL中如何添加数据(常见方法及示例)

Python使用vllm处理多模态数据的预处理技巧

Knife4j+Axios+Redis前后端分离架构下的 API 管理与会话方案(最新推荐)

MySQL 删除数据详解(最新整理)

Python实现对阿里云OSS对象存储的操作详解

Java中调用数据库存储过程的示例代码

MyBatisPlus如何优化千万级数据的CRUD

python实现对数据公钥加密与私钥解密