OCO系列卫星数据批量转格式(netCDF转CSV、Tiff)

2023-11-21 05:50

本文主要是介绍OCO系列卫星数据批量转格式(netCDF转CSV、Tiff),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

OCO系列卫星数据批量转格式实现在GIS软件中处理

从官网上下载得到的OCO卫星数据是以nc4后缀结尾的netCDF文件,在上一篇博客中已经介绍了利用Plotly库进行单幅图像可视化的方法,接下来为了方便在GIS软件里进一步处理,可以对nc格式的文件进行格式转换。

netCDF转CSV

使用的语言依然是Python,用到的库有以下:

import glob
import shutil
import pandas as pd
import os
import netCDF4 as nc
# converting the datetime format
from datetime import datetime

由于输入的日期和时间是字符串,要处理日期和时间,首先必须把str转换为datetime。转换方法是通过datetime.strptime()实现,需要一个日期和时间的格式化字符串:

def conv_date(d):return datetime.strptime(str(d), '%Y%m%d%H%M%S%f')

接下来封装一个名为convHdf的函数来将nc格式的文件转换为csv格式。

def convHdf(path_file, out_path, n=0):data = nc.Dataset(path_file)df_xco2 = pd.DataFrame()

这里构建了一个名为df_xco2的数据表,包含了Xco2、Latitude等八个列,其中每个列中的填充数据分别对应于netCDF4包读取到的原始文件中的变量(variables):

df_xco2['Xco2'] = data.variables['xco2'][:]df_xco2['Latitude'] = data.variables['latitude'][:]df_xco2['Longitude'] = data.variables['longitude'][:]df_xco2['quality_flag'] = data.variables['xco2_quality_flag'][:]# Datedf_xco2['DateTime'] = data.variables['sounding_id'][:]# Convert soundingID to datetime formatdf_xco2['DateTime'] = df_xco2['DateTime'].apply(conv_date)df_xco2['DateTime'] = pd.to_datetime(df_xco2['DateTime'])# YEAR and month columndf_xco2['Year'] = df_xco2['DateTime'].dt.yeardf_xco2['Month'] = df_xco2['DateTime'].dt.monthdf_xco2['Day'] = df_xco2['DateTime'].dt.day

为了缩小数据量,设置仅通过质量检验的数据可以被保留:

df_xco2 = df_xco2[df_xco2['quality_flag'] == 0]

为了方便对输出文件进行命名,再定义一个date变量:

date = str(data.variables['sounding_id'][0])

设置输出路径

    # create a CSV and store on new folder: csv_filesdf_xco2.to_csv(out_path + '\\' + 'oco2_xco2_' + date + '_.csv', index=False)

以上就是格式转换的主体方法,为了实现批量处理,再封装一个批量处理的函数,名为nc_to_tiff:

def nc_to_tiff(Input_folder, end_name='nc4'):Output_folder = os.path.split(Input_folder)[0] + 'out_' + os.path.split(Input_folder)[-1]data_list = glob.glob(Input_folder + os.sep + '*' + end_name)print('输入位置为', Input_folder)print('被读取的nc文件有', data_list)if os.path.exists(Output_folder):shutil.rmtree(Output_folder)os.makedirs(Output_folder)for i in range(len(data_list)):data = data_list[i]convHdf(path_file=data, out_path=Output_folder)print(data + 'finish')print(f'输入位置为{Input_folder}')print(f'输出位置为{Output_folder}')

调用函数,输入需要处理的nc4文件的路径,即可实现快速批量格式转换:

nc_to_tiff(Input_folder=r'E:/OCO-2', end_name='nc4')

csv格式转tiff

此时的.csv格式的文件已经可以直接在ArcGIS中处理了
在这里插入图片描述利用“点转栅格”工具可以将点要素网格化,像元大小可以随意指定,这里建议设置为0.02(单位为°),此时像元分辨率近似于2km,与数据点的间距近似,避免浪费数据信息。在这里插入图片描述
使用ArcGIS来栅格化,可以采用模型构建器来批量处理,也可以使用Arcpy进行批量处理。这里再介绍另一种基于GDAL命令行的栅格化方法。

import subprocess
import osif not os.path.exists('json_format'):os.makedirs('json_format')print('already')
else:print("Directory exists!")start_tabpy1 = subprocess.run('ogr2ogr -oo X_POSSIBLE_NAMES=Longitude -oo Y_POSSIBLE_NAMES=Latitude -a_srs "EPSG:4326" json_format/oco2_2022.json oco2_xco2_2022110100265935_.csv')
start_tabpy2 = subprocess.run('mkdir tif_format', shell=True)
start_tabpy3 = subprocess.run('gdal_rasterize -a Xco2 -a_nodata 0 -ts 999 999 json_format/oco2_2022.json tif_format/oco2_2022.tif')

由于代码是从jupyter中导出的,需要结合subprocess和shell来运行。-a_srs用来指定投影,-ts用来设置图像的大小,最大可设置长999和宽999,不同的图像大小占用的内存和粒度大小也不同,可以根据需求进行调整。

这篇关于OCO系列卫星数据批量转格式(netCDF转CSV、Tiff)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/400253

相关文章

Python将大量遥感数据的值缩放指定倍数的方法(推荐)

《Python将大量遥感数据的值缩放指定倍数的方法(推荐)》本文介绍基于Python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处理,并将所得处理后数据保存为新的遥感影像... 本文介绍基于python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处

使用MongoDB进行数据存储的操作流程

《使用MongoDB进行数据存储的操作流程》在现代应用开发中,数据存储是一个至关重要的部分,随着数据量的增大和复杂性的增加,传统的关系型数据库有时难以应对高并发和大数据量的处理需求,MongoDB作为... 目录什么是MongoDB?MongoDB的优势使用MongoDB进行数据存储1. 安装MongoDB

Python MySQL如何通过Binlog获取变更记录恢复数据

《PythonMySQL如何通过Binlog获取变更记录恢复数据》本文介绍了如何使用Python和pymysqlreplication库通过MySQL的二进制日志(Binlog)获取数据库的变更记录... 目录python mysql通过Binlog获取变更记录恢复数据1.安装pymysqlreplicat

Linux使用dd命令来复制和转换数据的操作方法

《Linux使用dd命令来复制和转换数据的操作方法》Linux中的dd命令是一个功能强大的数据复制和转换实用程序,它以较低级别运行,通常用于创建可启动的USB驱动器、克隆磁盘和生成随机数据等任务,本文... 目录简介功能和能力语法常用选项示例用法基础用法创建可启动www.chinasem.cn的 USB 驱动

IDEA如何将String类型转json格式

《IDEA如何将String类型转json格式》在Java中,字符串字面量中的转义字符会被自动转换,但通过网络获取的字符串可能不会自动转换,为了解决IDEA无法识别JSON字符串的问题,可以在本地对字... 目录问题描述问题原因解决方案总结问题描述最近做项目需要使用Ai生成json,可生成String类型

Oracle数据库使用 listagg去重删除重复数据的方法汇总

《Oracle数据库使用listagg去重删除重复数据的方法汇总》文章介绍了在Oracle数据库中使用LISTAGG和XMLAGG函数进行字符串聚合并去重的方法,包括去重聚合、使用XML解析和CLO... 目录案例表第一种:使用wm_concat() + distinct去重聚合第二种:使用listagg,

Python实现将实体类列表数据导出到Excel文件

《Python实现将实体类列表数据导出到Excel文件》在数据处理和报告生成中,将实体类的列表数据导出到Excel文件是一项常见任务,Python提供了多种库来实现这一目标,下面就来跟随小编一起学习一... 目录一、环境准备二、定义实体类三、创建实体类列表四、将实体类列表转换为DataFrame五、导出Da

Python实现数据清洗的18种方法

《Python实现数据清洗的18种方法》本文主要介绍了Python实现数据清洗的18种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学... 目录1. 去除字符串两边空格2. 转换数据类型3. 大小写转换4. 移除列表中的重复元素5. 快速统

Python数据处理之导入导出Excel数据方式

《Python数据处理之导入导出Excel数据方式》Python是Excel数据处理的绝佳工具,通过Pandas和Openpyxl等库可以实现数据的导入、导出和自动化处理,从基础的数据读取和清洗到复杂... 目录python导入导出Excel数据开启数据之旅:为什么Python是Excel数据处理的最佳拍档

使用Python处理CSV和Excel文件的操作方法

《使用Python处理CSV和Excel文件的操作方法》在数据分析、自动化和日常开发中,CSV和Excel文件是非常常见的数据存储格式,ython提供了强大的工具来读取、编辑和保存这两种文件,满足从基... 目录1. CSV 文件概述和处理方法1.1 CSV 文件格式的基本介绍1.2 使用 python 内