OCO系列卫星数据批量转格式(netCDF转CSV、Tiff)

2023-11-21 05:50

本文主要是介绍OCO系列卫星数据批量转格式(netCDF转CSV、Tiff),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

OCO系列卫星数据批量转格式实现在GIS软件中处理

从官网上下载得到的OCO卫星数据是以nc4后缀结尾的netCDF文件,在上一篇博客中已经介绍了利用Plotly库进行单幅图像可视化的方法,接下来为了方便在GIS软件里进一步处理,可以对nc格式的文件进行格式转换。

netCDF转CSV

使用的语言依然是Python,用到的库有以下:

import glob
import shutil
import pandas as pd
import os
import netCDF4 as nc
# converting the datetime format
from datetime import datetime

由于输入的日期和时间是字符串,要处理日期和时间,首先必须把str转换为datetime。转换方法是通过datetime.strptime()实现,需要一个日期和时间的格式化字符串:

def conv_date(d):return datetime.strptime(str(d), '%Y%m%d%H%M%S%f')

接下来封装一个名为convHdf的函数来将nc格式的文件转换为csv格式。

def convHdf(path_file, out_path, n=0):data = nc.Dataset(path_file)df_xco2 = pd.DataFrame()

这里构建了一个名为df_xco2的数据表,包含了Xco2、Latitude等八个列,其中每个列中的填充数据分别对应于netCDF4包读取到的原始文件中的变量(variables):

df_xco2['Xco2'] = data.variables['xco2'][:]df_xco2['Latitude'] = data.variables['latitude'][:]df_xco2['Longitude'] = data.variables['longitude'][:]df_xco2['quality_flag'] = data.variables['xco2_quality_flag'][:]# Datedf_xco2['DateTime'] = data.variables['sounding_id'][:]# Convert soundingID to datetime formatdf_xco2['DateTime'] = df_xco2['DateTime'].apply(conv_date)df_xco2['DateTime'] = pd.to_datetime(df_xco2['DateTime'])# YEAR and month columndf_xco2['Year'] = df_xco2['DateTime'].dt.yeardf_xco2['Month'] = df_xco2['DateTime'].dt.monthdf_xco2['Day'] = df_xco2['DateTime'].dt.day

为了缩小数据量,设置仅通过质量检验的数据可以被保留:

df_xco2 = df_xco2[df_xco2['quality_flag'] == 0]

为了方便对输出文件进行命名,再定义一个date变量:

date = str(data.variables['sounding_id'][0])

设置输出路径

    # create a CSV and store on new folder: csv_filesdf_xco2.to_csv(out_path + '\\' + 'oco2_xco2_' + date + '_.csv', index=False)

以上就是格式转换的主体方法,为了实现批量处理,再封装一个批量处理的函数,名为nc_to_tiff:

def nc_to_tiff(Input_folder, end_name='nc4'):Output_folder = os.path.split(Input_folder)[0] + 'out_' + os.path.split(Input_folder)[-1]data_list = glob.glob(Input_folder + os.sep + '*' + end_name)print('输入位置为', Input_folder)print('被读取的nc文件有', data_list)if os.path.exists(Output_folder):shutil.rmtree(Output_folder)os.makedirs(Output_folder)for i in range(len(data_list)):data = data_list[i]convHdf(path_file=data, out_path=Output_folder)print(data + 'finish')print(f'输入位置为{Input_folder}')print(f'输出位置为{Output_folder}')

调用函数,输入需要处理的nc4文件的路径,即可实现快速批量格式转换:

nc_to_tiff(Input_folder=r'E:/OCO-2', end_name='nc4')

csv格式转tiff

此时的.csv格式的文件已经可以直接在ArcGIS中处理了
在这里插入图片描述利用“点转栅格”工具可以将点要素网格化,像元大小可以随意指定,这里建议设置为0.02(单位为°),此时像元分辨率近似于2km,与数据点的间距近似,避免浪费数据信息。在这里插入图片描述
使用ArcGIS来栅格化,可以采用模型构建器来批量处理,也可以使用Arcpy进行批量处理。这里再介绍另一种基于GDAL命令行的栅格化方法。

import subprocess
import osif not os.path.exists('json_format'):os.makedirs('json_format')print('already')
else:print("Directory exists!")start_tabpy1 = subprocess.run('ogr2ogr -oo X_POSSIBLE_NAMES=Longitude -oo Y_POSSIBLE_NAMES=Latitude -a_srs "EPSG:4326" json_format/oco2_2022.json oco2_xco2_2022110100265935_.csv')
start_tabpy2 = subprocess.run('mkdir tif_format', shell=True)
start_tabpy3 = subprocess.run('gdal_rasterize -a Xco2 -a_nodata 0 -ts 999 999 json_format/oco2_2022.json tif_format/oco2_2022.tif')

由于代码是从jupyter中导出的,需要结合subprocess和shell来运行。-a_srs用来指定投影,-ts用来设置图像的大小,最大可设置长999和宽999,不同的图像大小占用的内存和粒度大小也不同,可以根据需求进行调整。

这篇关于OCO系列卫星数据批量转格式(netCDF转CSV、Tiff)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/400253

相关文章

Rust中的BoxT之堆上的数据与递归类型详解

《Rust中的BoxT之堆上的数据与递归类型详解》本文介绍了Rust中的BoxT类型,包括其在堆与栈之间的内存分配,性能优势,以及如何利用BoxT来实现递归类型和处理大小未知类型,通过BoxT,Rus... 目录1. Box<T> 的基础知识1.1 堆与栈的分工1.2 性能优势2.1 递归类型的问题2.2

Python使用Pandas对比两列数据取最大值的五种方法

《Python使用Pandas对比两列数据取最大值的五种方法》本文主要介绍使用Pandas对比两列数据取最大值的五种方法,包括使用max方法、apply方法结合lambda函数、函数、clip方法、w... 目录引言一、使用max方法二、使用apply方法结合lambda函数三、使用np.maximum函数

Redis的数据过期策略和数据淘汰策略

《Redis的数据过期策略和数据淘汰策略》本文主要介绍了Redis的数据过期策略和数据淘汰策略,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 目录一、数据过期策略1、惰性删除2、定期删除二、数据淘汰策略1、数据淘汰策略概念2、8种数据淘汰策略

轻松上手MYSQL之JSON函数实现高效数据查询与操作

《轻松上手MYSQL之JSON函数实现高效数据查询与操作》:本文主要介绍轻松上手MYSQL之JSON函数实现高效数据查询与操作的相关资料,MySQL提供了多个JSON函数,用于处理和查询JSON数... 目录一、jsON_EXTRACT 提取指定数据二、JSON_UNQUOTE 取消双引号三、JSON_KE

使用C++将处理后的信号保存为PNG和TIFF格式

《使用C++将处理后的信号保存为PNG和TIFF格式》在信号处理领域,我们常常需要将处理结果以图像的形式保存下来,方便后续分析和展示,C++提供了多种库来处理图像数据,本文将介绍如何使用stb_ima... 目录1. PNG格式保存使用stb_imagephp_write库1.1 安装和包含库1.2 代码解

Python给Excel写入数据的四种方法小结

《Python给Excel写入数据的四种方法小结》本文主要介绍了Python给Excel写入数据的四种方法小结,包含openpyxl库、xlsxwriter库、pandas库和win32com库,具有... 目录1. 使用 openpyxl 库2. 使用 xlsxwriter 库3. 使用 pandas 库

SpringBoot定制JSON响应数据的实现

《SpringBoot定制JSON响应数据的实现》本文主要介绍了SpringBoot定制JSON响应数据的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们... 目录前言一、如何使用@jsonView这个注解?二、应用场景三、实战案例注解方式编程方式总结 前言

使用Python实现批量分割PDF文件

《使用Python实现批量分割PDF文件》这篇文章主要为大家详细介绍了如何使用Python进行批量分割PDF文件功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一、架构设计二、代码实现三、批量分割PDF文件四、总结本文将介绍如何使用python进js行批量分割PDF文件的方法

使用Python在Excel中创建和取消数据分组

《使用Python在Excel中创建和取消数据分组》Excel中的分组是一种通过添加层级结构将相邻行或列组织在一起的功能,当分组完成后,用户可以通过折叠或展开数据组来简化数据视图,这篇博客将介绍如何使... 目录引言使用工具python在Excel中创建行和列分组Python在Excel中创建嵌套分组Pyt

在Rust中要用Struct和Enum组织数据的原因解析

《在Rust中要用Struct和Enum组织数据的原因解析》在Rust中,Struct和Enum是组织数据的核心工具,Struct用于将相关字段封装为单一实体,便于管理和扩展,Enum用于明确定义所有... 目录为什么在Rust中要用Struct和Enum组织数据?一、使用struct组织数据:将相关字段绑