MIT 更新最大自然灾害图像数据集,囊括 19 种灾害事件

2024-04-13 21:58

本文主要是介绍MIT 更新最大自然灾害图像数据集,囊括 19 种灾害事件,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

来源:HyperAI超神经

本文约2600字,建议阅读9分钟

本文为你分享迄今为止规模最大、质量最高的自然灾害卫星图像数据集。

标签:自然灾害 数据集

[ 摘要 ]麻省理工学院在最近 ECCV 2020 上提交的一篇论文中,发布了一套自然灾害图像数据集。这是迄今为止规模最大、质量最高的自然灾害卫星图像数据集。

2020 年,多灾多难的一年。年初爆发的疫情,夏天南方的洪灾,近期美国加州的野火……

洪灾、山火、地震之类的自然灾害,总是威胁着人们的生命财产安全。而在无法避免其发生的情况下,如果能够及时、迅速地发现一些细微的变化,就能更好地制定相应救援方案,更合理地进行资源配置,同时也有助于进行相关新闻的报道。

因此,麻省理工学院的工程学硕士生 Ethan Weber 和合作者 Hassan Kan,在最新论文《Building Disaster Damage Assessment in Satellite Imagery with Multi-Temporal Fusion》(《具有多时相融合的卫星影像中的建筑物灾害破坏评估》)中提出了一个深度学习模型,能够对受损区域的卫星图像进行更快、更精准的评估,从而为急救人员争取更多的时间、最大程度地减少损失。

该论文在近期 CV 顶会 ECCV 2020 上发表

论文地址:https://arxiv.org/pdf/2004.05525.pdf

与此同时,他们还发布了一个最新的用于损坏评估的卫星图像数据集,让图像事件检测的相关研究更进一步,研究人员能实现更精确的定位和量化损失。

用 AI 与时间赛跑:加速灾情评估

对于自然灾害,现场应急小组减少反应时间,迅速响应、采取行动,对于减少损失和挽救生命至关重要。此外,为了更好地在受灾地区部署资源,应急人员必须了解损失的确切位置和严重性,这些同样重要。

目前,应急人员通常通过人力观察卫星图像的方法,来评估灾害损坏程度,但评估过程可能要花费数小时之久,这对于抢救工作极为不利。

人员观察分析卫星图像耗时耗力

是目前自然灾害评估工作中的一个瓶颈

Ethan Weber 的这项研究贡献在于,创建自动分析图像的工具,减少图像分析时间,赢得与时间的赛跑。

另外,其研究通过共享权值的 CNN(卷积神经网络),独立地提供灾前和灾后图像,可以获得更好的性能。

他们还提出了一种新的计算机视觉模型,该模型能够检测在 Twitter 和 Flickr 等社交媒体平台上发布的图片中的事件。

论文中提出的建筑损坏预测、评估模型架构

标记 19 种自然灾害的 22068 张图像

除了提出新模型外,该研究团队还重磅发布了一个新的事件数据集:xBD 数据集。

该数据集包含 22068 张图像,标记有 19 种不同的事件,包括地震,洪水,野火、火山爆发和车祸等。这些图像包括了灾前、灾后图像,图像可用于构建定位和损伤评估这两项任务。

飓风灾前图像(左图)与灾后图像(右图)

据介绍,xBD 数据集是迄今为止第一个建筑破坏评估数据集,是带注释的高分辨率卫星图像中规模最大、质量最高的公共数据集之一。其基本信息如下:

xBD Dataset

发布机构:MIT

包含数量:22068 张图像

数据格式:png

数据大小:31.2GB

更新时间:2020 年 8 月

下载地址:https://hyper.ai/datasets/13272

这些图像分辨率为 1024×1024,其中每个建筑物都有标识符,并在灾前灾后图片中保持一致。

但研究者发现建筑物的分辨率往往太小,模型无法准确绘制建筑物边界。为此,他们在 4 张 512×512 的图像上训练和运行模型,形成左上角、右上角、左下角和右下角象限。

根据这些灾前和灾后数据,损伤评估可以被定义为单时间和多时间任务。在单时间设置中,只有灾后图像被输入模型,该模型必须预测每个像素的损伤水平。在多时间背景下,灾前灾后图像都被输入到模型中,该模型必须在后图像上预测损伤程度。

团队综合多方资料,制定的损坏评估量表

数据集从何而来?

团队表示,这套新数据集旨在填补该领域的空白。现有数据集的图像数量和事件类别的多样性都受到限制。

作者还解释了如何创建数据集、如何创建模型以检测图像中的事件,以及如何过滤嘈杂的社交媒体数据中的事件。

他们的其中一项工作是,过滤了 4000 万张 Flickr 图片,来寻找灾害事件。另外一些工作则是可对地震,洪水和其他自然灾害期间,发布在 Twitter 上的图像进行过滤。

比如,该团队将与自然灾害相关的推文过滤为特定事件,并通过将推文频率与美国国家海洋和大气管理局(NOAA)提供的数据库相关联,来验证这一过程。

Ethan Weber 说:“我对这个数据集能够进行进一步的研究以检测图像中的事件感到兴奋,它也非常有效地激发了人们对计算机视觉界的兴趣。”

他还表示,社交媒体和卫星图像都是有助于应急响应的数据形式。社交媒体提供实地观察,而卫星图像提供宏观的观察(expansive insights),例如确定哪些地区受野火影响最大。

每逢灾害发生,网友通常会在社交媒体上发布实地拍摄照片

正是意识到这种相互联系,Ethan Weber 和他的校友合作,在损害评估方面做出了卓越的成绩。

Ethan Weber 说:“现在我们有了数据,对定位和量化破坏很感兴趣。我们正在与应急组织合作,以保持专注并开展具有现实利益的研究。”

访问 https://hyper.ai/datasets/13127 或点击原文阅读,即可高速下载该数据集。

编辑:黄继彦

这篇关于MIT 更新最大自然灾害图像数据集,囊括 19 种灾害事件的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/901329

相关文章

Java利用JSONPath操作JSON数据的技术指南

《Java利用JSONPath操作JSON数据的技术指南》JSONPath是一种强大的工具,用于查询和操作JSON数据,类似于SQL的语法,它为处理复杂的JSON数据结构提供了简单且高效... 目录1、简述2、什么是 jsONPath?3、Java 示例3.1 基本查询3.2 过滤查询3.3 递归搜索3.4

MySQL大表数据的分区与分库分表的实现

《MySQL大表数据的分区与分库分表的实现》数据库的分区和分库分表是两种常用的技术方案,本文主要介绍了MySQL大表数据的分区与分库分表的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有... 目录1. mysql大表数据的分区1.1 什么是分区?1.2 分区的类型1.3 分区的优点1.4 分

Mysql删除几亿条数据表中的部分数据的方法实现

《Mysql删除几亿条数据表中的部分数据的方法实现》在MySQL中删除一个大表中的数据时,需要特别注意操作的性能和对系统的影响,本文主要介绍了Mysql删除几亿条数据表中的部分数据的方法实现,具有一定... 目录1、需求2、方案1. 使用 DELETE 语句分批删除2. 使用 INPLACE ALTER T

Python Dash框架在数据可视化仪表板中的应用与实践记录

《PythonDash框架在数据可视化仪表板中的应用与实践记录》Python的PlotlyDash库提供了一种简便且强大的方式来构建和展示互动式数据仪表板,本篇文章将深入探讨如何使用Dash设计一... 目录python Dash框架在数据可视化仪表板中的应用与实践1. 什么是Plotly Dash?1.1

MySQL新增字段后Java实体未更新的潜在问题与解决方案

《MySQL新增字段后Java实体未更新的潜在问题与解决方案》在Java+MySQL的开发中,我们通常使用ORM框架来映射数据库表与Java对象,但有时候,数据库表结构变更(如新增字段)后,开发人员可... 目录引言1. 问题背景:数据库与 Java 实体不同步1.1 常见场景1.2 示例代码2. 不同操作

Redis 中的热点键和数据倾斜示例详解

《Redis中的热点键和数据倾斜示例详解》热点键是指在Redis中被频繁访问的特定键,这些键由于其高访问频率,可能导致Redis服务器的性能问题,尤其是在高并发场景下,本文给大家介绍Redis中的热... 目录Redis 中的热点键和数据倾斜热点键(Hot Key)定义特点应对策略示例数据倾斜(Data S

Python实现将MySQL中所有表的数据都导出为CSV文件并压缩

《Python实现将MySQL中所有表的数据都导出为CSV文件并压缩》这篇文章主要为大家详细介绍了如何使用Python将MySQL数据库中所有表的数据都导出为CSV文件到一个目录,并压缩为zip文件到... python将mysql数据库中所有表的数据都导出为CSV文件到一个目录,并压缩为zip文件到另一个

SpringBoot整合jasypt实现重要数据加密

《SpringBoot整合jasypt实现重要数据加密》Jasypt是一个专注于简化Java加密操作的开源工具,:本文主要介绍详细介绍了如何使用jasypt实现重要数据加密,感兴趣的小伙伴可... 目录jasypt简介 jasypt的优点SpringBoot使用jasypt创建mapper接口配置文件加密

使用Python高效获取网络数据的操作指南

《使用Python高效获取网络数据的操作指南》网络爬虫是一种自动化程序,用于访问和提取网站上的数据,Python是进行网络爬虫开发的理想语言,拥有丰富的库和工具,使得编写和维护爬虫变得简单高效,本文将... 目录网络爬虫的基本概念常用库介绍安装库Requests和BeautifulSoup爬虫开发发送请求解

Oracle存储过程里操作BLOB的字节数据的办法

《Oracle存储过程里操作BLOB的字节数据的办法》该篇文章介绍了如何在Oracle存储过程中操作BLOB的字节数据,作者研究了如何获取BLOB的字节长度、如何使用DBMS_LOB包进行BLOB操作... 目录一、缘由二、办法2.1 基本操作2.2 DBMS_LOB包2.3 字节级操作与RAW数据类型2.