python实现将图片数据以LMDB方式存储

2023-10-29 09:44

本文主要是介绍python实现将图片数据以LMDB方式存储,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

以LMDB(Lightning Memory-Mapped Database)方式存储的优点

  1. 高效性:LMDB是一种内存映射数据库,可以在内存和磁盘之间实现高效的数据访问。它利用操作系统的虚拟内存机制,将数据文件映射到内存中,从而避免了频繁的磁盘IO操作,提高了数据的读取和写入效率

  2. 低内存占用:LMDB使用了页面缓存和写时复制(Copy-on-Write)的技术,可以在内存中保持数据的快速访问同时占用较少的内存空间。这对于处理大规模数据集或内存有限的环境非常有用

  3. 并发支持:LMDB支持多线程或多进程的并发读取和写入操作,可以在高并发的数据访问场景下保持数据的一致性和可靠性

  4. 数据压缩:LMDB支持数据的压缩,可以减小数据文件的大小,节省存储空间

  5. 跨平台兼容:LMDB是一个跨平台的数据库,可以在不同的操作系统上使用,并提供了多种编程语言的接口,如C、Python等

代码示例

将目标分类的数据存储成“.lmdb”文件,

import pickle, lmdb
from tqdm import tqdmimg_paths = []
images, labels = [], []
for img_path in img_paths:images.append(img_path)labels.append(1)  ## 假设数据的label为1combined = list(zip(images, labels))
random.shuffle(combined)
images, labels = zip(*combined)
images = list(images)
labels = list(labels)def create_lmdb(images, labels, lmdb_path):assert len(images) == len(labels), "All lists must have the same length"db = lmdb.open(lmdb_path, map_size=int(1e12))with db.begin(write=True) as txn:bar = tqdm(images)for i, img_path in enumerate(bar):with open(img_path, 'rb') as f:img_data = f.read()meta_data = {'label': labels[i], 'size': len(img_data)}data = pickle.dumps((meta_data, img_data))txn.put(str(i).encode('utf-8'), data)txn.put('length'.encode('utf-8'), str(len(img_paths)).encode('utf-8'))print(f"Created LMDB dataset at {lmdb_path} with {len(img_paths)} images")create_lmdb(images=images, labels=labels, lmdb_path="xxx.lmdb")

这篇关于python实现将图片数据以LMDB方式存储的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/299822

相关文章

使用Java解析JSON数据并提取特定字段的实现步骤(以提取mailNo为例)

《使用Java解析JSON数据并提取特定字段的实现步骤(以提取mailNo为例)》在现代软件开发中,处理JSON数据是一项非常常见的任务,无论是从API接口获取数据,还是将数据存储为JSON格式,解析... 目录1. 背景介绍1.1 jsON简介1.2 实际案例2. 准备工作2.1 环境搭建2.1.1 添加

MySQL中删除重复数据SQL的三种写法

《MySQL中删除重复数据SQL的三种写法》:本文主要介绍MySQL中删除重复数据SQL的三种写法,文中通过代码示例讲解的非常详细,对大家的学习或工作有一定的帮助,需要的朋友可以参考下... 目录方法一:使用 left join + 子查询删除重复数据(推荐)方法二:创建临时表(需分多步执行,逻辑清晰,但会

Java实现任务管理器性能网络监控数据的方法详解

《Java实现任务管理器性能网络监控数据的方法详解》在现代操作系统中,任务管理器是一个非常重要的工具,用于监控和管理计算机的运行状态,包括CPU使用率、内存占用等,对于开发者和系统管理员来说,了解这些... 目录引言一、背景知识二、准备工作1. Maven依赖2. Gradle依赖三、代码实现四、代码详解五

java如何分布式锁实现和选型

《java如何分布式锁实现和选型》文章介绍了分布式锁的重要性以及在分布式系统中常见的问题和需求,它详细阐述了如何使用分布式锁来确保数据的一致性和系统的高可用性,文章还提供了基于数据库、Redis和Zo... 目录引言:分布式锁的重要性与分布式系统中的常见问题和需求分布式锁的重要性分布式系统中常见的问题和需求

SpringBoot基于MyBatis-Plus实现Lambda Query查询的示例代码

《SpringBoot基于MyBatis-Plus实现LambdaQuery查询的示例代码》MyBatis-Plus是MyBatis的增强工具,简化了数据库操作,并提高了开发效率,它提供了多种查询方... 目录引言基础环境配置依赖配置(Maven)application.yml 配置表结构设计demo_st

使用Python绘制蛇年春节祝福艺术图

《使用Python绘制蛇年春节祝福艺术图》:本文主要介绍如何使用Python的Matplotlib库绘制一幅富有创意的“蛇年有福”艺术图,这幅图结合了数字,蛇形,花朵等装饰,需要的可以参考下... 目录1. 绘图的基本概念2. 准备工作3. 实现代码解析3.1 设置绘图画布3.2 绘制数字“2025”3.3

详谈redis跟数据库的数据同步问题

《详谈redis跟数据库的数据同步问题》文章讨论了在Redis和数据库数据一致性问题上的解决方案,主要比较了先更新Redis缓存再更新数据库和先更新数据库再更新Redis缓存两种方案,文章指出,删除R... 目录一、Redis 数据库数据一致性的解决方案1.1、更新Redis缓存、删除Redis缓存的区别二

Jsoncpp的安装与使用方式

《Jsoncpp的安装与使用方式》JsonCpp是一个用于解析和生成JSON数据的C++库,它支持解析JSON文件或字符串到C++对象,以及将C++对象序列化回JSON格式,安装JsonCpp可以通过... 目录安装jsoncppJsoncpp的使用Value类构造函数检测保存的数据类型提取数据对json数

Redis事务与数据持久化方式

《Redis事务与数据持久化方式》该文档主要介绍了Redis事务和持久化机制,事务通过将多个命令打包执行,而持久化则通过快照(RDB)和追加式文件(AOF)两种方式将内存数据保存到磁盘,以防止数据丢失... 目录一、Redis 事务1.1 事务本质1.2 数据库事务与redis事务1.2.1 数据库事务1.

python使用watchdog实现文件资源监控

《python使用watchdog实现文件资源监控》watchdog支持跨平台文件资源监控,可以检测指定文件夹下文件及文件夹变动,下面我们来看看Python如何使用watchdog实现文件资源监控吧... python文件监控库watchdogs简介随着Python在各种应用领域中的广泛使用,其生态环境也