laravel 大数据分块导出,避免内存溢出

2024-08-20 16:52

本文主要是介绍laravel 大数据分块导出,避免内存溢出,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

laravel 大数据分块导出,避免内存溢出

数据来源:服务层(userService.php)

控制器:UserController

    public function lists(Request $request){$this->service = new UserService();$params = $request->all();$result = $this->service->lists($params);//功能:分页查询数据if(!empty($params['is_down'])) {return Excel::download(new SignContractExport($this->service, $params, 100), '合约.xlsx');}return  $this->successJson($result, "操作成功");}

导出类:SignContractExport

<?phpnamespace App\Exports;use Maatwebsite\Excel\Concerns\FromCollection;
use Maatwebsite\Excel\Concerns\WithHeadings;
use Maatwebsite\Excel\Concerns\ShouldAutoSize;
use Maatwebsite\Excel\Concerns\WithColumnWidths;
use Maatwebsite\Excel\Concerns\WithStyles;
use Modules\Admin\Services\UserService;
use Maatwebsite\Excel\Concerns\WithTitle;class SignContractExport implements FromCollection,WithHeadings,ShouldAutoSize,WithStyles,WithTitle,WithColumnWidths
{protected $batchSize = 100;public $params = [];private array $header = ['ID','姓名'];public $status;protected $service;protected $chunkSize;/*** 导出*/public function __construct(UserService $service, $params,$chunkSize = 1000){$this->status = $params['status'];$this->myHeader($params['status']);$this->service = $service;//业务对象,里面 提供分页查询的方法$this->params = $params;$this->chunkSize = $chunkSize;}public function map($row): array{$itemMap['id'] = $row->id;$itemMap['mobile'] = $row->user_mobile;}public function title():string{return '合约导出';}public function headings($add = []): array{return $this->header;}public function collection(){$data = collect();// 使用 getDataChunked 方法$this->service->getDataChunked($this->params, $this->chunkSize, function ($chunk) use ($data) {foreach ($chunk as $row) {$data->push($this->map($row));}});return $data;}
}

业务层:UserService

    /*** 大数据导出防止内存溢出做分块儿查询*/public function getDataChunked($params, $chunkSize, callable $callback){$totalFetched = 0;// 通过 chunk 的方式来处理数据,每次处理 $chunkSize 条数据do {$params['page'] = $totalFetched / $chunkSize + 1;$params['page_size'] = $chunkSize;// 获取数据(这里重用 lists 方法)$result = $this->lists($params);if (!empty($result['list'])) {//list:列表数据// 回调函数处理每块数据$callback($result['list']);$totalFetched += count($result['list']);} else {break; // 如果没有数据,跳出循环}} while ($totalFetched < $result['total']);//total:总条数}public function lists($params) {$list = User::query()->->paginate($params['page_size']??10,$columns = ['*'], $pageName = 'page', $params['page']??null);return ['page' => $list->currentPage(),'page_size' => $list->perPage(),'total' => $list->total(),'list' => $data,];}

分析与实现
在 Laravel 中处理大数据导出时,直接加载所有数据到内存中可能导致内存溢出问题。为了避免这种情况,你的实现使用了“分块查询”(chunking)的方法,通过分块处理数据,逐块加载和导出,从而有效地管理内存使用。以下是对你的实现如何避免内存溢出的详细分析:

  1. 数据分块的基本思路
    分块查询:通过 getDataChunked 方法,将大数据集分成若干小块(每块 chunkSize 条数据)。每次查询只处理一块数据,处理完后立即释放内存,再进行下一块的处理。这种方式确保了内存中只保留当前处理的那一小部分数据,避免一次性加载所有数据而导致内存溢出。

回调函数的使用:通过传递一个回调函数 callback 来处理每一块查询到的数据块。这样,你可以在导出 Excel 的过程中,逐块地将数据添加到 Excel 文件中,而不是一次性加载所有数据。

  1. 具体的实现步骤
    Step 1: 获取数据总量并初始化分页
    首先,在 getDataChunked 方法中通过 lists 方法获取数据的总数 total。
    通过初始化的 params[‘page’] 和 params[‘page_size’] 来定义分页的大小和当前页数。
    Step 2: 分块查询和处理
    使用 do…while 循环进行数据的分块查询。每次循环中,根据当前已获取的数据量计算出当前页数,然后查询这一页的数据。
    每次查询到的数据块(如 1000 条)通过 callback 回调函数立即处理(在本例中,导出到 Excel 文件中)。
    处理完一块数据后,循环检查是否还需要继续查询更多数据,直到所有数据都被处理完。
    Step 3: 内存释放
    每次处理完一块数据后,相关的内存就可以被释放,只有当前正在处理的数据块会驻留在内存中。这是通过在回调函数中逐块导出数据而实现的。这意味着即使是非常大的数据集,也能被逐块处理,而不会导致内存溢出。
  2. Excel 导出流程
    在 SignContractExport 类中:

collection() 方法利用 getDataChunked 方法分块查询数据。
每获取一块数据(通过 map() 方法处理格式化后),立即 push 到 data 集合中,直到所有块的数据都被处理完。
最终的 Excel 导出:

在 UserController 中,当 is_down 参数为 true 时,调用 Excel::download,传入 SignContractExport 对象和相关参数。
Laravel Excel 包会利用 collection() 返回的分块数据生成 Excel 文件并下载,过程中每一块数据都是在内存中处理完成后再处理下一块,避免一次性加载所有数据导致内存溢出。
4. 内存优化效果
通过这种分块处理,大数据导出的内存占用相对于一次性加载所有数据来说大大减少。每次只需要处理一块数据,内存中只会驻留当前块的数据,而不需要一次性加载整个数据集。

这种实现方式特别适合在数据量特别大的情况下使用,如数百万行的数据导出。分块查询和处理的方式使得导出过程既高效又能避免内存耗尽的问题。

这篇关于laravel 大数据分块导出,避免内存溢出的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1090637

相关文章

MySQL 删除数据详解(最新整理)

《MySQL删除数据详解(最新整理)》:本文主要介绍MySQL删除数据的相关知识,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录一、前言二、mysql 中的三种删除方式1.DELETE语句✅ 基本语法: 示例:2.TRUNCATE语句✅ 基本语

怎样通过分析GC日志来定位Java进程的内存问题

《怎样通过分析GC日志来定位Java进程的内存问题》:本文主要介绍怎样通过分析GC日志来定位Java进程的内存问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、GC 日志基础配置1. 启用详细 GC 日志2. 不同收集器的日志格式二、关键指标与分析维度1.

Java内存分配与JVM参数详解(推荐)

《Java内存分配与JVM参数详解(推荐)》本文详解JVM内存结构与参数调整,涵盖堆分代、元空间、GC选择及优化策略,帮助开发者提升性能、避免内存泄漏,本文给大家介绍Java内存分配与JVM参数详解,... 目录引言JVM内存结构JVM参数概述堆内存分配年轻代与老年代调整堆内存大小调整年轻代与老年代比例元空

MyBatisPlus如何优化千万级数据的CRUD

《MyBatisPlus如何优化千万级数据的CRUD》最近负责的一个项目,数据库表量级破千万,每次执行CRUD都像走钢丝,稍有不慎就引起数据库报警,本文就结合这个项目的实战经验,聊聊MyBatisPl... 目录背景一、MyBATis Plus 简介二、千万级数据的挑战三、优化 CRUD 的关键策略1. 查

python实现对数据公钥加密与私钥解密

《python实现对数据公钥加密与私钥解密》这篇文章主要为大家详细介绍了如何使用python实现对数据公钥加密与私钥解密,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录公钥私钥的生成使用公钥加密使用私钥解密公钥私钥的生成这一部分,使用python生成公钥与私钥,然后保存在两个文

mysql中的数据目录用法及说明

《mysql中的数据目录用法及说明》:本文主要介绍mysql中的数据目录用法及说明,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、背景2、版本3、数据目录4、总结1、背景安装mysql之后,在安装目录下会有一个data目录,我们创建的数据库、创建的表、插入的

Navicat数据表的数据添加,删除及使用sql完成数据的添加过程

《Navicat数据表的数据添加,删除及使用sql完成数据的添加过程》:本文主要介绍Navicat数据表的数据添加,删除及使用sql完成数据的添加过程,具有很好的参考价值,希望对大家有所帮助,如有... 目录Navicat数据表数据添加,删除及使用sql完成数据添加选中操作的表则出现如下界面,查看左下角从左

SpringBoot中4种数据水平分片策略

《SpringBoot中4种数据水平分片策略》数据水平分片作为一种水平扩展策略,通过将数据分散到多个物理节点上,有效解决了存储容量和性能瓶颈问题,下面小编就来和大家分享4种数据分片策略吧... 目录一、前言二、哈希分片2.1 原理2.2 SpringBoot实现2.3 优缺点分析2.4 适用场景三、范围分片

Redis分片集群、数据读写规则问题小结

《Redis分片集群、数据读写规则问题小结》本文介绍了Redis分片集群的原理,通过数据分片和哈希槽机制解决单机内存限制与写瓶颈问题,实现分布式存储和高并发处理,但存在通信开销大、维护复杂及对事务支持... 目录一、分片集群解android决的问题二、分片集群图解 分片集群特征如何解决的上述问题?(与哨兵模

浅析如何保证MySQL与Redis数据一致性

《浅析如何保证MySQL与Redis数据一致性》在互联网应用中,MySQL作为持久化存储引擎,Redis作为高性能缓存层,两者的组合能有效提升系统性能,下面我们来看看如何保证两者的数据一致性吧... 目录一、数据不一致性的根源1.1 典型不一致场景1.2 关键矛盾点二、一致性保障策略2.1 基础策略:更新数