用php导入10W条+ 级别的csv大文件数据到mysql。导出10W+级别数据到csv文件

2024-02-14 01:32

本文主要是介绍用php导入10W条+ 级别的csv大文件数据到mysql。导出10W+级别数据到csv文件,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!


导入10W+的csv数据到mysql


[php] view plain copy
  1. $handle=fopen("1.csv","r");  
  2.       
  3. //将文件一次性全部读出来  
  4. $excelData = array();  
  5. $content = trim(file_get_contents($fileName));  
  6. $excelData = explode("\n",$content);  

或者直接用$excelData = file($file);   file() 函数直接将数据读出并放入数组当中。

我们先将所有的文件一次性读出来。放到一个数组$excelData 中。这个时候,我们就可以不用管这个csv 文件了,纯粹了php 操作数组了。所以。不会崩溃异常:

[php] view plain copy
  1. $chunkData = array_chunk($excelData , 5000); // 将这个10W+ 的数组分割成5000一个的小数组。这样就一次批量插入5000条数据。mysql 是支持的。  
  2.         $count = count($chunkData);  
  3.         for ($i = 0; $i < $count$i++) {  
  4.             $insertRows = array();  
  5.             foreach($chunkData[$ias $value){  
  6.                 $string = mb_convert_encoding(trim(strip_tags($value)), 'utf-8''gbk');//转码  
  7.                 $v = explode(',', trim($string));  
  8.                 $row = array();  
  9.                 $row['cdate']    = empty($v[0]) ? date('Y-m-d') : date('Y-m-d',strtotime($v[0]));  
  10.                 $row['business'] = $v[1];  
  11.                 $row['project']  = $v[2];  
  12.                 $row['shopname'] = $v[3];  
  13.                 $row['shopid']   = $v[4];  
  14.                 $row['fanli']    = formatNumber($v[5]);  
  15.                 $row['fb']   = $v[6] * 100;  
  16.                 $row['jifen']    = $v[7];  
  17.                 $sqlString       = '('."'".implode( "','"$row ) . "'".')'//批量  
  18.                 $insertRows[]    = $sqlString;  
  19.             }  
  20.             $result = $model->addDetail($insertRows); //批量将sql插入数据库。  
  21.         }  


插入数据库当然是批量插入了:

[php] view plain copy
  1. public function addDetail($rows){  
  2.         if(empty($rows)){  
  3.             return false;  
  4.         }  
  5.         //数据量较大,采取批量插入  
  6.         $data = implode(','$rows);  
  7.         $sql = "INSERT IGNORE INTO tb_account_detail(cdate,business,project,shopname,shopid,fanli,fb,jifen)  
  8.                  VALUES {$data}";  
  9.         $result = $this->query($sql);  
  10.         return true;  
  11.     }  



ok ! 亲测试。10W 数据。6个字段。插入需要10秒。

导出10W+的数据到csv

放弃之前写的一篇博客中用到的方法: http://blog.csdn.net/think2me/article/details/8596833 。原因是:当超过50W+ 以上的数据时,有可能浏览器崩溃,内存超。

这个方法是写文件的方式。然后再把文件弹出下载。

[php] view plain copy
  1. public function dump2Excel() {  
  2.   
  3.     set_time_limit(0);  
  4.     ini_set('memory_limit''640M');  
  5.     //获取列表  
  6.     $name = $this->getActionName();  
  7.     $model = D(GROUP_NAME . '.' . $name);  
  8.     $map = $this->_search();  
  9.     //文件名  
  10.     if (isset($_GET['error']) && $_GET['error'] > 0) {  
  11.         $filename = C('IMG_PATH').'account_data_error_' . $map['action_id'] . '_' . date('Y-m-d'mktime()) . '.csv';  
  12.     }else{  
  13.         $filename = C('IMG_PATH').'account_data_all_' . $map['action_id'] . '_' . date('Y-m-d'mktime()) . '.csv';  
  14.     }  
  15.   
  16.     //用户信息,商家ID,联盟,商家订单号,商品分类,确认类别,下单时间,完成时间,  
  17.     //实际支付金额,佣金,佣金补贴,返利,F币,论坛积分,备注,强制入库  
  18.     // 'user_info', 'shopid', 'league', 'order_id', 'classify', 'confirm_type',  
  19.     //'buydate', 'paydate', 'real_pay', 'commission', 'commission_plus',  
  20.     // 'fanli', 'jifen', 'bbs', 'remarks', 'persist_execute', 'unique_sign','error_code'  
  21.     $header[] =  iconv("utf-8""gb2312""用户信息");  
  22.     $header[] = iconv("utf-8""gb2312""商家ID");  
  23.     $header[] = iconv("utf-8""gb2312""联盟");  
  24.     $header[] = iconv("utf-8""gb2312""商家订单号");  
  25.     $header[] = iconv("utf-8""gb2312""商品分类");  
  26.     $header[] = iconv("utf-8""gb2312""确认类别");  
  27.     $header[] = iconv("utf-8""gb2312""下单时间");  
  28.     $header[] = iconv("utf-8""gb2312""完成时间");  
  29.     $header[] = iconv("utf-8""gb2312""实际支付金额");  
  30.     $header[] = iconv("utf-8""gb2312""佣金");  
  31.     $header[] = iconv("utf-8""gb2312""佣金补贴");  
  32.     $header[] = iconv("utf-8""gb2312""返利");  
  33.     $header[] = iconv("utf-8""gb2312""F币");  
  34.     $header[] = iconv("utf-8""gb2312""论坛积分");  
  35.     $header[] = iconv("utf-8""gb2312""备注");  
  36.     $header[] = iconv("utf-8""gb2312""强制入库");  
  37.     $header[] = iconv("utf-8""gb2312""唯一标识");  
  38.     $header[] = iconv("utf-8""gb2312""错误信息");  
  39.   
  40.     $headerFile = implode(','$header);  
  41.   
  42.     //写入标题  
  43.     @unlink($filename);  
  44.     file_put_contents($filename$headerFile."\n");  
  45.   
  46.     //获取所有error_code  
  47.     $list = D('Fanli')->table('tb_account_action_data_error_code')->field('id,err_msg')->findAll();  
  48.     $error_msg = array();  
  49.     foreach ($list as $value) {  
  50.         $error_msg[$value['id']] = $value['err_msg'];  
  51.     }  
  52.     //导入错误的数据  
  53.     if (isset($_GET['error']) && $_GET['error'] > 0) {  
  54.         $map['error_code'] = array('gt', 0);  
  55.     }  
  56.   
  57.     if (!empty($map['action_id'])) {  
  58.         $allCount = $model->where($map)->field('count(1) as count')->select();  
  59.         $pageLimit = ceil($allCount[0]['count']/self::PAGE_COUNT);  
  60.         $voList = array();  
  61.         //打开文件  
  62.         if (!$handle = fopen($filename'a')) {  
  63.             echo "不能打开文件 $filename";  
  64.             exit;  
  65.         }  
  66.         //分页获取  
  67.         for($i=0;$i<$pageLimit;$i++){  
  68.             $count = self::PAGE_COUNT;  
  69.             $start = $count * $i;  
  70.             $limit = "$start,$count";  
  71.             $voList  = $model->where($map)->limit($limit)->order('id desc')->findAll();  
  72.             //写入文件  
  73.             $excelString = array();  
  74.             foreach ($voList as $v) {  
  75.                 $dumpExcel = array();  
  76.                 $dumpExcel[] = mb_convert_encoding($v['user_info'], 'GBK''UTF-8');  
  77.                 $dumpExcel[] = mb_convert_encoding($v['shopid'], 'GBK''UTF-8');  
  78.                 $dumpExcel[] = mb_convert_encoding($v['league'], 'GBK''UTF-8');  
  79.                 $dumpExcel[] = mb_convert_encoding($v['order_id'], 'GBK''UTF-8');  
  80.                 $dumpExcel[] = mb_convert_encoding($v['classify'], 'GBK''UTF-8');  
  81.                 $dumpExcel[] = mb_convert_encoding($v['confirm_type'], 'GBK''UTF-8');  
  82.                 $dumpExcel[] = "'".mb_convert_encoding($v['buydate'], 'GBK', 'UTF-8');  
  83.                 $dumpExcel[] = "'".mb_convert_encoding($v['paydate'], 'GBK', 'UTF-8');  
  84.                 $dumpExcel[] = mb_convert_encoding($v['real_pay'], 'GBK''UTF-8');  
  85.                 $dumpExcel[] = mb_convert_encoding($v['commission'], 'GBK''UTF-8');  
  86.                 $dumpExcel[] = mb_convert_encoding($v['commission_plus'], 'GBK''UTF-8');  
  87.                 $dumpExcel[] = mb_convert_encoding($v['fanli'], 'GBK''UTF-8');  
  88.                 $dumpExcel[] = mb_convert_encoding($v['jifen'], 'GBK''UTF-8');  
  89.                 $dumpExcel[] = mb_convert_encoding($v['bbs'], 'GBK''UTF-8');  
  90.                 $dumpExcel[] = mb_convert_encoding($v['remarks'], 'GBK''UTF-8');  
  91.                 $dumpExcel[] = intval($v['persist_execute']);  
  92.                 $dumpExcel[] = mb_convert_encoding($v['unique_sign'], 'GBK''UTF-8');  
  93.                 $dumpExcel[] = mb_convert_encoding($error_msg[$v['error_code']], 'GBK''UTF-8');  
  94.                 $excelString[] = implode(',',$dumpExcel);  
  95.             }  
  96.             //只能一行行些。不然容易漏  
  97.             foreach($excelString as $content){  
  98.                 fwrite($handle$content . "\n");  
  99.             }  
  100.             unset($excelString);  
  101.         }  
  102.         fclose($handle);  
  103.     }  
  104.     //导出下载  
  105.     header("Content-type: application/octet-stream");  
  106.     header('Content-Disposition: attachment; filename="' . basename($filename) . '"');  
  107.     header("Content-Length: "filesize($filename));  
  108.     readfile($filename);  


这篇关于用php导入10W条+ 级别的csv大文件数据到mysql。导出10W+级别数据到csv文件的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/707165

相关文章

MySQL查询JSON数组字段包含特定字符串的方法

《MySQL查询JSON数组字段包含特定字符串的方法》在MySQL数据库中,当某个字段存储的是JSON数组,需要查询数组中包含特定字符串的记录时传统的LIKE语句无法直接使用,下面小编就为大家介绍两种... 目录问题背景解决方案对比1. 精确匹配方案(推荐)2. 模糊匹配方案参数化查询示例使用场景建议性能优

mysql表操作与查询功能详解

《mysql表操作与查询功能详解》本文系统讲解MySQL表操作与查询,涵盖创建、修改、复制表语法,基本查询结构及WHERE、GROUPBY等子句,本文结合实例代码给大家介绍的非常详细,感兴趣的朋友跟随... 目录01.表的操作1.1表操作概览1.2创建表1.3修改表1.4复制表02.基本查询操作2.1 SE

MySQL中的锁机制详解之全局锁,表级锁,行级锁

《MySQL中的锁机制详解之全局锁,表级锁,行级锁》MySQL锁机制通过全局、表级、行级锁控制并发,保障数据一致性与隔离性,全局锁适用于全库备份,表级锁适合读多写少场景,行级锁(InnoDB)实现高并... 目录一、锁机制基础:从并发问题到锁分类1.1 并发访问的三大问题1.2 锁的核心作用1.3 锁粒度分

MySQL数据库中ENUM的用法是什么详解

《MySQL数据库中ENUM的用法是什么详解》ENUM是一个字符串对象,用于指定一组预定义的值,并可在创建表时使用,下面:本文主要介绍MySQL数据库中ENUM的用法是什么的相关资料,文中通过代码... 目录mysql 中 ENUM 的用法一、ENUM 的定义与语法二、ENUM 的特点三、ENUM 的用法1

MySQL count()聚合函数详解

《MySQLcount()聚合函数详解》MySQL中的COUNT()函数,它是SQL中最常用的聚合函数之一,用于计算表中符合特定条件的行数,本文给大家介绍MySQLcount()聚合函数,感兴趣的朋... 目录核心功能语法形式重要特性与行为如何选择使用哪种形式?总结深入剖析一下 mysql 中的 COUNT

Java easyExcel实现导入多sheet的Excel

《JavaeasyExcel实现导入多sheet的Excel》这篇文章主要为大家详细介绍了如何使用JavaeasyExcel实现导入多sheet的Excel,文中的示例代码讲解详细,感兴趣的小伙伴可... 目录1.官网2.Excel样式3.代码1.官网easyExcel官网2.Excel样式3.代码

MyBatisPlus如何优化千万级数据的CRUD

《MyBatisPlus如何优化千万级数据的CRUD》最近负责的一个项目,数据库表量级破千万,每次执行CRUD都像走钢丝,稍有不慎就引起数据库报警,本文就结合这个项目的实战经验,聊聊MyBatisPl... 目录背景一、MyBATis Plus 简介二、千万级数据的挑战三、优化 CRUD 的关键策略1. 查

mysql中的服务器架构详解

《mysql中的服务器架构详解》:本文主要介绍mysql中的服务器架构,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、背景2、mysql服务器架构解释3、总结1、背景简单理解一下mysqphpl的服务器架构。2、mysjsql服务器架构解释mysql的架

python实现对数据公钥加密与私钥解密

《python实现对数据公钥加密与私钥解密》这篇文章主要为大家详细介绍了如何使用python实现对数据公钥加密与私钥解密,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录公钥私钥的生成使用公钥加密使用私钥解密公钥私钥的生成这一部分,使用python生成公钥与私钥,然后保存在两个文

MySQL之InnoDB存储引擎中的索引用法及说明

《MySQL之InnoDB存储引擎中的索引用法及说明》:本文主要介绍MySQL之InnoDB存储引擎中的索引用法及说明,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录1、背景2、准备3、正篇【1】存储用户记录的数据页【2】存储目录项记录的数据页【3】聚簇索引【4】二