解决pymysql.err.DataError (1406, “Data too long for column ‘remark‘ at row 1419“)

2023-10-09 21:20

本文主要是介绍解决pymysql.err.DataError (1406, “Data too long for column ‘remark‘ at row 1419“),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1. 问题背景

在向数据库导入大批量数据的时候报错:

DataError: (pymysql.err.DataError) (1406, "Data too long for column 'remark' at row 1419")

相关代码:

import pandas as pd
from sqlalchemy import create_engine
from urllib.parse import quote_plus as urlquote
import pymysqluserName = "xxxx"
password = "xxxxx"
dbHost = "your ip xxx.xxx.xxx.xxx"
dbName = "your dbname"
dbPort = 3306# charset=utf8mb4为utf8的超集,兼容utf8,可存储emoji表情等非常规数据
conn = f'mysql+pymysql://{userName}:{urlquote(password)}@{dbHost}:{dbPort}/{dbName}?charset=utf8mb4'
engine = create_engine(conn,max_overflow=50,  # 超过连接池大小外最多创建的连接pool_size=50,  # 连接池大小pool_timeout=5,  # 池中没有线程最多等待的时间,否则报错pool_recycle=-1,  # 多久之后对线程池中的线程进行一次连接的回收(重置)encoding='utf-8',echo=False
)pd.io.sql.to_sql(data_df, name="db_table1", con=engine, if_exists="append", index=False)
engine.dispose()

2. 分析

百度上有很多解决办法,但是都不适合自己的问题情况。

  • 有的办法是让修改MySQL数据库的严格模式,就是修改sql_mode参数 STRICT_TRANS_TABLES,但我认为不合适,尤其是在线上生产数据库,严格模式可以确保数据的基本规范性,把严格模式去掉后的数据库不就是垃圾场了么,什么数据都能往里面塞;如果是数据库是自己测试的,那就无所谓了。
  • 还有的办法是让修改字符集,但巧了,我的数据库字符集是这样的,没得改。
    charset
    所以,还得自己来。

2.1 看数据

看报错,第1419行数据的 ‘remark’ 字段太长,先看看数据是什么样子吧。

data_df['remark'][1410:1420]

datadf
搞笑,报错明显跟实际数据不一致。莫名其妙。
会不会和写入时候的数据量有关系,这次写入的数据有41298条。
volume
会不会是单次写入的数据量超过 sqlalchemy 的限制,只是猜想,也没功夫去细究sqlalchemy的源码了,先把数据拆分再写入试试。

2.2 数据拆分写入

部分代码:
code
结果还是报错了,现象和上次一样。明明报错行的字段数据为空,实在不行还有最后一招:我知道数据本来的样子,既然数据没错,那我就把报错那行的字段值截了。

ddd = data.get("remark", "---")
itm["remark"] = ddd[:255] if len(ddd) > 255 else ddd

好了,搞定收工!

2.3 写在最后

我的解决方法只是提供个参考,看到这篇博客的朋友如果有新的发现可以留言,不要照搬我的思路哦,毕竟我是在知道真实数据的情况下做出的操作。

这篇关于解决pymysql.err.DataError (1406, “Data too long for column ‘remark‘ at row 1419“)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/175656

相关文章

大数据小内存排序问题如何巧妙解决

《大数据小内存排序问题如何巧妙解决》文章介绍了大数据小内存排序的三种方法:数据库排序、分治法和位图法,数据库排序简单但速度慢,对设备要求高;分治法高效但实现复杂;位图法可读性差,但存储空间受限... 目录三种方法:方法概要数据库排序(http://www.chinasem.cn对数据库设备要求较高)分治法(常

Vue项目中Element UI组件未注册的问题原因及解决方法

《Vue项目中ElementUI组件未注册的问题原因及解决方法》在Vue项目中使用ElementUI组件库时,开发者可能会遇到一些常见问题,例如组件未正确注册导致的警告或错误,本文将详细探讨这些问题... 目录引言一、问题背景1.1 错误信息分析1.2 问题原因二、解决方法2.1 全局引入 Element

linux报错INFO:task xxxxxx:634 blocked for more than 120 seconds.三种解决方式

《linux报错INFO:taskxxxxxx:634blockedformorethan120seconds.三种解决方式》文章描述了一个Linux最小系统运行时出现的“hung_ta... 目录1.问题描述2.解决办法2.1 缩小文件系统缓存大小2.2 修改系统IO调度策略2.3 取消120秒时间限制3

C#使用HttpClient进行Post请求出现超时问题的解决及优化

《C#使用HttpClient进行Post请求出现超时问题的解决及优化》最近我的控制台程序发现有时候总是出现请求超时等问题,通常好几分钟最多只有3-4个请求,在使用apipost发现并发10个5分钟也... 目录优化结论单例HttpClient连接池耗尽和并发并发异步最终优化后优化结论我直接上优化结论吧,

解决systemctl reload nginx重启Nginx服务报错:Job for nginx.service invalid问题

《解决systemctlreloadnginx重启Nginx服务报错:Jobfornginx.serviceinvalid问题》文章描述了通过`systemctlstatusnginx.se... 目录systemctl reload nginx重启Nginx服务报错:Job for nginx.javas

Mysql DATETIME 毫秒坑的解决

《MysqlDATETIME毫秒坑的解决》本文主要介绍了MysqlDATETIME毫秒坑的解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着... 今天写代码突发一个诡异的 bug,代码逻辑大概如下。1. 新增退款单记录boolean save = s

vue解决子组件样式覆盖问题scoped deep

《vue解决子组件样式覆盖问题scopeddeep》文章主要介绍了在Vue项目中处理全局样式和局部样式的方法,包括使用scoped属性和深度选择器(/deep/)来覆盖子组件的样式,作者建议所有组件... 目录前言scoped分析deep分析使用总结所有组件必须加scoped父组件覆盖子组件使用deep前言

解决Cron定时任务中Pytest脚本无法发送邮件的问题

《解决Cron定时任务中Pytest脚本无法发送邮件的问题》文章探讨解决在Cron定时任务中运行Pytest脚本时邮件发送失败的问题,先优化环境变量,再检查Pytest邮件配置,接着配置文件确保SMT... 目录引言1. 环境变量优化:确保Cron任务可以正确执行解决方案:1.1. 创建一个脚本1.2. 修

Mysql8.0修改配置文件my.ini的坑及解决

《Mysql8.0修改配置文件my.ini的坑及解决》使用记事本直接编辑my.ini文件保存后,可能会导致MySQL无法启动,因为MySQL会以ANSI编码读取该文件,解决方法是使用Notepad++... 目录Myhttp://www.chinasem.cnsql8.0修改配置文件my.ini的坑出现的问题

SpringBoot项目删除Bean或者不加载Bean的问题解决

《SpringBoot项目删除Bean或者不加载Bean的问题解决》文章介绍了在SpringBoot项目中如何使用@ComponentScan注解和自定义过滤器实现不加载某些Bean的方法,本文通过实... 使用@ComponentScan注解中的@ComponentScan.Filter标记不加载。@C