python 中 pickle 模块学习笔记

2024-05-12 01:48

本文主要是介绍python 中 pickle 模块学习笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  1. 概要
  2. 和json 模块的比较
  3. 常用api说明
  4. 具体应用举例
  5. 总结
  6. 参考文档 pickle模块

    一. 概要

    用这个模块 可以创建Python对象的可移植序列化表示。
    Create portable serialized representations of Python objects.

    二.pickle 和json 模块对比
    1. json 模块实现序列化方式 一般是 unicode text ,而且序列化后, 人是可以看懂的. 但是 pickle 序列化方式是二进制的, 人是看不懂的.
    2. json 序列化更加广泛,并且json 是可以互操作的. pickle 仅是Python 独有的一种方式.
    3. json 可以序列化Python内置类型的子类. 但是我如果要序列化 自己写的类,显得无能为力. 但是pickle 模块是可以的,可以序列化 自己写的类,同时可以序列化Python内置类型的子类型.
There are fundamental differences between the pickle protocols and JSON (JavaScript Object Notation):JSON is a text serialization format (it outputs unicode text, although most of the time it is then encoded to utf-8), while pickle is a binary serialization format;
JSON is human-readable, while pickle is not;
JSON is interoperable and widely used outside of the Python ecosystem, while pickle is Python-specific;
JSON, by default, can only represent a subset of the Python built-in types, and no custom classes; pickle can represent an extremely large number of Python types (many of them automatically, by clever usage of Python’s introspection facilities; complex cases can be tackled by implementing specific object APIs).

1看一个小例子


import pickle
import jsonif __name__ == '__main__':d1 = dict(zip('frank', range(5)))print(d1)json_str = json.dumps(d1)pickle_str = pickle.dumps(d1)print(f'json_str: {json_str}')print(f'pickle_str: {pickle_str}')

结果如下:

{'f': 0, 'r': 1, 'a': 2, 'n': 3, 'k': 4}
json_str: {"f": 0, "r": 1, "a": 2, "n": 3, "k": 4}
pickle_str: b'\x80\x03}q\x00(X\x01\x00\x00\x00fq\x01K\x00X\x01\x00\x00\x00rq\x02K\x01X\x01\x00\x00\x00aq\x03K\x02X\x01\x00\x00\x00nq\x04K\x03X\x01\x00\x00\x00kq\x05K\x04u.'Process finished with exit code 0

可以看出来,json 序列化后,是人类能够看懂的.而pickle 模块序列化后,就看不懂了,因为是二进制的.

在看一个例子

#!/usr/bin/env python3
# -*- coding: UTF-8 -*-
"""
@author: Frank 
@contact: frank.chang@shoufuyou.com
@file: test_pickle.py
@time: 2018/7/22 上午9:06"""import pickle
import jsonclass Person:__tablename__ = 'person'table_flag = 'online'def __init__(self, name):self.name = name@classmethoddef pickup(cls, *args, **kwargs):print('pickup() is running.')kwargs.update({"name": "frank", "hobby": "swim"})return kwargsdef test_pickle():# 序列化类p1 = pickle.dumps(Person)# 反序列化P1 = pickle.loads(p1)# 打印Person类print(P1)p2 = P1('frank')print(p2.pickup())def test_json():p1 = json.dumps(Person)P1 = json.loads(p1)print(P1)p2 = P1('frank')print(p2.pickup())if __name__ == '__main__':# test_pickle()test_json()

报错如下:

TypeError: Object of type 'type' is not JSON serializable

这里就是 type 不可以json 序列化的.

而用 test_pickle() 是可以的.
结果如下:

<class '__main__.Person'>
pickup() is running.
{'name': 'frank', 'hobby': 'swim'}

##### 三. 常用api说明

提供了常用序列化,和反序列化的接口
dumps dump 前一个返回时一个bytes 对象 , 后一个直接序列化到文件里面

loads load 前一个 从二进制bytes对象读取对象, 后一个 从文件中读取对象

pickle.dump(obj, file, protocol=None, *, fix_imports=True)

pickle.dumps(obj, protocol=None, *, fix_imports=True)

pickle.load(file, *, fix_imports=True, encoding=”ASCII”, errors=”strict”)

pickle.loads(bytes_object, *, fix_imports=True, encoding=”ASCII”, errors=”strict”)

如果要有更多的空值, 可以使用下面的两个类 来定制你的 序列化对象
The pickle module exports two classes, Pickler and Unpickler:

如果要对序列化和反序列化进行更多控制,可以分别创建Pickler或Unpickler对象。

pickle 模块定义的异常
The pickle module defines three exceptions:

exception pickle.PickleErrorexception pickle.PicklingErrorexception pickle.UnpicklingError

来看一个例子

import pickleclass Person:__tablename__ = 'person'table_flag = 'online'def __init__(self, name):self.name = name@classmethoddef pickup(cls, *args, **kwargs):print('pickup() is running.')# 所有的参数直接返回,不做任何处理.kwargs.update({"name": "frank", "hobby": "swim"})return kwargs@classmethoddef extract(cls, value='frank'):"""获取写数据库必要数据:param value: pickup 方法的返回值:param context: pickup 方法的入参:return:"""print('extract() is running.')return valueclass Serialization:def __init__(self, obj):self.myclass = objdef serialize(self):with open('pickle.txt', 'wb+') as f:# 写入  序列化到文件pickle.dump(self.myclass, f)def deserialize(self):# 反序列化  从文件反序列化with open('pickle.txt', 'rb') as f:# 读取data = pickle.load(f)return dataif __name__ == '__main__':ser = Serialization(Person)ser.serialize()person = ser.deserialize()print(f'person.table_flag: {person.table_flag}')print(person.pickup())print(person.extract())

结果如下:

person.table_flag: online
pickup() is running.
{'name': 'frank', 'hobby': 'swim'}
extract() is running.
frank

这个例子就是把类序列化到文件里面, 之后再从文件中读出来.

四. 具体应用举例

这个模块具体有什么用呢? 比如 有一个系统需要动态加载类, (我的意思是类是通过代码生成的,然后要把这个类加载到内存里面)
但是有一天我担心,如果程序突然有意外的bug ,或者其他的情况崩溃了, 而之前加载的类,就会消失了,一旦重启了系统,所有动态生成的类就会消失了, 所以pickle 模块就给我提供非常好用的方法. 可以把类序列化写到文件,或者序列化到二进制bytes 对象. 之后如果系统重启后,我重新 反序列把类读取到内存里面,完成反序列化.

#!/usr/bin/env python3
# -*- coding: UTF-8 -*-
"""
@author: Frank 
@contact: frank.chang@shoufuyou.com
@file: serialization.py
@time: 2018/7/22 上午12:18"""import pickleclass Person:__tablename__ = 'person'table_flag = 'online'def __init__(self, name):self.name = name@classmethoddef pickup(cls, *args, **kwargs):print('pickup() is running.')# 所有的参数直接返回,不做任何处理.kwargs.update({"name": "frank", "hobby": "swim"})return kwargs@classmethoddef extract(cls, value='frank'):""":param value: pickup 方法的返回值:return:"""print('extract() is running.')return valueclass Serialization:def __init__(self):self.myclasses = []def resigester(self, obj):self.myclasses.append(obj)def serialize(self):# 写入 序列化pickle_strings = []for myclass in self.myclasses:pickle_string = pickle.dumps(myclass)pickle_strings.append(pickle_string)return pickle_strings@staticmethoddef deserialize(bytes_object):# 反序列化  从文件反序列化return pickle.loads(bytes_object)if __name__ == '__main__':serialization = Serialization()serialization.resigester(Person)# 序列化Person 类strings = serialization.serialize()# 打印 序列化的结果print(strings)for bytes_obj in strings:# 反序列,得到Person 类P = serialization.deserialize(bytes_obj)print(P)# 构造p1 对象p1 = P('frank')print(p1.pickup())

结果如下:

[b'\x80\x03c__main__\nPerson\nq\x00.']
<class '__main__.Person'>
pickup() is running.
{'name': 'frank', 'hobby': 'swim'}

通过Serialization 序列化 Person类,之后有把他反序列出来, 完成序列化, 与反序列化操作.

五.参考文档

本文简单介绍了pickle模块的常见用法,常用api , 比较了与pickle 模块的不同. 如果需要特殊定制序列化, 可以使用 接口提供的那两个类.Pickler and Unpickler 这两个类更多的参考官方文档, 一般用的比较少.

六.参考文档

https://docs.python.org/3/library/pickle.html


分享快乐,留住感动.2018-07-22 18:59:19 –frank

这篇关于python 中 pickle 模块学习笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/981267

相关文章

Python如何使用__slots__实现节省内存和性能优化

《Python如何使用__slots__实现节省内存和性能优化》你有想过,一个小小的__slots__能让你的Python类内存消耗直接减半吗,没错,今天咱们要聊的就是这个让人眼前一亮的技巧,感兴趣的... 目录背景:内存吃得满满的类__slots__:你的内存管理小助手举个大概的例子:看看效果如何?1.

Python+PyQt5实现多屏幕协同播放功能

《Python+PyQt5实现多屏幕协同播放功能》在现代会议展示、数字广告、展览展示等场景中,多屏幕协同播放已成为刚需,下面我们就来看看如何利用Python和PyQt5开发一套功能强大的跨屏播控系统吧... 目录一、项目概述:突破传统播放限制二、核心技术解析2.1 多屏管理机制2.2 播放引擎设计2.3 专

Python中随机休眠技术原理与应用详解

《Python中随机休眠技术原理与应用详解》在编程中,让程序暂停执行特定时间是常见需求,当需要引入不确定性时,随机休眠就成为关键技巧,下面我们就来看看Python中随机休眠技术的具体实现与应用吧... 目录引言一、实现原理与基础方法1.1 核心函数解析1.2 基础实现模板1.3 整数版实现二、典型应用场景2

Python实现无痛修改第三方库源码的方法详解

《Python实现无痛修改第三方库源码的方法详解》很多时候,我们下载的第三方库是不会有需求不满足的情况,但也有极少的情况,第三方库没有兼顾到需求,本文将介绍几个修改源码的操作,大家可以根据需求进行选择... 目录需求不符合模拟示例 1. 修改源文件2. 继承修改3. 猴子补丁4. 追踪局部变量需求不符合很

python+opencv处理颜色之将目标颜色转换实例代码

《python+opencv处理颜色之将目标颜色转换实例代码》OpenCV是一个的跨平台计算机视觉库,可以运行在Linux、Windows和MacOS操作系统上,:本文主要介绍python+ope... 目录下面是代码+ 效果 + 解释转HSV: 关于颜色总是要转HSV的掩膜再标注总结 目标:将红色的部分滤

Python 中的异步与同步深度解析(实践记录)

《Python中的异步与同步深度解析(实践记录)》在Python编程世界里,异步和同步的概念是理解程序执行流程和性能优化的关键,这篇文章将带你深入了解它们的差异,以及阻塞和非阻塞的特性,同时通过实际... 目录python中的异步与同步:深度解析与实践异步与同步的定义异步同步阻塞与非阻塞的概念阻塞非阻塞同步

Python Dash框架在数据可视化仪表板中的应用与实践记录

《PythonDash框架在数据可视化仪表板中的应用与实践记录》Python的PlotlyDash库提供了一种简便且强大的方式来构建和展示互动式数据仪表板,本篇文章将深入探讨如何使用Dash设计一... 目录python Dash框架在数据可视化仪表板中的应用与实践1. 什么是Plotly Dash?1.1

在C#中调用Python代码的两种实现方式

《在C#中调用Python代码的两种实现方式》:本文主要介绍在C#中调用Python代码的两种实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录C#调用python代码的方式1. 使用 Python.NET2. 使用外部进程调用 Python 脚本总结C#调

Python下载Pandas包的步骤

《Python下载Pandas包的步骤》:本文主要介绍Python下载Pandas包的步骤,在python中安装pandas库,我采取的方法是用PIP的方法在Python目标位置进行安装,本文给大... 目录安装步骤1、首先找到我们安装python的目录2、使用命令行到Python安装目录下3、我们回到Py

Python GUI框架中的PyQt详解

《PythonGUI框架中的PyQt详解》PyQt是Python语言中最强大且广泛应用的GUI框架之一,基于Qt库的Python绑定实现,本文将深入解析PyQt的核心模块,并通过代码示例展示其应用场... 目录一、PyQt核心模块概览二、核心模块详解与示例1. QtCore - 核心基础模块2. QtWid