python 中 pickle 模块学习笔记

2024-05-12 01:48

本文主要是介绍python 中 pickle 模块学习笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  1. 概要
  2. 和json 模块的比较
  3. 常用api说明
  4. 具体应用举例
  5. 总结
  6. 参考文档 pickle模块

    一. 概要

    用这个模块 可以创建Python对象的可移植序列化表示。
    Create portable serialized representations of Python objects.

    二.pickle 和json 模块对比
    1. json 模块实现序列化方式 一般是 unicode text ,而且序列化后, 人是可以看懂的. 但是 pickle 序列化方式是二进制的, 人是看不懂的.
    2. json 序列化更加广泛,并且json 是可以互操作的. pickle 仅是Python 独有的一种方式.
    3. json 可以序列化Python内置类型的子类. 但是我如果要序列化 自己写的类,显得无能为力. 但是pickle 模块是可以的,可以序列化 自己写的类,同时可以序列化Python内置类型的子类型.
There are fundamental differences between the pickle protocols and JSON (JavaScript Object Notation):JSON is a text serialization format (it outputs unicode text, although most of the time it is then encoded to utf-8), while pickle is a binary serialization format;
JSON is human-readable, while pickle is not;
JSON is interoperable and widely used outside of the Python ecosystem, while pickle is Python-specific;
JSON, by default, can only represent a subset of the Python built-in types, and no custom classes; pickle can represent an extremely large number of Python types (many of them automatically, by clever usage of Python’s introspection facilities; complex cases can be tackled by implementing specific object APIs).

1看一个小例子


import pickle
import jsonif __name__ == '__main__':d1 = dict(zip('frank', range(5)))print(d1)json_str = json.dumps(d1)pickle_str = pickle.dumps(d1)print(f'json_str: {json_str}')print(f'pickle_str: {pickle_str}')

结果如下:

{'f': 0, 'r': 1, 'a': 2, 'n': 3, 'k': 4}
json_str: {"f": 0, "r": 1, "a": 2, "n": 3, "k": 4}
pickle_str: b'\x80\x03}q\x00(X\x01\x00\x00\x00fq\x01K\x00X\x01\x00\x00\x00rq\x02K\x01X\x01\x00\x00\x00aq\x03K\x02X\x01\x00\x00\x00nq\x04K\x03X\x01\x00\x00\x00kq\x05K\x04u.'Process finished with exit code 0

可以看出来,json 序列化后,是人类能够看懂的.而pickle 模块序列化后,就看不懂了,因为是二进制的.

在看一个例子

#!/usr/bin/env python3
# -*- coding: UTF-8 -*-
"""
@author: Frank 
@contact: frank.chang@shoufuyou.com
@file: test_pickle.py
@time: 2018/7/22 上午9:06"""import pickle
import jsonclass Person:__tablename__ = 'person'table_flag = 'online'def __init__(self, name):self.name = name@classmethoddef pickup(cls, *args, **kwargs):print('pickup() is running.')kwargs.update({"name": "frank", "hobby": "swim"})return kwargsdef test_pickle():# 序列化类p1 = pickle.dumps(Person)# 反序列化P1 = pickle.loads(p1)# 打印Person类print(P1)p2 = P1('frank')print(p2.pickup())def test_json():p1 = json.dumps(Person)P1 = json.loads(p1)print(P1)p2 = P1('frank')print(p2.pickup())if __name__ == '__main__':# test_pickle()test_json()

报错如下:

TypeError: Object of type 'type' is not JSON serializable

这里就是 type 不可以json 序列化的.

而用 test_pickle() 是可以的.
结果如下:

<class '__main__.Person'>
pickup() is running.
{'name': 'frank', 'hobby': 'swim'}

##### 三. 常用api说明

提供了常用序列化,和反序列化的接口
dumps dump 前一个返回时一个bytes 对象 , 后一个直接序列化到文件里面

loads load 前一个 从二进制bytes对象读取对象, 后一个 从文件中读取对象

pickle.dump(obj, file, protocol=None, *, fix_imports=True)

pickle.dumps(obj, protocol=None, *, fix_imports=True)

pickle.load(file, *, fix_imports=True, encoding=”ASCII”, errors=”strict”)

pickle.loads(bytes_object, *, fix_imports=True, encoding=”ASCII”, errors=”strict”)

如果要有更多的空值, 可以使用下面的两个类 来定制你的 序列化对象
The pickle module exports two classes, Pickler and Unpickler:

如果要对序列化和反序列化进行更多控制,可以分别创建Pickler或Unpickler对象。

pickle 模块定义的异常
The pickle module defines three exceptions:

exception pickle.PickleErrorexception pickle.PicklingErrorexception pickle.UnpicklingError

来看一个例子

import pickleclass Person:__tablename__ = 'person'table_flag = 'online'def __init__(self, name):self.name = name@classmethoddef pickup(cls, *args, **kwargs):print('pickup() is running.')# 所有的参数直接返回,不做任何处理.kwargs.update({"name": "frank", "hobby": "swim"})return kwargs@classmethoddef extract(cls, value='frank'):"""获取写数据库必要数据:param value: pickup 方法的返回值:param context: pickup 方法的入参:return:"""print('extract() is running.')return valueclass Serialization:def __init__(self, obj):self.myclass = objdef serialize(self):with open('pickle.txt', 'wb+') as f:# 写入  序列化到文件pickle.dump(self.myclass, f)def deserialize(self):# 反序列化  从文件反序列化with open('pickle.txt', 'rb') as f:# 读取data = pickle.load(f)return dataif __name__ == '__main__':ser = Serialization(Person)ser.serialize()person = ser.deserialize()print(f'person.table_flag: {person.table_flag}')print(person.pickup())print(person.extract())

结果如下:

person.table_flag: online
pickup() is running.
{'name': 'frank', 'hobby': 'swim'}
extract() is running.
frank

这个例子就是把类序列化到文件里面, 之后再从文件中读出来.

四. 具体应用举例

这个模块具体有什么用呢? 比如 有一个系统需要动态加载类, (我的意思是类是通过代码生成的,然后要把这个类加载到内存里面)
但是有一天我担心,如果程序突然有意外的bug ,或者其他的情况崩溃了, 而之前加载的类,就会消失了,一旦重启了系统,所有动态生成的类就会消失了, 所以pickle 模块就给我提供非常好用的方法. 可以把类序列化写到文件,或者序列化到二进制bytes 对象. 之后如果系统重启后,我重新 反序列把类读取到内存里面,完成反序列化.

#!/usr/bin/env python3
# -*- coding: UTF-8 -*-
"""
@author: Frank 
@contact: frank.chang@shoufuyou.com
@file: serialization.py
@time: 2018/7/22 上午12:18"""import pickleclass Person:__tablename__ = 'person'table_flag = 'online'def __init__(self, name):self.name = name@classmethoddef pickup(cls, *args, **kwargs):print('pickup() is running.')# 所有的参数直接返回,不做任何处理.kwargs.update({"name": "frank", "hobby": "swim"})return kwargs@classmethoddef extract(cls, value='frank'):""":param value: pickup 方法的返回值:return:"""print('extract() is running.')return valueclass Serialization:def __init__(self):self.myclasses = []def resigester(self, obj):self.myclasses.append(obj)def serialize(self):# 写入 序列化pickle_strings = []for myclass in self.myclasses:pickle_string = pickle.dumps(myclass)pickle_strings.append(pickle_string)return pickle_strings@staticmethoddef deserialize(bytes_object):# 反序列化  从文件反序列化return pickle.loads(bytes_object)if __name__ == '__main__':serialization = Serialization()serialization.resigester(Person)# 序列化Person 类strings = serialization.serialize()# 打印 序列化的结果print(strings)for bytes_obj in strings:# 反序列,得到Person 类P = serialization.deserialize(bytes_obj)print(P)# 构造p1 对象p1 = P('frank')print(p1.pickup())

结果如下:

[b'\x80\x03c__main__\nPerson\nq\x00.']
<class '__main__.Person'>
pickup() is running.
{'name': 'frank', 'hobby': 'swim'}

通过Serialization 序列化 Person类,之后有把他反序列出来, 完成序列化, 与反序列化操作.

五.参考文档

本文简单介绍了pickle模块的常见用法,常用api , 比较了与pickle 模块的不同. 如果需要特殊定制序列化, 可以使用 接口提供的那两个类.Pickler and Unpickler 这两个类更多的参考官方文档, 一般用的比较少.

六.参考文档

https://docs.python.org/3/library/pickle.html


分享快乐,留住感动.2018-07-22 18:59:19 –frank

这篇关于python 中 pickle 模块学习笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/981267

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

python: 多模块(.py)中全局变量的导入

文章目录 global关键字可变类型和不可变类型数据的内存地址单模块(单个py文件)的全局变量示例总结 多模块(多个py文件)的全局变量from x import x导入全局变量示例 import x导入全局变量示例 总结 global关键字 global 的作用范围是模块(.py)级别: 当你在一个模块(文件)中使用 global 声明变量时,这个变量只在该模块的全局命名空

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

深入探索协同过滤:从原理到推荐模块案例

文章目录 前言一、协同过滤1. 基于用户的协同过滤(UserCF)2. 基于物品的协同过滤(ItemCF)3. 相似度计算方法 二、相似度计算方法1. 欧氏距离2. 皮尔逊相关系数3. 杰卡德相似系数4. 余弦相似度 三、推荐模块案例1.基于文章的协同过滤推荐功能2.基于用户的协同过滤推荐功能 前言     在信息过载的时代,推荐系统成为连接用户与内容的桥梁。本文聚焦于

【Python编程】Linux创建虚拟环境并配置与notebook相连接

1.创建 使用 venv 创建虚拟环境。例如,在当前目录下创建一个名为 myenv 的虚拟环境: python3 -m venv myenv 2.激活 激活虚拟环境使其成为当前终端会话的活动环境。运行: source myenv/bin/activate 3.与notebook连接 在虚拟环境中,使用 pip 安装 Jupyter 和 ipykernel: pip instal

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学