48、Python之模块和包:当导入模块时,Python解释器做了什么

2024-08-23 09:12

本文主要是介绍48、Python之模块和包:当导入模块时,Python解释器做了什么,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

引言

上一篇文章中,我们简单介绍了各种导入模块的方法,并通过代码演示了模块被导入之前的模块查找的路径解析过程,但是,只是局限在了加载模块之前。

今天这篇文章,打算把整个模块导入的全流程进行梳理,从而更清晰地理解模块导入的过程中,Python解释器做了哪些动作,到底发生了什么。

本文的主要内容有:

1、Python中的两大模型

2、命名空间

3、模块导入的全过程及底层细节

Python中的两大模型

在前面的文章中,我们已经多次提到,程序 = 数据结构 + 算法,或者表述为:程序 = 数据的表达 + 数据的处理。而对应到Python中,就是两大模型:数据模型(Data Model)和执行模型(Execution Model)

数据模型,我们前面已经反复提及,概括来说,就是“一切皆对象”。每个对象都有其id(粗略理解为地址)、内容(对象相关的属性、方法)、类型(type)。

由“一切皆对象”,进而得出函数、类、模块、包也都是对象,自然在Python中也都是一等公民。

执行模型,其实就是通过代码,对数据模型进行读与写,也就是对对象的读与写。要对对象进行读写,我们一般是通过变量名进行的,所以,执行模型的一个核心概念,就是“名称绑定”,也就是将每一个变量名与一个对象进行绑定。在Python中变量名是“标签”而非“盒子”的观点,在前面的文章中已经有所提及,不太理解的,可以翻一下之前的文章。

由于变量是贴在对象上的“标签”,变量名与对象的绑定关系,可以是“多对一”的关系。

执行模型中,一个代码块能够读写的对象,是能够访问到的名称绑定的对象。这些名称和对象的绑定被放到了一个称为“命名空间”的结构中,命名空间可以理解为是一个字典。

所以,执行模型,也可以这样表述为“代码块在命名空间上的执行,对命名空间中的名称所绑定的对象进行读写操作”

执行模型中,代码块能够执行,名称绑定是前提,但是,能够执行,还需要能够进行名称解析,以及特殊情况下名称绑定的解绑操作。

其中,名称的解析,就涉及到了“作用域”的概念,之前已经介绍过LEGB的规则,这里就不展开了。

e00179a9a67a4b82cb2adba617364746.jpeg

之所以介绍执行模型,主要是由于当导入模块时,会对命名空间产生影响。

命名空间

命名空间(namespace)是编程语言中一个很核心的概念,用于组织代码、避免命名冲突。在Python中,命名空间本质上是一个从名称(变量名)到对象的映射关系的绑定,也就是命名空间中记录了变量名、函数名、类名等与实际对象的关联关系。

在Python中,命名空间可以分为四类,分别是:局部命名空间(Local Namespace)、闭包命名空间(Enclosing Namespace)、全局命名空间(Global Namespace)和内置命名空间(Built-in Namespace)。

1、局部命名空间:包含函数和方法内定义的变量和参数,每次函数调用都会创建一个新的局部命名空间。

2、闭包命名空间:包含在嵌套函数中的外层函数中的局部命名空间。

3、全局命名空间:包含当前模块中定义的所有全局变量、函数、类等,当模块被导入时,Python解释器会创建一个全局命名空间。

4、内置命名空间:包含Python解释器启动时加载的内置函数、异常等。比如,print()、len()、int等都在内置命名空间中。

每种命名空间都有自己的生命周期:

1、局部命名空间:从函数调用开始到函数返回结束。

2、闭包命名空间:从外层函数被调用到内层函数执行结束。

3、全局命名空间:从模块被导入或者脚本开始执行到脚本结束。

4、内置命名空间:从Python解释器启动到解释器进程结束。

在Python中,有3个内置函数,可以查看命名空间中的内容:

1、globals():查看当前全局命名空间的字典

2、locals():查看当前局部命名空间的字典

3、dir():返回当前代码所在范围的所有名字列表

模块导入的全过程及底层细节

有了前面关于“执行模型”和“命名空间”的概念,可以帮助我们更好地理解Python中的模块导入。

首先来看下模块导入的全过程:

1、查找模块

当执行import 模块名等类似的操作时,Python解释器首先会在sys.modules字典中查找,如果已经存在,直接使用缓存的模块,避免重复加载。

如果sys.modules模块中不存在,则会检查是否是内置模块,这些模块是C语言编写的,并被编译到了Python解释器中。

如果不是内置模块,Python解释器会在sys.path列表中按顺序进行模块的查找。关于路径的查找顺序,上一篇文章中已经提及,可以自行查阅。

2、编译模块

如果是首次导入,找到的是一个.py文件,Python解释器会将其“编译”为字节码(.pyc)文件,以提高后续执行的加载速度。如果已经存在编译后的字节码文件且没有过期(可以理解为比较.py文件的修改时间与.pyc文件的生成时间),则会直接加载字节码文件。

3、执行模块代码

一旦模块的字节码被加载,Python解释器会创建一个新的模块对象,并执行模块的顶级代码(即未包裹在函数定义或者类定义中的代码)。在执行模块代码时,Python解释器首先会为该模块创建一个独立的全局命名空间,模块中的顶级代码是在该独立的全局命名空间中执行的。

4、更新命名空间

执行完模块的顶级代码后,模块对象会被添加到sys.modules字典中,以便将来可以复用,并且导入的模块名会绑定到当前作用域中的模块对象(根据导入方式的不同,除了模块名与模块对象的绑定之外,还可能涉及到模块中变量、函数等的绑定)

总结

为了更好地理解Python中模块导入的过程及细节,本文首先回顾了Python中的数据模型,然后引入了执行模型的概念。之后,简单介绍了Python中的命名空间,4种命名空间的含义及其生命周期。基于执行模型及命名空间的概念,对Python中的模块导入全过程做了一个系统性的梳理。

在下一篇文章中,将通过实际的代码执行,验证一下Python模块导入、加载的过程。

感谢您的拨冗阅读,如果对您学习Python有所帮助,欢迎点赞、关注。

2d34713a99a6b09b3b59a38b5bee870c.jpeg

这篇关于48、Python之模块和包:当导入模块时,Python解释器做了什么的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1098964

相关文章

Python的Darts库实现时间序列预测

《Python的Darts库实现时间序列预测》Darts一个集统计、机器学习与深度学习模型于一体的Python时间序列预测库,本文主要介绍了Python的Darts库实现时间序列预测,感兴趣的可以了解... 目录目录一、什么是 Darts?二、安装与基本配置安装 Darts导入基础模块三、时间序列数据结构与

Python正则表达式匹配和替换的操作指南

《Python正则表达式匹配和替换的操作指南》正则表达式是处理文本的强大工具,Python通过re模块提供了完整的正则表达式功能,本文将通过代码示例详细介绍Python中的正则匹配和替换操作,需要的朋... 目录基础语法导入re模块基本元字符常用匹配方法1. re.match() - 从字符串开头匹配2.

Python使用FastAPI实现大文件分片上传与断点续传功能

《Python使用FastAPI实现大文件分片上传与断点续传功能》大文件直传常遇到超时、网络抖动失败、失败后只能重传的问题,分片上传+断点续传可以把大文件拆成若干小块逐个上传,并在中断后从已完成分片继... 目录一、接口设计二、服务端实现(FastAPI)2.1 运行环境2.2 目录结构建议2.3 serv

C#实现千万数据秒级导入的代码

《C#实现千万数据秒级导入的代码》在实际开发中excel导入很常见,现代社会中很容易遇到大数据处理业务,所以本文我就给大家分享一下千万数据秒级导入怎么实现,文中有详细的代码示例供大家参考,需要的朋友可... 目录前言一、数据存储二、处理逻辑优化前代码处理逻辑优化后的代码总结前言在实际开发中excel导入很

通过Docker容器部署Python环境的全流程

《通过Docker容器部署Python环境的全流程》在现代化开发流程中,Docker因其轻量化、环境隔离和跨平台一致性的特性,已成为部署Python应用的标准工具,本文将详细演示如何通过Docker容... 目录引言一、docker与python的协同优势二、核心步骤详解三、进阶配置技巧四、生产环境最佳实践

Python一次性将指定版本所有包上传PyPI镜像解决方案

《Python一次性将指定版本所有包上传PyPI镜像解决方案》本文主要介绍了一个安全、完整、可离线部署的解决方案,用于一次性准备指定Python版本的所有包,然后导出到内网环境,感兴趣的小伙伴可以跟随... 目录为什么需要这个方案完整解决方案1. 项目目录结构2. 创建智能下载脚本3. 创建包清单生成脚本4

Python实现Excel批量样式修改器(附完整代码)

《Python实现Excel批量样式修改器(附完整代码)》这篇文章主要为大家详细介绍了如何使用Python实现一个Excel批量样式修改器,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一... 目录前言功能特性核心功能界面特性系统要求安装说明使用指南基本操作流程高级功能技术实现核心技术栈关键函

python获取指定名字的程序的文件路径的两种方法

《python获取指定名字的程序的文件路径的两种方法》本文主要介绍了python获取指定名字的程序的文件路径的两种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要... 最近在做项目,需要用到给定一个程序名字就可以自动获取到这个程序在Windows系统下的绝对路径,以下

oracle 11g导入\导出(expdp impdp)之导入过程

《oracle11g导入导出(expdpimpdp)之导入过程》导出需使用SEC.DMP格式,无分号;建立expdir目录(E:/exp)并确保存在;导入在cmd下执行,需sys用户权限;若需修... 目录准备文件导入(impdp)1、建立directory2、导入语句 3、更改密码总结上一个环节,我们讲了

使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解

《使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解》本文详细介绍了如何使用Python通过ncmdump工具批量将.ncm音频转换为.mp3的步骤,包括安装、配置ffmpeg环... 目录1. 前言2. 安装 ncmdump3. 实现 .ncm 转 .mp34. 执行过程5. 执行结