理解python中的Iterator 和 Iterable 迭代器和可迭代对象

2024-05-12 08:04

本文主要是介绍理解python中的Iterator 和 Iterable 迭代器和可迭代对象,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

为什么有些对象可以用for … in 循环

我们先看一段代码:

    list = [1, 2, 3, 4, 5]for i in list:logger.info(i)

这代码定义了1个数组object list, 然后用 for … in 来遍历这个list
看起来合理没什么值得注意

但其实 for … in 后面对象还可以是个String

for i in "hello":logger.info(i)

还可以是个dict (相当于java 的map)

    dict = {"a": 1, "b": 2}for key in dict:logger.info("{}:{}".format(key, dict[key]))

甚至可以是1个文件 open 对象 (TextIOWrapper)

    with open("/home/gateman/Documents/jumpserver_installation.log") as f:for i in f:logger.info(i)

这样就不是那么能理解了,
for i in loopable_object 这种写法, 用java 的思维来推导 这个loopable_object 一定是实现了某个接口 类似与Loopable

实际上, 这个想法不是全错, 虽然python 没有强接口概念, 但是实际上, python 这个Loopable_object 必须具有 __iter__方法
也就是讲 它必须是1个iterable 对象




iterable 和 iterator 的定义

iterable :

Iterable 的中文意思是可迭代对象, 就是可以被循环的对象, 它在内部必须实现__iter__ 方法
iter 方法会返回1个 iterator , 所以实际上iterable 是依赖于它内置的 iterator去迭代元素的

常见的iterable 有List, Dict, String 等等, 所以它们都是可以用for … in … 来循环的




iterator:

上面说了, iterator 中文是迭代器, 它才是真正可以被迭代的对象, 它必须实现__next__ 方法

可以理解为 Iterator 有1个属性 current-item
next 方法会return 当前的current-item
而且会把 current -item 指向 下个item (置于如何找到下个item case by case, 看具体实现)

所以下次调用__next__ 就会返回上一次调用的next item了

而且 iterator 对象也可以用 python built-in 函数next() 来调用

例如

	def test_iterator():list = [1, 2, 3]iter = list.__iter__()while True:try:print(next(iter))except StopIteration:break

上面代码我们多次调用next(iter) 也能实现遍历, 当尝试去获取最后1个元素的next() 对象时,会产生StopIteration Exception





简单归纳下:

真正 可以遍历的东西是 iterator 迭代器, 它必须实现__next__ 接口用于 返回当前的item并改变状态令当前item指向下个

而 iterable 可迭代对象 里面必须实现__iter__ 方法来内置1个iterator
这样iterable 可以被 for … in 来遍历

实际上, 大部分iterator对象, 除了实现__next__方法外, 还实现__Iter__ 方法但让其return 自身

    def __iter__(self):return self

这样 这个iterator 本身也是个iterable 。
而且官方貌似鼓励这么做, 但是个人不是很喜欢。




写1个自定义 iterator 和iterable 例子, python 中的链表

python 不像java 没有内置链表 link list 这个容器.

但是我们可以利用迭代器自己写1个, 当然只实现链表部分简单的功能。

实现这个链表需要3个类

  1. Node - 这个是1个具有链结构(尾部指针)的数据存储对象
  2. LinkListIterator - link list 的迭代器, 链表的遍历的核心(根据尾部指针来找到下1个元素)
  3. LinkList - Iterable , 它的__iter__ 会返回上面的iterator, 但是它还包括链表的一些操作, 例如构建链表, append 等




Node 类

很简单定义1个value 属性和 next 属性就行

class Node:def __init__(self, value):self._value = valueself._next = None@propertydef value(self):return self._value@propertydef next(self):return self._next@next.setterdef next(self, next):self._next = next@value.setterdef value(self, value):self._value = value

测试代码:

def test_node():logger.info("test_node")node = Node(1)assert node.value == 1node.value = 2assert node.value == 2def test_node_next():logger.info("test_node_next")node1 = Node(1)node2 = Node(2)node1.next = node2assert node1.next == node2assert node1.next.value == 2

置于这里的value 可以传入任意类的对象, 天然泛型了这是




LinkListIterator 类定义

上提到了, LinkListIterator
必须有1个current_node 对象保存当前的Node 是什么
而的__next__ 方法要做到两件事情

  1. return 当前node 的值(注意是Node 的属性value 而不是Node 对象本身)
  2. current_node 要指向下1个item

如果当前node 已经是找不到or None, 则raise StopIteration
为了也能用for … in 来循环它, 我还是让它也实现__iter__ return 其本身
所以这里LinkListIterator 实际是也是iterable(it 上而不是业务逻辑上)

class LinkListIterator:def __init__(self, _first_node) -> None:self._current_node = _first_nodedef __iter__(self):return selfdef __next__(self):if not self._current_node:raise StopIterationcurrent = self._current_nodeself._current_node = current.nextreturn current.value




LinkListIterator 类测试

我们写1个元素类作为测试
staff.py

from loguru import logger
class Staff:def __init__(self, id, name):self._id = idself._name = namedef __repr__(self):return "Staff({}, {})".format(self._id, self._name)

就两个属性id 和 name

测试代码:

def sample2():bill = Staff(2, "bill")jack = Staff(1, "jack")mike = Staff(3, "mike")bill_node = Node(bill)bill_node.next = Node(jack)bill_node.next.next = Node(mike)linkListIterator = LinkListIterator(bill_node)logger.info(linkListIterator._current_node.value) # bill# next() is a built-in function that will call the __next__() method of the iterator# in this case , it will return node's value but not node itselflogger.info(next(linkListIterator)) # jacklogger.info(next(linkListIterator)) # mikelogger.info(linkListIterator._current_node.value) # mike# if we want use for loop, we need to implement __iter__() method in LinkListIterator# otherwise we will get TypeError: 'LinkListIterator' object is not iterablefor staff in linkListIterator: logger.info(staff)

其实看出, linkListIterator 可以作为1个链表容器, 遍历对象, 但是并不优雅, 它向使用者暴露了Node 这个中间数据仓库类.




LinkList 类定义

为了真正的实现链表功能, 我们还需要1个容器类LinkList, 而它必须是1个iterator, 它只要让 iter 指向LinkListIterator就好

from loguru import loggerfrom src.iterator.sample_link_list.link_list_iterator import LinkListIterator
from src.iterator.sample_link_list.node import Nodeclass LinkList:def __init__(self, first) -> None:node = Node(first)_first_node = node_last_node = nodedef __init__(self, *values) -> None:if len(values) < 1:raise ValueError("At least one node is required")self._first_node = Node(values[0])current = self._first_nodefor i in range(1, len(values)):current.next = Node(values[i])current = current.nextself._last_node = currentdef __iter__(self):return LinkListIterator(self._first_node)# to print all nodes's value but not nodes themselvesdef print_nodes(self):current = self._first_nodewhile current:logger.info(current.value)current = current.nextdef get_length(self):current = self._first_nodecount = 0while current:count += 1current = current.nextreturn countdef append(self, value):if self.get_length() == 0:self._first_node = Node(value)self._last_node = self._first_nodeelse:self._last_node.next = Node(value)self._last_node = self._last_node.next

这个LinkList 实现了两种构造方法, 接受单个元素和一组元素作为参数
而且它在内部调用Node 对象, 向用户隐藏了这个细节

它有两个关键内部属性, 头指针 和 尾部指针
其实理论上有头指针就可以, 但是留有尾部指针可以大大 减少 append 元素方法的内部查询次数

我在这个类 只实现了 get_length() append() print_nodes() (其实可以用for loop 代替) 方法

有必要的话 删除元素, 中间插入元素, 检查元素是否存在的方法还是可以再加上的




LinkList 类测试

测试代码:


def sample3():bill = Staff(2, "bill")jack = Staff(1, "jack")mike = Staff(3, "mike")link_list = LinkList(jack)link_list.print_nodes()link_list = LinkList(bill, jack, mike);link_list.print_nodes()logger.info("length of link_list: {}".format(link_list.get_length())) # 3link_list.append(Staff(4, "Ted"))link_list.append(Staff(5, "Peter"))logger.info("length of link_list: {}".format(link_list.get_length())) # 5for i in link_list:logger.info(i)

可以见到, 使用iterable 比直接用iterator 优雅得多了, 符合人类正常的思维。

这篇关于理解python中的Iterator 和 Iterable 迭代器和可迭代对象的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/982057

相关文章

使用Python删除Excel中的行列和单元格示例详解

《使用Python删除Excel中的行列和单元格示例详解》在处理Excel数据时,删除不需要的行、列或单元格是一项常见且必要的操作,本文将使用Python脚本实现对Excel表格的高效自动化处理,感兴... 目录开发环境准备使用 python 删除 Excphpel 表格中的行删除特定行删除空白行删除含指定

深入理解Go语言中二维切片的使用

《深入理解Go语言中二维切片的使用》本文深入讲解了Go语言中二维切片的概念与应用,用于表示矩阵、表格等二维数据结构,文中通过示例代码介绍的非常详细,需要的朋友们下面随着小编来一起学习学习吧... 目录引言二维切片的基本概念定义创建二维切片二维切片的操作访问元素修改元素遍历二维切片二维切片的动态调整追加行动态

Python通用唯一标识符模块uuid使用案例详解

《Python通用唯一标识符模块uuid使用案例详解》Pythonuuid模块用于生成128位全局唯一标识符,支持UUID1-5版本,适用于分布式系统、数据库主键等场景,需注意隐私、碰撞概率及存储优... 目录简介核心功能1. UUID版本2. UUID属性3. 命名空间使用场景1. 生成唯一标识符2. 数

Python办公自动化实战之打造智能邮件发送工具

《Python办公自动化实战之打造智能邮件发送工具》在数字化办公场景中,邮件自动化是提升工作效率的关键技能,本文将演示如何使用Python的smtplib和email库构建一个支持图文混排,多附件,多... 目录前言一、基础配置:搭建邮件发送框架1.1 邮箱服务准备1.2 核心库导入1.3 基础发送函数二、

Python包管理工具pip的升级指南

《Python包管理工具pip的升级指南》本文全面探讨Python包管理工具pip的升级策略,从基础升级方法到高级技巧,涵盖不同操作系统环境下的最佳实践,我们将深入分析pip的工作原理,介绍多种升级方... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

基于Python实现一个图片拆分工具

《基于Python实现一个图片拆分工具》这篇文章主要为大家详细介绍了如何基于Python实现一个图片拆分工具,可以根据需要的行数和列数进行拆分,感兴趣的小伙伴可以跟随小编一起学习一下... 简单介绍先自己选择输入的图片,默认是输出到项目文件夹中,可以自己选择其他的文件夹,选择需要拆分的行数和列数,可以通过

Python中反转字符串的常见方法小结

《Python中反转字符串的常见方法小结》在Python中,字符串对象没有内置的反转方法,然而,在实际开发中,我们经常会遇到需要反转字符串的场景,比如处理回文字符串、文本加密等,因此,掌握如何在Pyt... 目录python中反转字符串的方法技术背景实现步骤1. 使用切片2. 使用 reversed() 函

Python中将嵌套列表扁平化的多种实现方法

《Python中将嵌套列表扁平化的多种实现方法》在Python编程中,我们常常会遇到需要将嵌套列表(即列表中包含列表)转换为一个一维的扁平列表的需求,本文将给大家介绍了多种实现这一目标的方法,需要的朋... 目录python中将嵌套列表扁平化的方法技术背景实现步骤1. 使用嵌套列表推导式2. 使用itert

使用Docker构建Python Flask程序的详细教程

《使用Docker构建PythonFlask程序的详细教程》在当今的软件开发领域,容器化技术正变得越来越流行,而Docker无疑是其中的佼佼者,本文我们就来聊聊如何使用Docker构建一个简单的Py... 目录引言一、准备工作二、创建 Flask 应用程序三、创建 dockerfile四、构建 Docker

Python使用vllm处理多模态数据的预处理技巧

《Python使用vllm处理多模态数据的预处理技巧》本文深入探讨了在Python环境下使用vLLM处理多模态数据的预处理技巧,我们将从基础概念出发,详细讲解文本、图像、音频等多模态数据的预处理方法,... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核