Python中的集合魔法:解锁高效数据处理的秘密

2024-09-02 22:44

本文主要是介绍Python中的集合魔法:解锁高效数据处理的秘密,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

引言

集合是一种不允许重复元素的数据结构,并且其内部元素无序排列。这种特性使得集合在某些场景下表现得极为出色:

  • 去重:快速去除列表或数组中的重复项。
  • 交集、并集、差集等运算:用于比较两个或多个集合间的关系,非常适用于权限控制、用户管理等领域。
  • 性能优势:相较于列表,集合在查找元素时速度更快,平均时间复杂度为O(1)。

基础语法介绍

创建集合

在Python中创建一个空集合需要使用set()函数,而直接使用花括号 {} 会创建一个空字典而不是空集合。若想创建含有初始元素的集合,则可以直接将这些元素放入花括号内:

# 创建空集合
empty_set = set()# 创建非空集合
fruits = {'apple', 'banana', 'cherry'}

基本操作

集合支持添加、删除元素以及判断元素是否存在于集合中等操作:

# 添加元素
fruits.add('orange')# 删除元素
fruits.remove('banana')  # 若元素不存在会抛出KeyError异常# 判断元素是否存在
print('apple' in fruits)  # 输出 True 或 False

基础实例

假设我们需要从一个学生名单中找出所有姓“张”的同学,可以利用集合来简化这个任务:

students = ['张三', '李四', '王五', '张六']
zhangs = {name for name in students if name.startswith('张')}
print(zhangs)  # 输出 {'张三', '张六'}

进阶实例

在处理更复杂的业务逻辑时,集合同样能发挥巨大作用。例如,在实现好友推荐系统时,可以通过计算用户之间的共同兴趣点来推荐新朋友:

def recommend_friends(user_interests, all_users):user_set = set(user_interests[user])recommended = []for u in all_users:if u != user:  # 不推荐自己other_interests = set(user_interests[u])common_interests = user_set & other_interests  # 交集if len(common_interests) > 0:recommended.append((u, len(common_interests)))return sorted(recommended, key=lambda x: x[1], reverse=True)# 示例数据
user_interests = {'Alice': ['Music', 'Art', 'Travel'],'Bob': ['Sports', 'Cooking', 'Travel'],...
}

实战案例

在某电商网站后台管理系统中,我们面临一个挑战:如何快速定位哪些商品既属于热销商品又属于库存紧张的商品?通过集合操作,这个问题变得迎刃而解:

hot_items = {'item1', 'item2', 'item3'}
low_stock_items = {'item2', 'item3', 'item4'}# 找出同时满足条件的商品
critical_items = hot_items & low_stock_items
print(critical_items)  # 输出 {'item2', 'item3'}

扩展讨论

除了上述介绍的基本功能外,Python还提供了更多与集合相关的高级特性,比如frozenset,它是一个不可变版本的集合类型,非常适合用于作为字典的键或者作为其他集合的元素。此外,集合还支持数学中的对称差集运算(^),即两个集合中独有的元素组成的集合。

这篇关于Python中的集合魔法:解锁高效数据处理的秘密的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1131284

相关文章

python: 多模块(.py)中全局变量的导入

文章目录 global关键字可变类型和不可变类型数据的内存地址单模块(单个py文件)的全局变量示例总结 多模块(多个py文件)的全局变量from x import x导入全局变量示例 import x导入全局变量示例 总结 global关键字 global 的作用范围是模块(.py)级别: 当你在一个模块(文件)中使用 global 声明变量时,这个变量只在该模块的全局命名空

高效+灵活,万博智云全球发布AWS无代理跨云容灾方案!

摘要 近日,万博智云推出了基于AWS的无代理跨云容灾解决方案,并与拉丁美洲,中东,亚洲的合作伙伴面向全球开展了联合发布。这一方案以AWS应用环境为基础,将HyperBDR平台的高效、灵活和成本效益优势与无代理功能相结合,为全球企业带来实现了更便捷、经济的数据保护。 一、全球联合发布 9月2日,万博智云CEO Michael Wong在线上平台发布AWS无代理跨云容灾解决方案的阐述视频,介绍了

嵌入式QT开发:构建高效智能的嵌入式系统

摘要: 本文深入探讨了嵌入式 QT 相关的各个方面。从 QT 框架的基础架构和核心概念出发,详细阐述了其在嵌入式环境中的优势与特点。文中分析了嵌入式 QT 的开发环境搭建过程,包括交叉编译工具链的配置等关键步骤。进一步探讨了嵌入式 QT 的界面设计与开发,涵盖了从基本控件的使用到复杂界面布局的构建。同时也深入研究了信号与槽机制在嵌入式系统中的应用,以及嵌入式 QT 与硬件设备的交互,包括输入输出设

高效录音转文字:2024年四大工具精选!

在快节奏的工作生活中,能够快速将录音转换成文字是一项非常实用的能力。特别是在需要记录会议纪要、讲座内容或者是采访素材的时候,一款优秀的在线录音转文字工具能派上大用场。以下推荐几个好用的录音转文字工具! 365在线转文字 直达链接:https://www.pdf365.cn/ 365在线转文字是一款提供在线录音转文字服务的工具,它以其高效、便捷的特点受到用户的青睐。用户无需下载安装任何软件,只

【Python编程】Linux创建虚拟环境并配置与notebook相连接

1.创建 使用 venv 创建虚拟环境。例如,在当前目录下创建一个名为 myenv 的虚拟环境: python3 -m venv myenv 2.激活 激活虚拟环境使其成为当前终端会话的活动环境。运行: source myenv/bin/activate 3.与notebook连接 在虚拟环境中,使用 pip 安装 Jupyter 和 ipykernel: pip instal

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

uva 11178 计算集合模板题

题意: 求三角形行三个角三等分点射线交出的内三角形坐标。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstring>#include <cmath>#include <stack>#include <vector>#include <

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

nudepy,一个有趣的 Python 库!

更多资料获取 📚 个人网站:ipengtao.com 大家好,今天为大家分享一个有趣的 Python 库 - nudepy。 Github地址:https://github.com/hhatto/nude.py 在图像处理和计算机视觉应用中,检测图像中的不适当内容(例如裸露图像)是一个重要的任务。nudepy 是一个基于 Python 的库,专门用于检测图像中的不适当内容。该

【C++高阶】C++类型转换全攻略:深入理解并高效应用

📝个人主页🌹:Eternity._ ⏩收录专栏⏪:C++ “ 登神长阶 ” 🤡往期回顾🤡:C++ 智能指针 🌹🌹期待您的关注 🌹🌹 ❀C++的类型转换 📒1. C语言中的类型转换📚2. C++强制类型转换⛰️static_cast🌞reinterpret_cast⭐const_cast🍁dynamic_cast 📜3. C++强制类型转换的原因📝