【数据分析面试】44.分析零售客户群体(Python 集合Set的用法)

本文主要是介绍【数据分析面试】44.分析零售客户群体(Python 集合Set的用法),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

题目

假设你是一家在线零售商的数据库管理员,需要分析两类客户的数据。一个集合 purchased_customers 包含在最近一次促销活动中购买了商品的客户ID,另一个集合 newsletter_subscribers 包含订阅了新闻通讯的客户ID。编写一个函数 analyze_customers,返回一个包含以下内容的字典:

  • 既购买了商品又订阅了新闻通讯的客户ID集合
  • 只购买了商品但没有订阅新闻通讯的客户ID集合
  • 只订阅了新闻通讯但没有购买商品的客户ID集合
  • 购买商品和订阅新闻通讯的所有唯一客户ID集合

示例:

输入:

purchased_customers = {1001, 1002, 1003, 1004}
newsletter_subscribers = {1003, 1004, 1005, 1006}

输出:

def analyze_customers(purchased_customers, newsletter_subscribers) 
-> 
{'both': {1003, 1004},'only_purchased': {1001, 1002},'only_subscribed': {1005, 1006},'all_customers': {1001, 1002, 1003, 1004, 1005, 1006}
}

答案

解题思路

考虑使用python中关于集合的操作。注意题目要求生成一个字典,想想字典和集合有什么不同。

答案代码

def analyze_customers(purchased_customers, newsletter_subscribers):return {"both": purchased_customers & newsletter_subscribers,"only_purchased": purchased_customers - newsletter_subscribers,"only_subscribed": newsletter_subscribers - purchased_customers,"all_customers": purchased_customers | newsletter_subscribers}purchased_customers = {1001, 1002, 1003, 1004}
newsletter_subscribers = {1003, 1004, 1005, 1006}
result = analyze_customers(purchased_customers, newsletter_subscribers)
print(result)

集合(Set)的用法

集合(Set)用于存储多个不重复的元素。集合是无序的,并且元素不能重复。集合支持各种数学集合操作,如并集、交集和差集。

  1. 创建集合:使用花括号 {}或者 set()函数 。注意,空集合只能使用 set() 创建,因为 {} 被用来创建空字典。
  2. 集合的操作
    • 添加元素 使用 add() 方法
    • 移除元素:使用 remove()discard() 方法移除元素。区别是 remove() 在元素不存在时会引发 KeyError,而 discard() 不会
fruits = {"apple", "banana"}# 添加元素
fruits.add("cherry")
print(fruits)  # 输出: {'apple', 'banana', 'cherry'}# 移除元素
fruits.remove("banana")
print(fruits)  # 输出: {'apple', 'cherry'}fruits.discard("banana")  # 不引发错误
  1. 集合的运算
    • 并集:使用 union() 方法或 | 运算符
    • 交集:使用 intersection() 方法或 & 运算符
    • 差集:使用 difference() 方法或 - 运算符
    • 对称差集:使用 symmetric_difference() 方法或 ^ 运算符。(对称差集是所有属于一个集合但不属于另一个集合的元素。)
A = {1, 2, 3}
B = {3, 4, 5}# 并集
print(A.union(B))  # 输出: {1, 2, 3, 4, 5}
print(A | B)       # 输出: {1, 2, 3, 4, 5}# 交集
print(A.intersection(B))  # 输出: {3}
print(A & B)              # 输出: {3}# 差集
print(A.difference(B))  # 输出: {1, 2}
print(A - B)            # 输出: {1, 2}# 对称差集
print(A.symmetric_difference(B))  # 输出: {1, 2, 4, 5}
print(A ^ B)                      # 输出: {1, 2, 4, 5}

更多详细答案可关注公众号查阅。
在这里插入图片描述

这篇关于【数据分析面试】44.分析零售客户群体(Python 集合Set的用法)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/992639

相关文章

Python调用Orator ORM进行数据库操作

《Python调用OratorORM进行数据库操作》OratorORM是一个功能丰富且灵活的PythonORM库,旨在简化数据库操作,它支持多种数据库并提供了简洁且直观的API,下面我们就... 目录Orator ORM 主要特点安装使用示例总结Orator ORM 是一个功能丰富且灵活的 python O

Python使用国内镜像加速pip安装的方法讲解

《Python使用国内镜像加速pip安装的方法讲解》在Python开发中,pip是一个非常重要的工具,用于安装和管理Python的第三方库,然而,在国内使用pip安装依赖时,往往会因为网络问题而导致速... 目录一、pip 工具简介1. 什么是 pip?2. 什么是 -i 参数?二、国内镜像源的选择三、如何

JavaScript中的reduce方法执行过程、使用场景及进阶用法

《JavaScript中的reduce方法执行过程、使用场景及进阶用法》:本文主要介绍JavaScript中的reduce方法执行过程、使用场景及进阶用法的相关资料,reduce是JavaScri... 目录1. 什么是reduce2. reduce语法2.1 语法2.2 参数说明3. reduce执行过程

python使用fastapi实现多语言国际化的操作指南

《python使用fastapi实现多语言国际化的操作指南》本文介绍了使用Python和FastAPI实现多语言国际化的操作指南,包括多语言架构技术栈、翻译管理、前端本地化、语言切换机制以及常见陷阱和... 目录多语言国际化实现指南项目多语言架构技术栈目录结构翻译工作流1. 翻译数据存储2. 翻译生成脚本

Springboot中分析SQL性能的两种方式详解

《Springboot中分析SQL性能的两种方式详解》文章介绍了SQL性能分析的两种方式:MyBatis-Plus性能分析插件和p6spy框架,MyBatis-Plus插件配置简单,适用于开发和测试环... 目录SQL性能分析的两种方式:功能介绍实现方式:实现步骤:SQL性能分析的两种方式:功能介绍记录

如何通过Python实现一个消息队列

《如何通过Python实现一个消息队列》这篇文章主要为大家详细介绍了如何通过Python实现一个简单的消息队列,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录如何通过 python 实现消息队列如何把 http 请求放在队列中执行1. 使用 queue.Queue 和 reque

Python如何实现PDF隐私信息检测

《Python如何实现PDF隐私信息检测》随着越来越多的个人信息以电子形式存储和传输,确保这些信息的安全至关重要,本文将介绍如何使用Python检测PDF文件中的隐私信息,需要的可以参考下... 目录项目背景技术栈代码解析功能说明运行结php果在当今,数据隐私保护变得尤为重要。随着越来越多的个人信息以电子形

使用Python快速实现链接转word文档

《使用Python快速实现链接转word文档》这篇文章主要为大家详细介绍了如何使用Python快速实现链接转word文档功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 演示代码展示from newspaper import Articlefrom docx import

Python Jupyter Notebook导包报错问题及解决

《PythonJupyterNotebook导包报错问题及解决》在conda环境中安装包后,JupyterNotebook导入时出现ImportError,可能是由于包版本不对应或版本太高,解决方... 目录问题解决方法重新安装Jupyter NoteBook 更改Kernel总结问题在conda上安装了

Python如何计算两个不同类型列表的相似度

《Python如何计算两个不同类型列表的相似度》在编程中,经常需要比较两个列表的相似度,尤其是当这两个列表包含不同类型的元素时,下面小编就来讲讲如何使用Python计算两个不同类型列表的相似度吧... 目录摘要引言数字类型相似度欧几里得距离曼哈顿距离字符串类型相似度Levenshtein距离Jaccard相