五表联筛:从五个表格中筛选出出现过两次及两次以上的人名

2023-11-07 09:36

本文主要是介绍五表联筛:从五个表格中筛选出出现过两次及两次以上的人名,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

五表联筛:从五个表格中筛选出出现过两次及两次以上的人名

需求分析:

1.把五个表格合并起来,合并之前必须确保五个表格的项是一样
2.合并之后查找哪些人出现过两次
3.最后输出结果

代码:

    def delete_from(self):# 读取五份表格文件table1 = pd.read_excel("外籍单列.xlsx",sheet_name='数据源')table2 = pd.read_excel("detele_from.xlsx",sheet_name='外聘教师')table3 = pd.read_excel("detele_from.xlsx",sheet_name='专任教师')table4 = pd.read_excel("detele_from.xlsx",sheet_name='行政人员')table5 = pd.read_excel("detele_from.xlsx",sheet_name='教辅人员')# 合并五份表格为一个大表格merged_table = pd.concat([table1, table2, table3, table4, table5])# 找出出现两次及两次以上的姓名duplicated_names = merged_table['姓名'][merged_table.duplicated(subset='姓名', keep=False)]# 输出这些姓名在哪些表格中for name in duplicated_names:tables_containing_name = [table_name for table_name, table inzip(['数据源', '外聘教师', '专任教师', '行政人员', '教辅人员'], [table1,table2, table3, table4, table5]) if name in table['姓名'].values]print(f"姓名 '{name}' 在表格{','.join(tables_containing_name)} 中出现了两次或更多次。")

重要知识点补充

tables_containing_name = [table_name for table_name, table inzip(['数据源', '外聘教师', '专任教师', '行政人员', '教辅人员'], [table1,table2, table3, table4, table5]) if name in table['姓名'].values]:
在这段代码中,tables_containing_name 是一个列表推导式。它通过迭代5个不同的表格('数据源', '外聘教师', '专任教师', '行政人员', '教辅人员')并检查每个表格中是否存在特定姓名。如果姓名在表格中出现了两次或更多次,就将这个表格的名称添加到列表中。duplicated_names = merged_table['姓名'][merged_table.duplicated(subset='姓名', keep=False)]
首先,merged_table.duplicated(subset='姓名', keep=False) 针对表中的“姓名”列创建了一个布尔索引,表示在此列中是否存在重复的姓名。keep=False 保留所有重复的行,而不仅仅保留第一个或最后一个。
随后,merged_table['姓名'][...] 选取了表中所有重复姓名的数据。这行代码返回了所有在“姓名”列中出现重复的姓名。

这篇关于五表联筛:从五个表格中筛选出出现过两次及两次以上的人名的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/362748

相关文章

hdu1254(嵌套bfs,两次bfs)

/*第一次做这种题感觉很有压力,思路还是有点混乱,总是wa,改了好多次才ac的思路:把箱子的移动当做第一层bfs,队列节点要用到当前箱子坐标(x,y),走的次数step,当前人的weizhi(man_x,man_y),要判断人能否将箱子推到某点时要嵌套第二层bfs(人的移动);代码如下:

Prompt - 将图片的表格转换成Markdown

Prompt - 将图片的表格转换成Markdown 0. 引言1. 提示词2. 原始版本 0. 引言 最近尝试将图片中的表格转换成Markdown格式,需要不断条件和优化提示词。记录一下调整好的提示词,以后在继续优化迭代。 1. 提示词 英文版本: You are an AI assistant tasked with extracting the content of

vue2实践:el-table实现由用户自己控制行数的动态表格

需求 项目中需要提供一个动态表单,如图: 当我点击添加时,便添加一行;点击右边的删除时,便删除这一行。 至少要有一行数据,但是没有上限。 思路 这种每一行的数据固定,但是不定行数的,很容易想到使用el-table来实现,它可以循环读取:data所绑定的数组,来生成行数据,不同的是: 1、table里面的每一个cell,需要放置一个input来支持用户编辑。 2、最后一列放置两个b

关于使用cspreadsheet读写EXCEL表格数据的问题

前几天项目有读写EXCEL表格的需求,我就找了大概有几种,大致分为:COM方法、ODBC方法、OLE方法、纯底层格式分析方法。由于COM方法要求必须安装有OFFICE的EXCEL组件,纯底层格式分析方法又很多功能需要自行去完善,所有最终选择了数据库的方法,用数据库的方法去存取xls格式的数据。网上有一个高手写的CSpreedSheet,看了一下提供的接口,感觉挺好用的。在使用的过程中发现几个

Android6.0以上权限申请

说明: 部分1:出自:http://jijiaxin89.com/2015/08/30/Android-s-Runtime-Permission/ android M 的名字官方刚发布不久,最终正式版即将来临! android在不断发展,最近的更新 M 非常不同,一些主要的变化例如运行时权限将有颠覆性影响。惊讶的是android社区鲜有谈论这事儿,尽管这事很重要或许在不远的将来会引

自动化表格处理的革命:智能文档系统技术解析

在当今数据驱动的商业环境中,表格数据的自动化处理成为了企业提高效率、降低成本的关键。企业智能文档系统在智能表格识别方面展现出卓越的性能,通过精准识别和处理各种通用表格,显著提升了企业文档管理的智能化水平。本文将深入探讨该系统在表格识别方面的关键技术和应用优势,以及如何通过行业定制化服务满足不同行业的需求。 1. 通用表格识别 智能文档系统通过先进的OCR技术和表格结构识别算法,能够精准

Ubuntu 16.04安装python3.6及其以上版本

Ubuntu16.04 自带python2.7 和3.5,若需要安装高版本需要添加源 网络搜索几个源 sudo add-apt-repository ppa:jonathonf/python-3.6sudo apt-get updatesudo apt-get install python3.6 这个已不存在 会报错如下 Cannot add PPA: 'ppa:~jonathonf

在Webmin上默认状态无法正常显示 Mariadb V11.02及以上版本

OS: Armbian OS 24.5.0 Bookworm Mariadb V11.02及以上版本 Webmin:V2.202 小众问题,主要是记录一下。 如题 Webmin 默认无法 Mariadb V11.02及以上版本 如果对 /etc/webmin/mysql/config 文件作相应调整就可以再现Mariadb管理界面。 路径+文件:/etc/webmin/mysql/config

python读取pdf内容写入到Excel表格中

要从每个 PDF 文件中提取全文内容,并将这些内容粘贴到一个新的或现有的表格中,你可以使用 Python 的库来完成这一任务。以下是一个简化的步骤和示例代码,展示如何实现这个过程。 步骤概述 读取文件夹中的所有 PDF 文件。提取每个 PDF 文件的全文内容。创建一个新的 Excel 表格或使用现有的表格。将提取的内容粘贴到表格中,每个 PDF 的内容放在一个垂直单元格中。保存表格文件。 所

Superset二次开发之Select 筛选器源码分析

路径:superset-frontend/src/filters/components/Select  源码文件: 功能点: 作用 交互 功能 index.ts作为模块的入口点,导出其他文件中定义的主要组件和函数。它使其他文件中的导出可以被外部模块使用。 SelectFilterPlugin.tsx 定义主要的插件类 SelectFilterPlugin 和组件 Sele