将一个文件夹的pdf都去掉第一页后生成在另一个文件夹

2024-04-20 15:20

本文主要是介绍将一个文件夹的pdf都去掉第一页后生成在另一个文件夹,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

一.前言

二.环境配置

三.完整代码


一.前言

在日常的工作和学习中,我们经常需要处理大量的PDF文件。有时候,我们可能希望将一个文件夹中的所有PDF文件进行一些特定的操作,例如去掉每个PDF文件的第一页。

为了解决这个问题,本项目旨在提供一个自动化的解决方案,可以批量处理一个文件夹中的PDF文件,并将处理后的文件生成到另一个目标文件夹中。

该项目采用了Python编程语言,并利用了一些强大的库来实现功能。其中,我们使用了pdf2image库将PDF文件转换为图片格式,然后再利用img2pdf库将图片重新转换为PDF文件。通过这种方式,我们可以轻松地对每个PDF文件进行操作并去除第一页。

同时,为了确保项目的灵活性和易用性,我们为用户提供了可配置的参数,包括输入文件夹路径、输出文件夹路径等,以便根据实际需求进行自定义设置。

通过本项目,您将能够快速、高效地处理一个文件夹中的PDF文件,去掉每个文件的第一页,并生成到指定的目标文件夹中。这将极大地提升您的工作效率和操作便利性。

请尽情享受本项目带来的便利,希望它能对您的工作和学习有所帮助!

二.环境配置

安装好这个:

Release Release 24.02.0-0 · oschwartz10612/poppler-windows · GitHub

三.完整代码

import os
import glob
from pdf2image import convert_from_path
from PIL import Image
import img2pdfdef remove_first_page(input_folder, output_folder):# 获取目录中的所有PDF文件pdf_files = glob.glob(os.path.join(input_folder, '*.pdf'))for pdf_file in pdf_files:# 将PDF文件转换为图片images = convert_from_path(pdf_file)# 删除第一页图片images = images[1:]# 创建输出文件夹路径及新PDF文件名output_file = os.path.join(output_folder, os.path.basename(pdf_file))# 创建临时文件夹保存图片temp_folder = './temp'os.makedirs(temp_folder, exist_ok=True)# 保存图片到临时文件夹for i, image in enumerate(images):image.save(os.path.join(temp_folder, f'{i}.jpg'), 'JPEG')# 将图片转换回PDF并保存with open(output_file, 'wb') as f:f.write(img2pdf.convert([os.path.join(temp_folder, page) for page in os.listdir(temp_folder)]))# 删除临时文件夹及其中的图片for file in os.listdir(temp_folder):os.remove(os.path.join(temp_folder, file))os.rmdir(temp_folder)
input_dir = 'input'
output_dir = 'output'remove_first_page(input_dir, output_dir)

这篇关于将一个文件夹的pdf都去掉第一页后生成在另一个文件夹的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/920615

相关文章

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

【专题】2024飞行汽车技术全景报告合集PDF分享(附原数据表)

原文链接: https://tecdat.cn/?p=37628 6月16日,小鹏汇天旅航者X2在北京大兴国际机场临空经济区完成首飞,这也是小鹏汇天的产品在京津冀地区进行的首次飞行。小鹏汇天方面还表示,公司准备量产,并计划今年四季度开启预售小鹏汇天分体式飞行汽车,探索分体式飞行汽车城际通勤。阅读原文,获取专题报告合集全文,解锁文末271份飞行汽车相关行业研究报告。 据悉,业内人士对飞行汽车行业

pdfmake生成pdf的使用

实际项目中有时会有根据填写的表单数据或者其他格式的数据,将数据自动填充到pdf文件中根据固定模板生成pdf文件的需求 文章目录 利用pdfmake生成pdf文件1.下载安装pdfmake第三方包2.封装生成pdf文件的共用配置3.生成pdf文件的文件模板内容4.调用方法生成pdf 利用pdfmake生成pdf文件 1.下载安装pdfmake第三方包 npm i pdfma

poj 1258 Agri-Net(最小生成树模板代码)

感觉用这题来当模板更适合。 题意就是给你邻接矩阵求最小生成树啦。~ prim代码:效率很高。172k...0ms。 #include<stdio.h>#include<algorithm>using namespace std;const int MaxN = 101;const int INF = 0x3f3f3f3f;int g[MaxN][MaxN];int n

poj 1287 Networking(prim or kruscal最小生成树)

题意给你点与点间距离,求最小生成树。 注意点是,两点之间可能有不同的路,输入的时候选择最小的,和之前有道最短路WA的题目类似。 prim代码: #include<stdio.h>const int MaxN = 51;const int INF = 0x3f3f3f3f;int g[MaxN][MaxN];int P;int prim(){bool vis[MaxN];

poj 2349 Arctic Network uva 10369(prim or kruscal最小生成树)

题目很麻烦,因为不熟悉最小生成树的算法调试了好久。 感觉网上的题目解释都没说得很清楚,不适合新手。自己写一个。 题意:给你点的坐标,然后两点间可以有两种方式来通信:第一种是卫星通信,第二种是无线电通信。 卫星通信:任何两个有卫星频道的点间都可以直接建立连接,与点间的距离无关; 无线电通信:两个点之间的距离不能超过D,无线电收发器的功率越大,D越大,越昂贵。 计算无线电收发器D

hdu 1102 uva 10397(最小生成树prim)

hdu 1102: 题意: 给一个邻接矩阵,给一些村庄间已经修的路,问最小生成树。 解析: 把已经修的路的权值改为0,套个prim()。 注意prim 最外层循坏为n-1。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstri

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

poj 3723 kruscal,反边取最大生成树。

题意: 需要征募女兵N人,男兵M人。 每征募一个人需要花费10000美元,但是如果已经招募的人中有一些关系亲密的人,那么可以少花一些钱。 给出若干的男女之间的1~9999之间的亲密关系度,征募某个人的费用是10000 - (已经征募的人中和自己的亲密度的最大值)。 要求通过适当的招募顺序使得征募所有人的费用最小。 解析: 先设想无向图,在征募某个人a时,如果使用了a和b之间的关系

Thymeleaf:生成静态文件及异常处理java.lang.NoClassDefFoundError: ognl/PropertyAccessor

我们需要引入包: <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-thymeleaf</artifactId></dependency><dependency><groupId>org.springframework</groupId><artifactId>sp