Python自动化办公(一) —— 根据PDF文件批量创建Word文档

2024-06-15 17:20

本文主要是介绍Python自动化办公(一) —— 根据PDF文件批量创建Word文档,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Python自动化办公(一) —— 根据PDF文件批量创建Word文档

在这里插入图片描述


在日常办公中,我们经常需要根据现有的PDF文件批量创建Word文档。手动操作不仅费时费力,而且容易出错。幸运的是,使用Python可以轻松实现这个过程。本文将介绍如何使用Python脚本遍历一个文件夹中的PDF文件,并根据每个PDF文件的名字创建对应的Word空白文件。

安装所需的Python库

首先,我们需要安装python-docx库来创建和操作Word文档。在终端或命令行中运行以下命令进行安装:

pip install python-docx
编写Python脚本

以下是一个完整的Python脚本,演示如何根据PDF文件名创建对应的Word空白文件:

import os
from docx import Documentdef create_word_from_pdf(pdf_folder, word_folder):# 检查保存Word文件的文件夹是否存在,如果不存在则创建if not os.path.exists(word_folder):os.makedirs(word_folder)# 遍历PDF文件夹中的所有文件for filename in os.listdir(pdf_folder):if filename.endswith(".pdf"):# 获取文件名(去掉扩展名)base_name = os.path.splitext(filename)[0]# 创建对应的Word文件名word_filename = base_name + ".docx"word_path = os.path.join(word_folder, word_filename)# 创建一个空白的Word文档doc = Document()# 保存Word文档doc.save(word_path)print(f"Created: {word_path}")# 设置PDF文件夹和保存Word文件的文件夹路径
pdf_folder = 'path/to/pdf_folder'
word_folder = 'path/to/word_folder'# 调用函数
create_word_from_pdf(pdf_folder, word_folder)
详细步骤解释
  1. 导入必要的模块

    • os: 用于文件和目录操作。
    • Documentpython-docx: 用于创建和操作Word文档。
  2. 定义函数 create_word_from_pdf

    • pdf_folder: 存储PDF文件的文件夹路径。
    • word_folder: 将创建的Word文件保存到这个文件夹路径。
  3. 检查和创建Word文件夹

    • 使用 os.makedirs 创建目标文件夹,如果它不存在的话。
  4. 遍历PDF文件夹

    • 使用 os.listdir 列出文件夹中的所有文件,并过滤出以 .pdf 结尾的文件。
  5. 生成Word文件名

    • 使用 os.path.splitext 获取文件名(去掉扩展名),并生成对应的Word文件名。
  6. 创建空白Word文档并保存

    • 使用 Document 创建一个空白的Word文档。
    • 使用 doc.save 保存Word文档到指定路径。
运行脚本

将上面的代码保存为一个Python脚本文件(例如 create_word_from_pdf.py),然后在终端或命令行中运行:

python create_word_from_pdf.py

确保你已经设置了正确的 pdf_folderword_folder 路径。例如:

pdf_folder = '/path/to/your/pdf_folder'
word_folder = '/path/to/your/word_folder'

通过这个脚本,你可以根据PDF文件名在指定文件夹中创建对应的Word空白文件。如果你有任何特定需求或问题,请在评论区告诉我!


这篇关于Python自动化办公(一) —— 根据PDF文件批量创建Word文档的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1064091

相关文章

python: 多模块(.py)中全局变量的导入

文章目录 global关键字可变类型和不可变类型数据的内存地址单模块(单个py文件)的全局变量示例总结 多模块(多个py文件)的全局变量from x import x导入全局变量示例 import x导入全局变量示例 总结 global关键字 global 的作用范围是模块(.py)级别: 当你在一个模块(文件)中使用 global 声明变量时,这个变量只在该模块的全局命名空

【专题】2024飞行汽车技术全景报告合集PDF分享(附原数据表)

原文链接: https://tecdat.cn/?p=37628 6月16日,小鹏汇天旅航者X2在北京大兴国际机场临空经济区完成首飞,这也是小鹏汇天的产品在京津冀地区进行的首次飞行。小鹏汇天方面还表示,公司准备量产,并计划今年四季度开启预售小鹏汇天分体式飞行汽车,探索分体式飞行汽车城际通勤。阅读原文,获取专题报告合集全文,解锁文末271份飞行汽车相关行业研究报告。 据悉,业内人士对飞行汽车行业

活用c4d官方开发文档查询代码

当你问AI助手比如豆包,如何用python禁止掉xpresso标签时候,它会提示到 这时候要用到两个东西。https://developers.maxon.net/论坛搜索和开发文档 比如这里我就在官方找到正确的id描述 然后我就把参数标签换过来

【Python编程】Linux创建虚拟环境并配置与notebook相连接

1.创建 使用 venv 创建虚拟环境。例如,在当前目录下创建一个名为 myenv 的虚拟环境: python3 -m venv myenv 2.激活 激活虚拟环境使其成为当前终端会话的活动环境。运行: source myenv/bin/activate 3.与notebook连接 在虚拟环境中,使用 pip 安装 Jupyter 和 ipykernel: pip instal

pdfmake生成pdf的使用

实际项目中有时会有根据填写的表单数据或者其他格式的数据,将数据自动填充到pdf文件中根据固定模板生成pdf文件的需求 文章目录 利用pdfmake生成pdf文件1.下载安装pdfmake第三方包2.封装生成pdf文件的共用配置3.生成pdf文件的文件模板内容4.调用方法生成pdf 利用pdfmake生成pdf文件 1.下载安装pdfmake第三方包 npm i pdfma

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

在cscode中通过maven创建java项目

在cscode中创建java项目 可以通过博客完成maven的导入 建立maven项目 使用快捷键 Ctrl + Shift + P 建立一个 Maven 项目 1 Ctrl + Shift + P 打开输入框2 输入 "> java create"3 选择 maven4 选择 No Archetype5 输入 域名6 输入项目名称7 建立一个文件目录存放项目,文件名一般为项目名8 确定

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

Java 创建图形用户界面(GUI)入门指南(Swing库 JFrame 类)概述

概述 基本概念 Java Swing 的架构 Java Swing 是一个为 Java 设计的 GUI 工具包,是 JAVA 基础类的一部分,基于 Java AWT 构建,提供了一系列轻量级、可定制的图形用户界面(GUI)组件。 与 AWT 相比,Swing 提供了许多比 AWT 更好的屏幕显示元素,更加灵活和可定制,具有更好的跨平台性能。 组件和容器 Java Swing 提供了许多

计算机毕业设计 大学志愿填报系统 Java+SpringBoot+Vue 前后端分离 文档报告 代码讲解 安装调试

🍊作者:计算机编程-吉哥 🍊简介:专业从事JavaWeb程序开发,微信小程序开发,定制化项目、 源码、代码讲解、文档撰写、ppt制作。做自己喜欢的事,生活就是快乐的。 🍊心愿:点赞 👍 收藏 ⭐评论 📝 🍅 文末获取源码联系 👇🏻 精彩专栏推荐订阅 👇🏻 不然下次找不到哟~Java毕业设计项目~热门选题推荐《1000套》 目录 1.技术选型 2.开发工具 3.功能