使用Python从PPT文档中提取图片和图片信息(如坐标、宽度和高度等)

2025-04-24 05:50

本文主要是介绍使用Python从PPT文档中提取图片和图片信息(如坐标、宽度和高度等),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《使用Python从PPT文档中提取图片和图片信息(如坐标、宽度和高度等)》PPT是一种高效的信息展示工具,广泛应用于教育、商务和设计等多个领域,PPT文档中常常包含丰富的图片内容,这些图片不仅提升了...

一、引言

PPT是一种高效的信息展示工具,广泛应用于教育、商务js和设计等多个领域。PPT文档中常常包含丰富的图片内容,这些图片不仅提升了视觉效果,也增强了信息的传递效率。将这些图片从PPT中提取出javascript来,可以再次用于其他文档、宣传册、网站或社交媒体内容中。

本文将介绍如何使用 Python 实现自动化提取 PowerPoint(PPT 或 PPTX)文件中的图片。主要内容包括提取PPT背景图片(幻灯片背景图片和幻灯片模板背景图片)、从幻灯片形状中提取图片,从整个PPT文档中提取图片,以及提取图片的相关信息,如坐标位置、宽度和高度等。

二、环境与工具

在提取 PPT 中的图片之前,需要确保你的计算机上已安装 Python。如果没有安装,可前往 Python 官方网站下载安装。

安装完成后,需要安装 Spire.Presentation for Python 库,该库主要用于生成、操作和转换PPT演示文稿。安装步骤如下:

  • 打开终端
  • 输入以下命令并回车:
pip install spire.presentation

三、Python 提取PPT背景图片

PowerPoint 幻灯片通常包含美观的背景图片,这些图片可能存在于单个幻灯片中,也可能存在于幻灯片母版(模板)中。提取这些背景图片,对于设计师、教育工作者或需要复用素材的用户来说非常有用。

3.1 提取幻灯片背景图片

要提取PPT幻灯片中的背景图片,可通过以下步骤http://www.chinasem.cn来实现:

  • 初始化 Presentation 类的实例,并使用 Presentation.LoadFromFile() 方法加载PPT或PPTX文件。
  • 通过Presentation.Slides集合遍历文件中的幻灯片。
    • 通过 ISlide.SlideBackground.Fill.FillType 属性判断每张幻灯片的背景填充类型是否为图片填充。
      • 若为图片填充,则提取背景图片并保存为图片文件。

实现代码:

from spire.presentation import *
import os
 
def extract_background_images_from_slides(ppt_path, output_folder):
    """从幻灯片中提取背景图片"""
    presentation = Presentation()
    presentation.LoadFromFile(ppt_path)
    os.makedirs(output_folder, exist_ok=True)
 
    for i, slide in enumerate(presentation.Slides):
        bgd = slide.SlideBackground
        if bgd.Fill.FillType == FillFormatType.Picture:
            image_data = bgd.Fill.PictureFill.Picture.EmbedImage
            output_path = os.path.join(output_folder, f"幻灯片背景_{i}.png")
     China编程       image_data.Image.Save(output_path)
 
    presentation.Dispose()
 
# 使用示例
extract_background_images_from_slides("测试.pptx", "图片")

3.2 提取幻灯片母版背景图片

从幻灯片母版中提取背景图片的步骤与以上步骤类似,只是遍历的集合改为Presentation.Masters。具体步骤如下:

  • 初始化 Presentation 类的实例,并使用 Presentation.LoadFromFile() 方法加载PPT或PPTX文件。
  • 通过Presentation.Masters集合遍历文件中的幻灯片母版。
    • 通过IMasterSlide.SlideBackground.Fill.FillType属性判断每个幻灯片母版的背景填充类型是否为图片填充。
      • 若为图片填充,则提取背景图片并保存为图片文件。

实现代码:

from spire.presentation import *
import os
 
def extract_background_images_from_slide_masters(ppt_path, output_folder):
    """从幻灯片母版中提取背景图片"""
    presentation = Presentation()
    presentation.LoadFromFile(ppt_path)
    os.makedirs(output_folder, exist_ok=True)
 
    for i, slide_master in enumerate(presentation.Masters):
        bgd = slide_master.SlideBackground
        if bgd.Fill.FillType == FillFormatType.Picture:
            image_data = bgd.Fill.PictureFill.Picture.EmbedImage
            output_path = os.path.join(output_folder, f"幻灯片母版背景_{i}.png")
            image_data.Image.Save(output_path)
 
    presentation.Dispose()
 
# 使用示例
extract_background_images_from_slide_masters("测试.pptx", "图片")

四、Python 从PPT幻灯片的形状中提取图片

PPT 幻灯片中的图片也可能以形状对象的形式存在,提取步骤如下:

  • 初始化 Presentation 类的实例,并使用 Presentation.LoadFromFile() 方法加载PPT或PPTX文件。
  • 通过Presentation.Slides集合遍历文件中的幻灯片。
  • 通过ISlide.Shapes集合遍历每张幻灯片中的所有形状。
  • 判断形状是否为 PictureShape 或 SlidePicture 对象。
    • 若为PictureShape 或 SlidePicture 对象,则提取图片并保存为图片文件。

实现代码

from spire.presentation import *
import os
 
def extract_images_from_shapes(ppt_path, output_folder):
    """从幻灯片形状中提取图片"""
    presentation = Presentation()
    presentation.LoadFromFile(ppt_path)
    os.makedirs(output_folder, exist_ok=True)
 
    img_count = 0
 
    for slide_index, slide in enumerate(presentation.Slides):
        for shape_index, shape in enumerate(slide.Shapes):
            if isinstance(shape, PictureShape):
                image_data = shape.EmbedImage
            elif isinstance(shape, SlidePicture):
                image_data = shape.PictureFill.Picture.EmbedImage
            else:
                continue
 
            img_count += 1
            output_path = os.path.join(output_folder, f"图片_{img_count}.png")
            image_data.Image.Save(output_path)
 
    presentation.Dispose()

五、Python 提取PPT中的图片信息(如坐标、宽度和高度等)

在进行 PPT文档分析或自动化处理时,可能需要获取图片的具体信息,例如:

  • 坐标(相对于幻灯片左上角的位置)
  • 尺寸(图片的宽度和高度,单位为磅)

可通过以下编程China编程步骤提取这些信息:

  • 初始化 Presentation 类的实例,并使用 Presentation.LoadFromFile() 方法加载PPT或PPTX文件。
  • 通过Presentation.Slides集合遍历文件中的幻灯片。
  • 通过ISlide.Shapes集合遍历每张幻灯片中的所有形状。
  • 判断形状是否为 PictureShape 或 SlidePicture 对象。
    • 若为PictureShape 或 SlidePicture 对象,则获取当前图片的X/Y坐标、宽度、高度和所在幻灯片等信息。

实现代码

from spire.presentation import *
 
def extract_image_metadata(ppt_path):
    """获取 PPT 中图片的信息(所在幻灯片、坐标位置、宽度与高度等)"""
    presentation = Presentation()
    presentation.LoadFromFile(ppt_path)
 
    for slide_index, slide in enumerate(presentation.Slides):
        for shape_index, shape in enumerate(slide.Shapes):
            if isinstance(shape, PictureShape) or isinstance(shape, SlidePicture):
                x = shape.Frame.Rectangle.X
                y = shape.Frame.Rectangle.Y
                width = shape.Frame.Rectangle.Width
                height = shape.Frame.Rectangle.Height
                print(f"幻灯片 {slide_index + 1},形状 {shape_index + 1}:X={x}, Y={y}, 宽度={width}, 高度={height}")
 
    presentation.Dispose()
 
# 使用示例
extract_image_metadata("测试.pptx")

六、Python 从整个PPT文档中提取图片

如果要从整个PPT文档中提取图片,可遍历 Presentation.Images 集合。具体步骤如下:

  • 初始化 Presentation 类的实例,并使用 Presentation.LoadFromFile() 方法加载PPT或PPTX文件。
  • 使用Presentation.Images 集合遍历PPT文档中的图片。
    • 提取每张图片并保存为图片文件。

实现代码

from spire.presentation import *
import os
 
def extract_images_from_presentation(ppt_path, output_folder):
    """提取整个PPT文档中的图片"""
    presentation = Presentation()
    presentation.LoadFromFile(ppt_path)
    os.makedirs(output_folder, exist_ok=True)
 
    for i, image in enumerate(presentation.Images):
        output_path = os.path.join(output_folder, f"图片_{i}.png")
        image.Image.Save(output_path)
 
    presentation.Dispose()
 
# 使用示例
extract_images_from_presentation("测试.pptx", "图片")

以上就是使用Python从PPT中提取图片和图片信息的全部内容。

到此这篇关于使用Python从PPT文档中提取图片和图片信息(如坐标、宽度和高度等)的文章就介绍到这了,更多相关Python提取PPT图片和图片信息内容请搜索China编程(www.chinasem.cn)以前的文章或继续浏览下面的相关文章希望大家以后多多支持China编程(www.chinasem.cn)!

这篇关于使用Python从PPT文档中提取图片和图片信息(如坐标、宽度和高度等)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1154346

相关文章

Python实现图片分割的多种方法总结

《Python实现图片分割的多种方法总结》图片分割是图像处理中的一个重要任务,它的目标是将图像划分为多个区域或者对象,本文为大家整理了一些常用的分割方法,大家可以根据需求自行选择... 目录1. 基于传统图像处理的分割方法(1) 使用固定阈值分割图片(2) 自适应阈值分割(3) 使用图像边缘检测分割(4)

Android实现在线预览office文档的示例详解

《Android实现在线预览office文档的示例详解》在移动端展示在线Office文档(如Word、Excel、PPT)是一项常见需求,这篇文章为大家重点介绍了两种方案的实现方法,希望对大家有一定的... 目录一、项目概述二、相关技术知识三、实现思路3.1 方案一:WebView + Office Onl

一文带你搞懂Python中__init__.py到底是什么

《一文带你搞懂Python中__init__.py到底是什么》朋友们,今天我们来聊聊Python里一个低调却至关重要的文件——__init__.py,有些人可能听说过它是“包的标志”,也有人觉得它“没... 目录先搞懂 python 模块(module)Python 包(package)是啥?那么 __in

使用Python实现图像LBP特征提取的操作方法

《使用Python实现图像LBP特征提取的操作方法》LBP特征叫做局部二值模式,常用于纹理特征提取,并在纹理分类中具有较强的区分能力,本文给大家介绍了如何使用Python实现图像LBP特征提取的操作方... 目录一、LBP特征介绍二、LBP特征描述三、一些改进版本的LBP1.圆形LBP算子2.旋转不变的LB

Maven的使用和配置国内源的保姆级教程

《Maven的使用和配置国内源的保姆级教程》Maven是⼀个项目管理工具,基于POM(ProjectObjectModel,项目对象模型)的概念,Maven可以通过一小段描述信息来管理项目的构建,报告... 目录1. 什么是Maven?2.创建⼀个Maven项目3.Maven 核心功能4.使用Maven H

Python中__init__方法使用的深度解析

《Python中__init__方法使用的深度解析》在Python的面向对象编程(OOP)体系中,__init__方法如同建造房屋时的奠基仪式——它定义了对象诞生时的初始状态,下面我们就来深入了解下_... 目录一、__init__的基因图谱二、初始化过程的魔法时刻继承链中的初始化顺序self参数的奥秘默认

SpringBoot使用GZIP压缩反回数据问题

《SpringBoot使用GZIP压缩反回数据问题》:本文主要介绍SpringBoot使用GZIP压缩反回数据问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录SpringBoot使用GZIP压缩反回数据1、初识gzip2、gzip是什么,可以干什么?3、Spr

Python实现特殊字符判断并去掉非字母和数字的特殊字符

《Python实现特殊字符判断并去掉非字母和数字的特殊字符》在Python中,可以通过多种方法来判断字符串中是否包含非字母、数字的特殊字符,并将这些特殊字符去掉,本文为大家整理了一些常用的,希望对大家... 目录1. 使用正则表达式判断字符串中是否包含特殊字符去掉字符串中的特殊字符2. 使用 str.isa

Spring Boot 集成 Quartz并使用Cron 表达式实现定时任务

《SpringBoot集成Quartz并使用Cron表达式实现定时任务》本篇文章介绍了如何在SpringBoot中集成Quartz进行定时任务调度,并通过Cron表达式控制任务... 目录前言1. 添加 Quartz 依赖2. 创建 Quartz 任务3. 配置 Quartz 任务调度4. 启动 Sprin

Linux下如何使用C++获取硬件信息

《Linux下如何使用C++获取硬件信息》这篇文章主要为大家详细介绍了如何使用C++实现获取CPU,主板,磁盘,BIOS信息等硬件信息,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下... 目录方法获取CPU信息:读取"/proc/cpuinfo"文件获取磁盘信息:读取"/proc/diskstats"文