【class9】人工智能初步(处理单张图片)

2024-05-16 09:44

本文主要是介绍【class9】人工智能初步(处理单张图片),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Class9的任务:处理单张图像

为了更高效地学习,我们将“处理单张图像”拆分成以下几步完成:
1. 读取图像文件
2. 调用通用物体识别
3. 提取图像分类信息
4. 对应分类文件夹还未创建时,创建文件夹
5. 移动图像到对应文件夹

0.获取了图像路径

整理清楚解决问题的思路以后,我们开始获取图像路径。我们直接从铭铭的文件夹'img'中选出一张图像'cat.jpg'。它的路径可以表示为 '/Users/img/cat.jpg' 

# TODO 将照片路径'/Users/img/cat.jpg'赋值给变量filePath

filePath= '/Users/img/cat.jpg'

1. 读取图像文件

,接下来需要读取图像内容。在读取图像内容时,需要先打开图像文件。前面我们直接用open() 函数来打开文件,但是open() 函数在读取文件时,有时候会发生异常。为了能在发生异常时,自动释放打开的文件资源,我们可以搭配使用 with...as...语句。

# 使用with...as以rb方式,打开路径为filePath的图片并赋值给f

with open(filePath, 'rb') as f:

接着读取图像。在这里,我们可以调用 read() 函数,read() 函数可以逐个字节(或者逐个字符)读取文件中的内容。由于是以二进制格式打开图像,所以读取的图像内容是二进制格式。调用 read() 函数读取变量f,并赋值给变量 image;使用 print() 输出 image。

# 使用read()读取f,赋值给变量image

    image = f.read()

    # 使用print()输出变量image

print(image)

2.调用通用物体识别

这样,我们就完成了读取图像的操作。接下来,我们调用接口实现对图像物体的识别。当然,在调用之前,我们首先得了解,什么是通用物体识别接口。

调用通用物体识别

代码的作用

这几行高亮的代码,利用通用物体识别接口,对一张输入图片,输出其中的多个物体及场景标签。
第9-19行,是我们在上节课中创建的图像识别客户端。
第22行,通过advancedGeneral接口识别输入的图像image,并将结果存储在ending变量中。
第24行,将结果输出查看。

Ps:待识别的图像

必选参数image,图像数据,支持jpg/png/bmp格式
要求大小不超过4M,最短边至少15px,最长边最大4096px,否则会
识别失败

调用通用物体识别

刚刚新建的AipImageClassify对象--client使用advancedGeneral( )函数
将待识别的图像必选参数image传入到该函数中即可。

赋值给ending

调用接口返回的结果赋值给ending,并输出进行查看。

Ps 使用advancedGeneral()函数调用通用物体识别接口。
将待识别的图像必选参数image传入到该函数中。
输出调用接口返回的结果ending。

O(_)O哈哈~,作者有点忘记了之前的知识,所以又回去看了看

复习:在Python编程语言中,字典(Dictionary)、列表(List)和元组(Tuple)是三种不同的内置数据结构,每种都有其独特的特点和用途:

列表(List

  • 有序集合:列表中的元素有固定的顺序,可以通过索引(从0开始)访问。
  • 可变:列表中的元素可以被修改,可以增加、删除或改变元素。
  • 支持元素的多样性:列表可以包含不同类型的元素,包括数字、字符串、其他列表等。
  • 支持嵌套:列表可以包含其他列表(嵌套列表)。
  • 方法多样Python为列表提供了大量的方法,如append()remove()pop()reverse()

例子:

my_list = [1, "Hello", 3.14, [2, 4, 6]]

my_list[2] = 'pi'  # 修改第三个元素

元组(Tuple

  • 有序集合:元组和列表类似,元素有固定的顺序,通过索引访问。
  • 不可变:一旦创建,元组中的元素不能被修改。
  • 支持元素的多样性:元组也可以包含不同类型的元素。
  • 支持嵌套:元组可以包含其他元组、列表、字典等。
  • 内存效率:相较于列表,元组占用的空间通常更小,创建速度更快。

例子

my_tuple = (1, "Hello", 3.14, (2, 4, 6))

# my_tuple[2] = 'pi'  # 这会引发TypeError,因为元组不可变

字典(Dictionary

  • 无序集合:字典存储键值对,但它们是无序的(在Python 3.7及以后的版本中,字典记住了插入顺序,但这是一个实现细节,不应依赖于这一点来保证跨版本的一致性)。
  • 可变:可以添加、删除或修改键值对。
  • 键必须是不可变的:如字符串、数字或元组,但值则可以是任何数据类型。
  • 不支持索引:字典通过键来访问数据,不像列表和元组使用索引。
  • 查找效率高:字典在大数据集中查找元素时非常快,因其基于哈希表实现。

例子

my_dict = {'name': "Alice", 'age': 25, 'is_student': True}

my_dict['age'] = 26  # 修改键'age'对应的值

回到现在的class

调用通用物体识别的描述

调用通用物体识别需要传入一个必选参数

调用通用物体识别返回数据参数有很多种

AipImageClassify是图像识别的Python SDK客户端,提供了一系列的交互方法,所以在调用通用物体识别之前必须提前创建AipImageClassify。

调用通用物体识别输入一张图片可以输出图片中的多个物体及场景标签

3.提取分类结果
查看输出结果,我们从result中的参数root就能得到分类信息。调用接口返回的是一个复杂的字典结构,我们将它赋值给了变量ending。从字典ending中取出参数'result'的值可以用ending['result']

前三步的代码:

# 1.读取图像文件

# 将照片路径'/Users/img/cat.jpg'赋值给变量filePath

filePath = '/Users/img/cat.jpg'

# 使用with...as以rb方式,打开路径为filePath的图片并赋值给f

with open(filePath, 'rb') as f:

    # 使用read()读取f,赋值给变量img

    image = f.read()

   

# 2.调用通用物体识别

# 从aip中导入AipImageClassify

from aip import AipImageClassify

# 将AppID"10252021"赋值给变量APP_ID

APP_ID = '10252021'

# 将API Key"ZHe7788sh11GEjIAdEKeY"赋值给变量API_KEY

API_KEY = 'ZHe7788sh11GEjIAdEKeY'

# 将Secret Key"JMMzHe7788BUSH1ZhEnM1YUEhh"赋值给变量SECRET_KEY

SECRET_KEY = 'JMMzHe7788BUSH1ZhEnM1YUEhh'

# 新建一个AipImageClassify,并赋值给变量client

client = AipImageClassify(APP_ID, API_KEY, SECRET_KEY)

# 调用通用物体识别接口并把结果赋值给ending

ending = client.advancedGeneral(image)

# 3.提取图像分类信息

# 从返回结果中提取出参数result的值并赋值给变量value

value = ending['result']

# 使用print()输出变量value

print(value)

得到的ending['result']是一个列表结构。
我们只取列表ending['result']中的第一个元素就是ending['result'][0]。

研究得到所需要的内容:

接下来,我们直接用识别结果组成分类文件夹路径,作为移动图像的目标地址。
字符串拼接的方式拼接铭铭的文件夹'img' "/"、变量 value,将拼接后的字符串赋值给变量 targetPath

4. 对应分类文件夹还未创建时,创建文件夹

确定了每个文件需要移动的目标地址,在移动前还需要确定目标文件夹是否存在。
如果目标文件夹已经存在,直接创建会报错,如果不存在,需要先创建。
例如:cat.jpg 要移动到'动物-猫'这个文件夹中,需要先检查 'img'文件夹中是否已经创建了名为'动物-猫'的文件夹。

判断文件(夹)是否存在

代码的作用

得到了目标文件夹的路径后,我们可以使用 os.path.exists() 函数来判断该文件夹是否已经存在。

代码:

# 将分类文件夹路径赋值给变量targetPath

targetPath = '/Users/img/动物-猫'

# 使用import导入os模块

import os

# 如果目标文件夹不存在

if not os.path.exists(targetPath):

    # 使用print输出目标路径

print(targetPath)

分析代码:

os模块

在对文件进行处理之前,首先要使用import 导入 os 模块。os 模块可用于文件处理操作,os 模块是Python的内置模块,不需要安装可以直接导入。

判断文件(夹)是否存在

os.path.exists() 函数接受一个路径字符串作为参数,判断返回的结果是布尔数。
当该路径的文件夹存在时,返回True,不存在时,则返回False。

Psos.path.exists(targetPath) Python中的一个函数调用,该函数用于检查给定的路径 targetPath 是否存在。如果路径存在,无论是文件还是目录,它都会返回 True;如果路径不存在,它则返回 False

if not

if 语句用于判断当前条件的真假,只有满足条件时才会执行if语句中的内容。
我们要输出结果为 False 的文件名,这里就需要使用关键字 
not 运算符 搭配 os.path.exists() 函数,再使用 if语句 来判断结果并输出。

因此,我们在得到了目标文件夹的路径后,就可以使用 os.path.exists() 函数来判断目标文件夹是否已经存在。
通过 if 判断语句+ not 运算符来判断目标文件夹不存在的情况。

简单介绍一下os模块

Python中,os模块提供了丰富的方法用以与操作系统交互。通过使用os模块,你可以执行文件系统操作,如文件的创建、删除、移动、更改名称,以及获取文件属性等。此外,os模块还允许你与操作系统进行交互,如获取和设置环境变量,处理进程参数,以及使用与平台无关的路径操作等。

以下是一些os模块的常用功能:

文件系统操作

  • os.listdir(path): 列出指定路径下的文件和目录名。
  • os.mkdir(path): 创建新目录。
  • os.makedirs(path): 递归创建多层目录。
  • os.remove(path): 删除一个文件。
  • os.rmdir(path): 删除一个空目录。
  • os.removedirs(path): 递归删除目录,从子目录到父目录依次删除。
  • os.rename(src, dst): 重命名文件或目录。
  • os.stat(path): 获取文件或目录的状态信息。

路径操作

  • os.path.join(path1[, path2[, ...]]): 拼接一个或多个路径组件。
  • os.path.split(path): 将路径分割成目录和文件名二元组返回。
  • os.path.exists(path): 检查路径是否存在。
  • os.path.isfile(path): 检查路径是否为文件。
  • os.path.isdir(path): 检查路径是否为目录。
  • os.path.abspath(path): 获取绝对路径。
  • os.path.basename(path): 获取路径的基本名称。
  • os.path.dirname(path): 获取路径的目录名称。
  • os.path.getsize(path): 获取路径的文件大小。

环境操作

  • os.environ: 一个表示环境变量的字典。
  • os.getenv(key, default=None): 获取一个环境变量,如果不存在则返回默认值。
  • os.putenv(key, value): 设置一个环境变量值。

其他

  • os.system(command): 运行系统命令。
  • os.name: 字符串,指示你正在使用的平台。比如对于Windows,它是'nt',而对于Linux/Unix用户,它是'posix'
  • os.getpid(): 获取当前进程ID
  • os.getuid(): 获取当前用户的ID(仅在Unix下有效)。
  • os.getlogin(): 返回当前登录系统的用户名。

下一步:

创建文件夹

代码的作用

找到未创建的文件夹以后,我们就可以使用 os.mkdir() 函数来创建文件夹。

创建文件(夹)

创建文件夹可以使用 os.mkdir() 函数:将要创建的文件夹路径作为参数传入函数中即可。

5. 移动图像到对应文件夹

创建完文件夹,我们打开'img'文件夹就可以看到刚刚创建的'动物-猫'这个文件夹。一切准备就绪,接下来完成最后一步:
将'cat.jpg'移动图像到对应的文件夹'动物-猫'中。

移动文件夹

代码的作用

这里,可以使用shutil.move()函数移动文件,将图像移动到目标文件夹中。

# 导入shutil模块

import shutil

# 使用shutil.move()函数移动文件,将图像移动到目标文件夹中

# 将结果赋值给变量newPath

newPath = shutil.move(filePath, targetPath)

# 使用格式化输出"已经移动到:{newPath}"

print(f"已经移动到:{newPath}")

分析代码:

导入shutil模块

要想移动文件,我们需要导入Python中另一个内置的模块 shutil 。
使用import 导入 shutil 模块。

移动文件

shutil.move() 函数可以用来移动文件或文件夹。
它接收两个参数,第一个参数是要移动的文件(夹)路径,第二个参数是目标文件(夹)的路径。

next class,处理多张图片

这篇关于【class9】人工智能初步(处理单张图片)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/994551

相关文章

Python+FFmpeg实现视频自动化处理的完整指南

《Python+FFmpeg实现视频自动化处理的完整指南》本文总结了一套在Python中使用subprocess.run调用FFmpeg进行视频自动化处理的解决方案,涵盖了跨平台硬件加速、中间素材处理... 目录一、 跨平台硬件加速:统一接口设计1. 核心映射逻辑2. python 实现代码二、 中间素材处

Go异常处理、泛型和文件操作实例代码

《Go异常处理、泛型和文件操作实例代码》Go语言的异常处理机制与传统的面向对象语言(如Java、C#)所使用的try-catch结构有所不同,它采用了自己独特的设计理念和方法,:本文主要介绍Go异... 目录一:异常处理常见的异常处理向上抛中断程序恢复程序二:泛型泛型函数泛型结构体泛型切片泛型 map三:文

Java使用Spire.Doc for Java实现Word自动化插入图片

《Java使用Spire.DocforJava实现Word自动化插入图片》在日常工作中,Word文档是不可或缺的工具,而图片作为信息传达的重要载体,其在文档中的插入与布局显得尤为关键,下面我们就来... 目录1. Spire.Doc for Java库介绍与安装2. 使用特定的环绕方式插入图片3. 在指定位

SpringSecurity中的跨域问题处理方案

《SpringSecurity中的跨域问题处理方案》本文介绍了跨域资源共享(CORS)技术在JavaEE开发中的应用,详细讲解了CORS的工作原理,包括简单请求和非简单请求的处理方式,本文结合实例代码... 目录1.什么是CORS2.简单请求3.非简单请求4.Spring跨域解决方案4.1.@CrossOr

requests处理token鉴权接口和jsonpath使用方式

《requests处理token鉴权接口和jsonpath使用方式》文章介绍了如何使用requests库进行token鉴权接口的处理,包括登录提取token并保存,还详述了如何使用jsonpath表达... 目录requests处理token鉴权接口和jsonpath使用json数据提取工具总结reques

Python多任务爬虫实现爬取图片和GDP数据

《Python多任务爬虫实现爬取图片和GDP数据》本文主要介绍了基于FastAPI开发Web站点的方法,包括搭建Web服务器、处理图片资源、实现多任务爬虫和数据可视化,同时,还简要介绍了Python爬... 目录一. 基于FastAPI之Web站点开发1. 基于FastAPI搭建Web服务器2. Web服务

C# 空值处理运算符??、?. 及其它常用符号

《C#空值处理运算符??、?.及其它常用符号》本文主要介绍了C#空值处理运算符??、?.及其它常用符号,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 目录一、核心运算符:直接解决空值问题1.??空合并运算符2.?.空条件运算符二、辅助运算符:扩展空值处理

浅析Python中如何处理Socket超时

《浅析Python中如何处理Socket超时》在网络编程中,Socket是实现网络通信的基础,本文将深入探讨Python中如何处理Socket超时,并提供完整的代码示例和最佳实践,希望对大家有所帮助... 目录开篇引言核心要点逐一深入讲解每个要点1. 设置Socket超时2. 处理超时异常3. 使用sele

SpringMVC配置、映射与参数处理​入门案例详解

《SpringMVC配置、映射与参数处理​入门案例详解》文章介绍了SpringMVC框架的基本概念和使用方法,包括如何配置和编写Controller、设置请求映射规则、使用RestFul风格、获取请求... 目录1.SpringMVC概述2.入门案例①导入相关依赖②配置web.XML③配置SpringMVC

利用Python将PDF文件转换为PNG图片的代码示例

《利用Python将PDF文件转换为PNG图片的代码示例》在日常工作和开发中,我们经常需要处理各种文档格式,PDF作为一种通用且跨平台的文档格式,被广泛应用于合同、报告、电子书等场景,然而,有时我们需... 目录引言为什么选择 python 进行 PDF 转 PNG?Spire.PDF for Python