如何在Web页面中集成AI图像识别功能

2024-05-29 12:04

本文主要是介绍如何在Web页面中集成AI图像识别功能,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

在信息时代,Web 页面成为我们与世界交互的重要窗口。AI 技术的迅猛发展,特别是图像识别技术,为 Web 页面带来了革命性的变化。通过在 Web 页面上实现图像识别,我们即将迈入一个更加智能与便捷的时代。这种技术不仅使网页能够理解图像内容,还为用户提供了前所未有的互动体验。本文将带你一步步实现这一功能,揭开 AI 赋能 Web 页面的神秘面纱。

具体步骤

HTML 部分

首先,我们需要创建一个简单的 HTML 框架来实现文件上传和显示图片。我们可以通过 Emmet 语法快速生成以下代码:

main.container>label.custom-file-upload>input#file-upload+div#image-container+p#status

生成的 HTML 代码如下:

<main class="container"><label for="file-upload" class="custom-file-upload"><input type="file" accept="image/*" id="file-upload">上传图片</label><div id="image-container"></div><p id="status"></p>
</main>

在这段代码中,我们使用了 main 标签而不是 div,因为 main 更具语义化,表示页面的主体内容。label 标签用于关联文件上传输入框,input 标签的 type 属性为 file,并且通过 accept 属性限制只接收图像文件。

JavaScript 部分

JavaScript 部分是实现图像识别功能的核心。我们将分三步来实现这一功能。

第一步:引入库并处理文件输入

我们首先需要引入远程的 transformers 库,并禁止使用本地模型:

import { pipeline, env } from "https://cdn.jsdelivr.net/npm/@xenova/transformers@2.6.0";
env.allowLocalModels = false;

接下来,我们添加事件监听器以处理文件输入:

const fileUpload = document.getElementById('file-upload');
const imageContainer = document.getElementById('image-container');fileUpload.addEventListener('change', function (e) {const file = e.target.files[0];const reader = new FileReader();reader.onload = function (e2) {const image = document.createElement('img');image.src = e2.target.result;imageContainer.appendChild(image);detect(image);}reader.readAsDataURL(file);
});

在这段代码中,当用户选择文件时,会触发 change 事件,通过 FileReader 对象读取文件,并在页面上显示图片。

第二步:AI 对象检测

为了实现对象检测,我们需要创建一个检测器并处理图像:

const status = document.getElementById('status');const detect = async (image) => {status.textContent = "分析中...请稍等一会";const detector = await pipeline("object-detection", "Xenova/detr-resnet-50");const output = await detector(image.src, {threshold: 0.1,percentage: true});output.forEach(renderBox);
}

在这段代码中,我们通过异步函数 detect 调用对象检测模型,并在页面上显示“分析中”的提示信息。

第三步:渲染检测结果

最后,我们需要在图像上绘制检测到的对象边界框并显示标签:

function renderBox({ box, label }) {const { xmax, xmin, ymax, ymin } = box;const boxElement = document.createElement("div");boxElement.className = "bounding-box";Object.assign(boxElement.style, {borderColor: '#123123',borderWidth: '1px',borderStyle: 'solid',left: 100 * xmin + '%',top: 100 * ymin + '%',width: 100 * (xmax - xmin) + "%",height: 100 * (ymax - ymin) + "%"});const labelElement = document.createElement('span');labelElement.textContent = label;labelElement.className = "bounding-box-label";labelElement.style.backgroundColor = '#000000';boxElement.appendChild(labelElement);imageContainer.appendChild(boxElement);
}

在这段代码中,我们创建了一个 div 元素作为边界框,并将其添加到图像上。同时,我们还创建了一个 span 元素用于显示检测到的对象标签。

CSS 部分

为了使页面更美观,我们需要添加一些基本的 CSS 样式:

.container {margin: 40px auto;width: max(50vw, 400px);display: flex;flex-direction: column;align-items: center;
}.custom-file-upload {display: flex;align-items: center;cursor: pointer;gap: 10px;border: 2px solid black;padding: 8px 16px;border-radius: 6px;
}#file-upload {display: none;
}#image-container {width: 100%;margin-top: 20px;position: relative;
}#image-container>img {width: 100%;
}.bounding-box {position: absolute;box-sizing: border-box;
}.bounding-box-label {position: absolute;color: white;font-size: 12px;
}

我们详细介绍了如何使用 HTML、JavaScript 和 CSS 实现在 Web 页面上进行 AI 图像识别。我们分步骤实现了文件读取、AI 分析和结果渲染。希望这些内容能为你的项目提供帮助,助你迈向更加智能化的未来。通过灵活的封装和模块化思想,我们可以轻松实现复杂的功能,并提升 Web 页面的互动性和智能化水平。

插入 PlugLink 的巧妙之处

在实现上述功能时,我们可以利用 PlugLink 来管理和部署我们的 AI 插件。PlugLink 作为一个开放的插件平台,能够让开发者轻松创建、管理和共享插件,从而提升开发效率和代码复用性。例如,我们可以将上面的图像识别功能打包成一个 PlugLink 插件,通过 PlugLink 平台进行分发和管理。

PlugLink 的插件开发标准方法非常简单,按照 PlugLink 提供的示例代码和开发文档,可以快速将现有的功能打包成插件。并且,PlugLink 支持多种插件的无缝集成和自动化工作流,让你的 Web 应用更具灵活性和扩展性。

目前发布了开源版和应用版,开源版下载地址:
Github地址:https://github.com/zhengqia/PlugLink
Gitcode地址:https://gitcode.com/zhengiqa8/PlugLink/overview
Gitee地址:https://gitee.com/xinyizq/PlugLink

应用版下载地址:
链接:https://pan.baidu.com/s/19tinAQNFDxs-041Zn7YwcQ?pwd=PLUG
提取码:PLUG

这篇关于如何在Web页面中集成AI图像识别功能的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1013610

相关文章

springboot集成easypoi导出word换行处理过程

《springboot集成easypoi导出word换行处理过程》SpringBoot集成Easypoi导出Word时,换行符n失效显示为空格,解决方法包括生成段落或替换模板中n为回车,同时需确... 目录项目场景问题描述解决方案第一种:生成段落的方式第二种:替换模板的情况,换行符替换成回车总结项目场景s

SpringBoot集成redisson实现延时队列教程

《SpringBoot集成redisson实现延时队列教程》文章介绍了使用Redisson实现延迟队列的完整步骤,包括依赖导入、Redis配置、工具类封装、业务枚举定义、执行器实现、Bean创建、消费... 目录1、先给项目导入Redisson依赖2、配置redis3、创建 RedissonConfig 配

Python使用FastAPI实现大文件分片上传与断点续传功能

《Python使用FastAPI实现大文件分片上传与断点续传功能》大文件直传常遇到超时、网络抖动失败、失败后只能重传的问题,分片上传+断点续传可以把大文件拆成若干小块逐个上传,并在中断后从已完成分片继... 目录一、接口设计二、服务端实现(FastAPI)2.1 运行环境2.2 目录结构建议2.3 serv

Debian 13升级后网络转发等功能异常怎么办? 并非错误而是管理机制变更

《Debian13升级后网络转发等功能异常怎么办?并非错误而是管理机制变更》很多朋友反馈,更新到Debian13后网络转发等功能异常,这并非BUG而是Debian13Trixie调整... 日前 Debian 13 Trixie 发布后已经有众多网友升级到新版本,只不过升级后发现某些功能存在异常,例如网络转

Web服务器-Nginx-高并发问题

《Web服务器-Nginx-高并发问题》Nginx通过事件驱动、I/O多路复用和异步非阻塞技术高效处理高并发,结合动静分离和限流策略,提升性能与稳定性... 目录前言一、架构1. 原生多进程架构2. 事件驱动模型3. IO多路复用4. 异步非阻塞 I/O5. Nginx高并发配置实战二、动静分离1. 职责2

SpringBoot集成XXL-JOB实现任务管理全流程

《SpringBoot集成XXL-JOB实现任务管理全流程》XXL-JOB是一款轻量级分布式任务调度平台,功能丰富、界面简洁、易于扩展,本文介绍如何通过SpringBoot项目,使用RestTempl... 目录一、前言二、项目结构简述三、Maven 依赖四、Controller 代码详解五、Service

Java+AI驱动实现PDF文件数据提取与解析

《Java+AI驱动实现PDF文件数据提取与解析》本文将和大家分享一套基于AI的体检报告智能评估方案,详细介绍从PDF上传、内容提取到AI分析、数据存储的全流程自动化实现方法,感兴趣的可以了解下... 目录一、核心流程:从上传到评估的完整链路二、第一步:解析 PDF,提取体检报告内容1. 引入依赖2. 封装

SpringBoot通过main方法启动web项目实践

《SpringBoot通过main方法启动web项目实践》SpringBoot通过SpringApplication.run()启动Web项目,自动推断应用类型,加载初始化器与监听器,配置Spring... 目录1. 启动入口:SpringApplication.run()2. SpringApplicat

基于Java和FFmpeg实现视频压缩和剪辑功能

《基于Java和FFmpeg实现视频压缩和剪辑功能》在视频处理开发中,压缩和剪辑是常见的需求,本文将介绍如何使用Java结合FFmpeg实现视频压缩和剪辑功能,同时去除数据库操作,仅专注于视频处理,需... 目录引言1. 环境准备1.1 项目依赖1.2 安装 FFmpeg2. 视频压缩功能实现2.1 主要功

使用Python实现无损放大图片功能

《使用Python实现无损放大图片功能》本文介绍了如何使用Python的Pillow库进行无损图片放大,区分了JPEG和PNG格式在放大过程中的特点,并给出了示例代码,JPEG格式可能受压缩影响,需先... 目录一、什么是无损放大?二、实现方法步骤1:读取图片步骤2:无损放大图片步骤3:保存图片三、示php