azure认知服务java_Azure认知服务之表单识别器

2023-10-12 03:30

本文主要是介绍azure认知服务java_Azure认知服务之表单识别器,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

认知服务

Azure 认知服务的目标是帮助开发人员创建可以看、听、说、理解甚至开始推理的应用程序。Azure 认知服务中的服务目录可分为五大主要支柱类别:视觉、语音、语言、Web 搜索和决策。开发人员使用 Azure 认知服务能够轻松地将认知功能添加到其应用程序中。Azure认知服务主要包含:人脸、表单识别、墨迹识别等内容。上次已经介绍过人脸识别服务了,这次介绍下表单识别器如何使用。

表单识别器

Azure 表单识别器是一个认知服务,该服务使用机器学习技术从表单文档中识别和提取文本、键值对和表数据。它会引入表单中的文本并输出包含原始文件中的关系的结构化数据。可以快速获取根据特定内容定制的准确结果,无需进行繁琐的手动干预,也不需要具备丰富的数据科学专业知识。表单识别器由自定义模型、预生成的收据模型和布局 API 组成。可以使用 REST API 调用表单识别器模型,以降低复杂性,并将该模型集成到工作流或应用程序中。

引用自微软Azure文档

新建表单识别器资源

0b4a2eecd3bb32897ffd5847f57ba1b3.png

新建一个表单识别器的资源。表单识别器也是一项免费服务,免费定价策略为:500页/月,识别频率在20次/分钟,训练频率1次/分钟。区域选离你最近的,然后取个名字。

查看秘钥跟终结点

03462c7ec43e151f04625e623407fafb.png

创建完成后,点击侧边菜单密钥跟终结点,查看密钥跟终结点信息,等下调用SDK的时候需要使用。

新建一个WPF程序

我们还是新建一个WPF程序来演示如果使用表单识别的SDK。新建一个WPF程序,然后放置一个按钮,点击按钮选择一个文件,对这个文件进行识别并把识别的结果显示在文本框内。

安装SDK

使用nuget进行安装:

Install-PackageAzure.AI.FormRecognizer-Version1.0.0-preview.4

修改MainWindow.xaml

xmlns="http://schemas.microsoft.com/winfx/2006/xaml/presentation"

xmlns:x="http://schemas.microsoft.com/winfx/2006/xaml"

xmlns:d="http://schemas.microsoft.com/expression/blend/2008"

xmlns:mc="http://schemas.openxmlformats.org/markup-compatibility/2006"

xmlns:local="clr-namespace:FormRecognizer"

mc:Ignorable="d"

Title="MainWindow"Height="450"Width="800">

修改MainWindow.xaml,在界面上放置一个按钮来选择文件,放置一个文本框显示内容。界面如下:

d61bc257d28fa4b4cfc6423a8e2e3ca2.png

选择识别文件

privateasyncvoidSelectFile_Click(objectsender,RoutedEventArgse)

{

varopenFileDialog=newOpenFileDialog();

openFileDialog.ShowDialog();

varfile=openFileDialog.FileName;

this.tbxContent.Text="正在识别";

varresult=awaitStartRecognize(file);

foreach(varpageinresult.Value)

{

this.tbxContent.Text+=$"第{page.PageNumber}页"+"\r\n";

for(inttableIndex=0;tableIndex

{

this.tbxContent.Text+=$"表{tableIndex + 1}"+"\r\n";

vartable=page.Tables[tableIndex];

foreach(varcellintable.Cells)

{

this.tbxContent.Text+=$"行:{cell.RowIndex} 列:{cell.ColumnIndex} 内容:{cell.Text}"+"\r\n";

}

}

}

}

选择一个文件,然后调用StartRecognize方法进行识别,对识别的结果进行显示。识别的PDF文件如下:

e271d3167265a5cf4c5bdaf4d529f143.png

使用SDK进行识别

privateasyncTask>StartRecognize(stringfile)

{

stringendpoint="https://xxxx.cognitiveservices.azure.com/";

stringapiKey="xxxx";

varcredential=newAzureKeyCredential(apiKey);

varrecognizerClient=newFormRecognizerClient(newUri(endpoint),credential);

ResponseformPages=awaitrecognizerClient

.StartRecognizeContentAsync(File.OpenRead(file))

.WaitForCompletionAsync();

returnformPages;

}

直接调用StartRecognizeContentAsync进行识别,等待一会就会有结果。

运行一下

让我们运行一下看看吧:

6b9bb24f0cfd4a9f72afebfbb0ded58e.gif

总结

使用Azure的认知服务进行表单识别可以轻松的对JPG,PNG,PDF等非结构化的数据进行数据采集,从而转换成结构化数据进行储存以及分析。表单识别器支持无需训练的识别,如果复杂表单还可以进行自定义模型的训练,从而提高识别精度。但是目前好像还不支持中文,后续再研究吧。

关注我的公众号一起玩转技术

这篇关于azure认知服务java_Azure认知服务之表单识别器的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/192926

相关文章

使用Java发送邮件到QQ邮箱的完整指南

《使用Java发送邮件到QQ邮箱的完整指南》在现代软件开发中,邮件发送功能是一个常见的需求,无论是用户注册验证、密码重置,还是系统通知,邮件都是一种重要的通信方式,本文将详细介绍如何使用Java编写程... 目录引言1. 准备工作1.1 获取QQ邮箱的SMTP授权码1.2 添加JavaMail依赖2. 实现

Java嵌套for循环优化方案分享

《Java嵌套for循环优化方案分享》介绍了Java中嵌套for循环的优化方法,包括减少循环次数、合并循环、使用更高效的数据结构、并行处理、预处理和缓存、算法优化、尽量减少对象创建以及本地变量优化,通... 目录Java 嵌套 for 循环优化方案1. 减少循环次数2. 合并循环3. 使用更高效的数据结构4

java两个List的交集,并集方式

《java两个List的交集,并集方式》文章主要介绍了Java中两个List的交集和并集的处理方法,推荐使用Apache的CollectionUtils工具类,因为它简单且不会改变原有集合,同时,文章... 目录Java两个List的交集,并集方法一方法二方法三总结java两个List的交集,并集方法一

Spring AI集成DeepSeek三步搞定Java智能应用的详细过程

《SpringAI集成DeepSeek三步搞定Java智能应用的详细过程》本文介绍了如何使用SpringAI集成DeepSeek,一个国内顶尖的多模态大模型,SpringAI提供了一套统一的接口,简... 目录DeepSeek 介绍Spring AI 是什么?Spring AI 的主要功能包括1、环境准备2

Spring AI集成DeepSeek实现流式输出的操作方法

《SpringAI集成DeepSeek实现流式输出的操作方法》本文介绍了如何在SpringBoot中使用Sse(Server-SentEvents)技术实现流式输出,后端使用SpringMVC中的S... 目录一、后端代码二、前端代码三、运行项目小天有话说题外话参考资料前面一篇文章我们实现了《Spring

Spring AI与DeepSeek实战一之快速打造智能对话应用

《SpringAI与DeepSeek实战一之快速打造智能对话应用》本文详细介绍了如何通过SpringAI框架集成DeepSeek大模型,实现普通对话和流式对话功能,步骤包括申请API-KEY、项目搭... 目录一、概述二、申请DeepSeek的API-KEY三、项目搭建3.1. 开发环境要求3.2. mav

Springboot的自动配置是什么及注意事项

《Springboot的自动配置是什么及注意事项》SpringBoot的自动配置(Auto-configuration)是指框架根据项目的依赖和应用程序的环境自动配置Spring应用上下文中的Bean... 目录核心概念:自动配置的关键特点:自动配置工作原理:示例:需要注意的点1.默认配置可能不适合所有场景

Nginx配置系统服务&设置环境变量方式

《Nginx配置系统服务&设置环境变量方式》本文介绍了如何将Nginx配置为系统服务并设置环境变量,以便更方便地对Nginx进行操作,通过配置系统服务,可以使用系统命令来启动、停止或重新加载Nginx... 目录1.Nginx操作问题2.配置系统服android务3.设置环境变量总结1.Nginx操作问题

使用Apache POI在Java中实现Excel单元格的合并

《使用ApachePOI在Java中实现Excel单元格的合并》在日常工作中,Excel是一个不可或缺的工具,尤其是在处理大量数据时,本文将介绍如何使用ApachePOI库在Java中实现Excel... 目录工具类介绍工具类代码调用示例依赖配置总结在日常工作中,Excel 是一个不可或缺的工http://

Java8需要知道的4个函数式接口简单教程

《Java8需要知道的4个函数式接口简单教程》:本文主要介绍Java8中引入的函数式接口,包括Consumer、Supplier、Predicate和Function,以及它们的用法和特点,文中... 目录什么是函数是接口?Consumer接口定义核心特点注意事项常见用法1.基本用法2.结合andThen链