打造高效问答系统:合合信息文档解析工具的应用与实践

本文主要是介绍打造高效问答系统:合合信息文档解析工具的应用与实践,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

官.网地址:合合TextIn - 合合信息旗下OCR云服务产品

LLM(大型语言模型)的应用落地正快速推动着各行各业工作模式的革新。根据埃森哲在2023年发布的研究报告,预计全行业中有40%的工作时间将得到大语言模型的支持与协助。通过引入AI作为辅助,不仅能重塑员工的工作方式,还能通过自动化技术显著提升工作效率和生产力。

除了常规的知识问答,针对细分领域的专业问答对企业人员来说更具实用价值,比如在阅读冗长的论文或报告时,大模型可以完成综述、归纳和辅助分析等工作。但是这也引出了一个问题:当提供的材料相对复杂冗长时,大型模型是否能够进行文档解析并给出准确答案呢?

一、基于文档内容,大模型能给出准确的回答吗?

在文档交互中,大模型需要做到:根据文件内容给出精准回答、提供关联信息建议并给出专业分析参考。

通常企业在工作过程中,会面临大量的文件信息,人工阅读往往需要消耗大量的时间和精力。尤其在面对扫描或图片文档时,常规办公软件无法完成关键词检索,导致信息收集困难。大模型可以解决这个问题吗?合合信息技术团队以国内某自然语言大模型为例进行了测试。

01.企业年报

首先,上传一份多达100页的企业年报扫描文本,并进行提问:根据文档内容,该公司的上市时间、地点以及营业期限分别的何时何地?大模型准确无误地给出了答案。

接着,再次提问:报告中提到的企业与客户间的销售商品合同包含哪些条款?大模型同样精准地提供了答案。将回答与原文对比,发现其信息不仅准确,而且详尽全面。

这些示例表明,在处理年报等长篇文档的信息提取任务时,大模型能够有效地提供分析辅助,帮助用户快速把握关键信息。

02.经济报告

上传一份包含数据与图表的经济报告并进行提问:依据报告,美国CPI食品的1月官方值是多少?

大模型回答如下:

根据您提供的文件内容,报告中并没有直接提供美国CPI食品的1月官方值。如果需要1月的具体数值,可能需要查阅其他官方数据发布渠道或等待官方数据的公布。

但是如果进行人工检索,可在报告中获得如下表格,清楚地写明了CPI食品1月的官方值。

那么问题来了,为什么大模型读取不到这一信息呢?

03.期刊论文

上传扫描版论文后,提出具体问题:根据所给文件,精氨酸在40度的水中,溶解度是多少?

大模型回答如下:

文档中并没有直接提供精氨酸在40℃时的具体溶解度数值。同时,它补充:如果文档中确实包含了40℃的溶解度数据,但由于文档不完整或扫描不清晰导致无法读取,请提供更详细的信息或完整的文档,以便进行准确回答。

然而,表格中清晰地提供了这些信息:

在实际的工作场景中,需要识别的文件往往是纷繁多样的,其中包括清晰且便于机器读取的纯文字电子文件,也可能包含大量形式的图表,或是来源时期不一的纸质扫描档、模糊或扭曲的页面。大模型目前的回答还未达到理想状态。

二、为什么大模型的回答会不准确?

通过上述几项测试可以看到大模型在面对经济报告和期刊论文的回答并不准确。使用合合信息的文档解析工具把PDF版的经济报告转成Markdown格式后再次发送给大模型,并提出相同的问题。此时大模型给出了正确答案。

在期刊论文案例中,有线表格中的内容同样得到了正确提取。这表明,问题就出现在文档解析环节。

在先前的测试中,大模型没有从文档中准确捕捉到关键信息,而当合合信息文档解析产品把图文档进行格式处理,转化成机器可读格式,大模型就能基于文档内容,快速准确的给出答案。

在业界实践中,目前问答模型的落地面临以下几个挑战:

第一,文档识别的失败率较高。

当面对复杂的版面时,模型无法正确地解析文档,包括获取标题、分块文本、图表等内容。在这种情况下,大型模型常常无法提供细节信息的答案,或者给出错误的答案。

第二,逻辑结构的解析不完整。

模型在划分段落语义时可能出现错误,导致回答不全面或存在总结性偏差。

第三,召回效果不佳。

这可能是由于训练数据的不平衡,影响了模型的检索召回能力。

而面对前两种问题,文档解析工具能够助力解析获取内容极大提升大模型的应答能力,优化用户体验。

三、如何试用文档解析工具?

合合信息文档解析产品已经上架TextIn平台,每位开发者都可以注册账号并开通使用。

访问入口icon-default.png?t=N7T8https://link.zhihu.com/?target=https%3A//www.textin.com/market/detail/pdf_to_markdown

点击【免费体验】,即可在线试用,如下图所示:

如果想试试用代码调用,也可以访问对应的接口文档内容:

代码调用入口​icon-default.png?t=N7T8https://link.zhihu.com/?target=https%3A//www.textin.com/document/pdf_to_markdown

平台提供了一个Playground,帮开发者们预先调试接口。

点击页面中【API调试】按钮,即可进入调试页面。

在这里可以简单配置一些接口参数,发起调用后,右侧就会出现调用结果。

这篇关于打造高效问答系统:合合信息文档解析工具的应用与实践的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1031915

相关文章

网页解析 lxml 库--实战

lxml库使用流程 lxml 是 Python 的第三方解析库,完全使用 Python 语言编写,它对 XPath表达式提供了良好的支 持,因此能够了高效地解析 HTML/XML 文档。本节讲解如何通过 lxml 库解析 HTML 文档。 pip install lxml lxm| 库提供了一个 etree 模块,该模块专门用来解析 HTML/XML 文档,下面来介绍一下 lxml 库

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

高效+灵活,万博智云全球发布AWS无代理跨云容灾方案!

摘要 近日,万博智云推出了基于AWS的无代理跨云容灾解决方案,并与拉丁美洲,中东,亚洲的合作伙伴面向全球开展了联合发布。这一方案以AWS应用环境为基础,将HyperBDR平台的高效、灵活和成本效益优势与无代理功能相结合,为全球企业带来实现了更便捷、经济的数据保护。 一、全球联合发布 9月2日,万博智云CEO Michael Wong在线上平台发布AWS无代理跨云容灾解决方案的阐述视频,介绍了

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

hdu1394(线段树点更新的应用)

题意:求一个序列经过一定的操作得到的序列的最小逆序数 这题会用到逆序数的一个性质,在0到n-1这些数字组成的乱序排列,将第一个数字A移到最后一位,得到的逆序数为res-a+(n-a-1) 知道上面的知识点后,可以用暴力来解 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#in

嵌入式QT开发:构建高效智能的嵌入式系统

摘要: 本文深入探讨了嵌入式 QT 相关的各个方面。从 QT 框架的基础架构和核心概念出发,详细阐述了其在嵌入式环境中的优势与特点。文中分析了嵌入式 QT 的开发环境搭建过程,包括交叉编译工具链的配置等关键步骤。进一步探讨了嵌入式 QT 的界面设计与开发,涵盖了从基本控件的使用到复杂界面布局的构建。同时也深入研究了信号与槽机制在嵌入式系统中的应用,以及嵌入式 QT 与硬件设备的交互,包括输入输出设