百度CTO王海峰:语音能力日均调用量过100亿,AI技术在应用中进化

2023-10-09 14:40

本文主要是介绍百度CTO王海峰:语音能力日均调用量过100亿,AI技术在应用中进化,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

11月28日,百度大脑宣布语音能力引擎日均调用量已经超过100亿次,应用规模业界第一,为开发者提供了覆盖云、端、芯的全栈全场景语音开放能力,推动智能语音技术在各行业落地应用。

在当天举行的百度大脑语音能力引擎论坛上,百度大脑语音引擎全新发布和升级了14大产品内容,包括基于百度鸿鹄语音芯片的4款硬件模组、开发板及3大场景解决方案,升级了语音自训练平台、呼叫中心语音解决方案等。来自家电、农业、医疗等行业的合作伙伴代表也在现场分享了百度大脑语音技术赋能的成果。

     

▲ 百度 CTO 王海峰博士致辞

百度首席技术官王海峰博士出席论坛并致辞,他表示:“AI 技术的进化和产业赋能正向循环,相互促进,AI 在应用场景中不断进化。百度的语音技术基于深度学习和产业应用加速突破,已应用到百度 App、百度地图、小度音箱,百度输入法等百度产品,更通过 AI 开放平台赋能众多产业伙伴。百度大脑语音能力每天的调用量已经超过100亿。

现场,百度语音首席架构师贾磊正式提出基于复数 CNN 网络的语音增强和语音识别一体化端到端建模技术,该方法抛弃了数字信号处理学科和语音识别学科的各种先验假设,消除学科间壁垒,直接端到端进行一体化建模。相较于传统基于数字信号处理的麦克阵列算法,错误率降低超过30%。目前该方法已经被集成到百度最新发布的百度鸿鹄芯片中。  

▲ 百度语音首席架构师贾磊主题演讲:百度大脑语音技术的前沿进展

百度从2012年起就开始把深度学习用于中文语音搜索,成为全世界最早把深度学习技术落地工业化产品的企业之一。百度大脑目前已开放了云、端、芯包含语音识别、语音合成等全栈语音引擎能力,并广泛应用于金融、政务、文娱等多种行业和场景。

百度 AI 技术生态部总经理喻友平表示,百度大脑语音能力引擎的应用规模已达到业界第一,同时一直在积极拓展语音能力引擎生态链的建设。

 

▲ 百度 AI 技术生态部总经理喻友平介绍百度大脑语音引擎全栈开放能力

针对智能硬件设备,百度大脑重磅发布基于百度鸿鹄语音芯片的4款硬件模组、开发板,以及智能家居、智能车载、智能 IoT 设备3大端到端软硬一体远场语音交互场景解决方案,具备交互效果优异、软硬一体快速应用、广泛兼容集成门槛低等优点。

同时,在语音识别领域,全面升级短语音识别、实时语音识别能力,发布音频文件转写能力,升级可零代码提升业务术语识别率的语音自训练平台,以及呼叫中心语音解决方案;在语音合成方面,全新发布6个在线语音合成精品音库和5个离线语音合成精品音库。丰富的语音能力,助力智能硬件、互联网、呼叫中心等领域智能化升级。

▲ 嘉宾分享第一排从左至右:创维、瓴岳科技、北京子杰宝贝科技公司;第二排从左至右: 华智水稻、江西善行

论坛上,来自家居、金融、医疗、农业、公益等领域的合作伙伴,登台分享与百度大脑合作的细节,以及如何以语音技术助力自身完成智能化升级。

创维 AIoT 研究院产品经理李凯介绍:“大屏 IoT 的行业痛点在于信息检索难和设备控制操作复杂,通过增加语音交互能力,重构了整个 AIoT 设备生态的交互体验。双方在电视方面的合作成果已落地在10个电视芯片型号、2500万台电视上,助力中端及高端产品线提升了产品溢价能力。”在下一代远场语音方案中,百度鸿鹄语音芯片为创维产品带来了高性价比硬件、整合优化的软件算法等价值,双方将基于百度鸿鹄芯片展开多项产品的合作。

瓴岳科技信贷运营总监宋力现场分享了百度大脑语音技术在贷后领域的应用,依托百度大脑呼叫中心实时语音识别等 AI 服务对用户语音的准确识别,瓴岳打造了降本提效的智能机器人。通过贷后智能机器人、智能语音质检的应用,贷后人力投入降低61.47%,有效实现了合规和高效的运营体系,提高了客户体验。

北京子杰宝贝科技有限公司项目经理肖云峰在会上展现了语音技术在医疗领域的应用:“我们开发的智能录入系统在百度大脑语音自训练平台进行语音识别模型训练,识别率从80%提升至95%以上,包括医疗专业生僻词的识别,而很多厂商模型识别率都达不到这个要求。该系统有效降低了医护人员的工作强度,提升了临床护理效率。”

而在农业领域,也遇到了农业作物专业词汇语音识别率低的行业问题,对此华智生物信息技术主任龙晓波表示:“得益于百度大脑语音自训练平台使用简单、准确率高、可拓展等优点,经多次迭代我们的农业结构化性状数据语音识别准确率从71.09%提升至98.75%,采集一个测试田地性状信息从300人工时降低到160人工时,工作效率提升了一倍。”

善行智能联合创始人黄小瑰介绍了基于百度大脑语音等技术打造的小 Q 智能导盲眼镜,帮助盲人生活出行,为失能人群提供智能化的帮助。现场还发布了“因 AI 而声”公益计划:百度大脑将为提供公益性服务的公司或组织,提供语音技术免费、专属语音技术支持等福利,为特殊群体带去便利和帮助,让 AI 有温度。

▲ 百度大脑语音能力引擎论坛现场

百度大脑开放平台是国内服务规模最大的 AI 开放平台,目前已开放228项 AI 能力,拥有超过150万的开发者用户。

与会人士认为,此次百度大脑语音技术能力的全新发布和升级,为开发者和企业提供了更加完善的全栈语音引擎能力,将帮助更多用户高效打造具备语音交互能力的特色应用与产品,加快语音技术在各行各业的应用落地进程。

这篇关于百度CTO王海峰:语音能力日均调用量过100亿,AI技术在应用中进化的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/173556

相关文章

Java调用C++动态库超详细步骤讲解(附源码)

《Java调用C++动态库超详细步骤讲解(附源码)》C语言因其高效和接近硬件的特性,时常会被用在性能要求较高或者需要直接操作硬件的场合,:本文主要介绍Java调用C++动态库的相关资料,文中通过代... 目录一、直接调用C++库第一步:动态库生成(vs2017+qt5.12.10)第二步:Java调用C++

SpringBoot3实现Gzip压缩优化的技术指南

《SpringBoot3实现Gzip压缩优化的技术指南》随着Web应用的用户量和数据量增加,网络带宽和页面加载速度逐渐成为瓶颈,为了减少数据传输量,提高用户体验,我们可以使用Gzip压缩HTTP响应,... 目录1、简述2、配置2.1 添加依赖2.2 配置 Gzip 压缩3、服务端应用4、前端应用4.1 N

Java利用JSONPath操作JSON数据的技术指南

《Java利用JSONPath操作JSON数据的技术指南》JSONPath是一种强大的工具,用于查询和操作JSON数据,类似于SQL的语法,它为处理复杂的JSON数据结构提供了简单且高效... 目录1、简述2、什么是 jsONPath?3、Java 示例3.1 基本查询3.2 过滤查询3.3 递归搜索3.4

Python中随机休眠技术原理与应用详解

《Python中随机休眠技术原理与应用详解》在编程中,让程序暂停执行特定时间是常见需求,当需要引入不确定性时,随机休眠就成为关键技巧,下面我们就来看看Python中随机休眠技术的具体实现与应用吧... 目录引言一、实现原理与基础方法1.1 核心函数解析1.2 基础实现模板1.3 整数版实现二、典型应用场景2

Python Dash框架在数据可视化仪表板中的应用与实践记录

《PythonDash框架在数据可视化仪表板中的应用与实践记录》Python的PlotlyDash库提供了一种简便且强大的方式来构建和展示互动式数据仪表板,本篇文章将深入探讨如何使用Dash设计一... 目录python Dash框架在数据可视化仪表板中的应用与实践1. 什么是Plotly Dash?1.1

在C#中调用Python代码的两种实现方式

《在C#中调用Python代码的两种实现方式》:本文主要介绍在C#中调用Python代码的两种实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录C#调用python代码的方式1. 使用 Python.NET2. 使用外部进程调用 Python 脚本总结C#调

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》:本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应

Android Kotlin 高阶函数详解及其在协程中的应用小结

《AndroidKotlin高阶函数详解及其在协程中的应用小结》高阶函数是Kotlin中的一个重要特性,它能够将函数作为一等公民(First-ClassCitizen),使得代码更加简洁、灵活和可... 目录1. 引言2. 什么是高阶函数?3. 高阶函数的基础用法3.1 传递函数作为参数3.2 Lambda

使用Python实现文本转语音(TTS)并播放音频

《使用Python实现文本转语音(TTS)并播放音频》在开发涉及语音交互或需要语音提示的应用时,文本转语音(TTS)技术是一个非常实用的工具,下面我们来看看如何使用gTTS和playsound库将文本... 目录什么是 gTTS 和 playsound安装依赖库实现步骤 1. 导入库2. 定义文本和语言 3

Java中&和&&以及|和||的区别、应用场景和代码示例

《Java中&和&&以及|和||的区别、应用场景和代码示例》:本文主要介绍Java中的逻辑运算符&、&&、|和||的区别,包括它们在布尔和整数类型上的应用,文中通过代码介绍的非常详细,需要的朋友可... 目录前言1. & 和 &&代码示例2. | 和 ||代码示例3. 为什么要使用 & 和 | 而不是总是使