语音门户 让网络接入更便捷

2024-03-19 23:32

本文主要是介绍语音门户 让网络接入更便捷,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

随着我国通信事业的迅速发展,电话的普及率在大大提高。从这个意义上讲,计算机技术及其网络系统的发展,将给公共语音识别系统的应用带来广阔的发展空间和市场前景。

语音门户

让网络接入更便捷
言丰科技有限公司 梁康忠
01-5-10 上午 11:15:57


语音门户的发展背景
在当今飞速发展的信息社会,“移动”与“互联”已经成为不可阻挡的潮流,越来越多的人们要通过网络来优化自己的生活,如: 查询股票信息、天气预报、航班列车时刻、网上购物等。随时随地获取信息并进行基于电子商务平台的交易,已越来越成为人们的迫切需要。Internet的蓬勃发展和迅速普及已逐渐使很多人把从网上获取信息和通过网络实现电子商务,视作日常生活中的一部分。
然而,人们通过计算机上网的同时,也越来感到这种方式受到时间、地点等诸多因素限制,很难做到信息的及时获取,人们希望通过随处可见的电话得到自己所需要的信息。目前,像160等传统的声讯服务台,采用雇佣话务员提供信息服务的方式,不仅成本昂贵,而且由于工作繁重容易导致接听人员服务水平下降。而通过如168等自动声讯服务方式,虽然也可以获取一些信息,但是由于电话机按键的限制,很多信息无法用按键输入表示。因而许多具体的应用不是难以实现,就是在实现时由于多级菜单过于繁琐使用户感到不便; 另外,繁多的声讯台号码也让使用者在急需服务时,往往一时找不到所需的号码。
由于以上原因,人们越来越希望可以通过电话设备实现快速便捷的交流,即通过电话接入网络并操纵远程的信息源,以得到信息或进行电子化交易。交谈式语言是人类最自然的交流方式,通过语音浏览和接入互联网,也一直是人类的追求目标。目前,采用拨号接入网络的程序通常需耗时数十秒,而通过语音接入所需的时间只有短短几秒,因而通过语音界面,无疑将大大提高接入速度。另外,这种语音技术将令使用者无论在何时、身处何地,都可以利用手中的电话装置(移动或固定均可),就能轻松接入网络,得到所需信息或购买商品及服务。更重要的是,这种方式将大大提高商业自动化程度,降低企业的运营成本,改善服务质量,使商务活动更加便捷。语音门户(Voice Portal)的出现,正满足了人们这些需要,为互联网诠释出全新的涵义。
从技术的角度看,过去数十年,自动语音识别(ASR)技术、文本转语音(TTS)技术已经从实验室中逐步走向成熟,其算法复杂性也以每两年下降一半的速度递减,从而使这些技术逐步在市场中得到广泛应用; 另一方面,电子计算机的运算能力每两年可以翻一番,也为这些技术的商业应用奠定了坚实的基础;再加上移动用户终端的种类与功能也在以前所未有的速度增长。所有这些技术的发展都为基于语音的互联网门户—语音门户的发展提供了可靠保证。
言丰科技从事语音技术多年,在自动语音识别(ASR)、文本转语音(TTS)等语音技术领域都拥有成熟可靠的产品,在此基础上,融合了CTI技术、Web技术、电信技术、计算机及网络等技术,构筑出了新一代的上网平台——语音门户。它代表了计算机语音与互联网融合的新趋势,将使更多的用户能够快速接入互联网,为企业带来新的业务增长点。
系统平台带来的益处
从该系统面向的对象来看,无论对于企业,还是个人,语音门户都将带来很大的益处。
首先,它可为最终用户带来巨大的方便,用户只要对着一部随手可得的电话发话即可,不再受制于按键音频,也不必因为不便携带电脑而“望信息兴叹”。这不仅使那些并不擅于使用计算机的人也能够轻松地通过互联网获得服务,同时也使那些手边没有计算机的人也能够获得必要的信息。目前,市场上推出的互联网移动终端只注重将互联网内容移到终端上,却没有充分考虑这些系统的易用性,而语音门户恰好弥补了这一不足,使任何人都能够通过语音门户畅游互联网。
另一方面,该平台具有巨大的商业价值,企业本身会从该系统中受益。从系统平台的角度看,它能够替代话务员工作,可令企业将更多的人力与精力投放在对其核心增值服务的开拓上,并为其产品和服务在激烈的市场竞争中开辟出新的空间。比如,我们最常用的交互式语音应答系统IVR,具有自动语音交互功能,可使企业在节省更多成本的同时,享受更自然、更舒适的交互界面。同时,实现语音交互功能的IVR应用也比双音多频(DTMF)或按钮应用更方便,这也将为企业带来更好的投资回报。
从应用功能上来看,语音门户为用户带来了方便的应用:
一方面,语音门户让用户可随时随地轻松获取各种信息。例如,用户只需用普通电话机或移动电话拨打语音门户网的特定号码,就可在语音提示引导之下用自然语言和耳朵便捷地“浏览”天气、新闻、体育等多方面的信息。在这个过程中,不必键入菜单选择,仅需简单的语音应答即可完成操作。所以,无论是通过PC机、手机或者固定电话,也无论是在办公室、家中,还是在路上、车上,用户只要通过与语音门户展开交互式对话,就可以像“网上冲浪”般快捷、方便地从一家企业自由地“跳”到另外一家企业,使“浏览”网络的过程变得轻松无比。 
另一方面,语音门户还可让用户随时随地进行订票、购物等电子化交易。人们采用语音门户平台获得网上信息并开展交易活动的方式,与通过代理人建立连接相比,速度更快,并且还可享受到更廉价的服务。正如门户网站把自身信息和其他信息整合起来一样,语音门户也把自身语音信息资源和其他资源综合在了一起,在普通的电话网上以一个统一的号码向用户提供各种各样的信息服务。其他的诸如虚拟个人助理、股票交易代理、企业内自动值守、旅游订票系统等,也可灵活地在该平台上构筑实现。
业务功能实现
作为VoiceXML组织的重要成员,言丰推出了完全自主设计的语音门户平台。用户通过这个平台,可把有线电话网、无线通信网、寻呼网、Internet联系为一个有机的整体,用户通过电话不但可以查询股票行情、天气预报、航班动态、火车时刻表等信息,而且可点播自己定制的新闻、证券评论等; 同时也可以把它作为自己的统一消息平台。更为重要的是,在该平台上,用户还可直接与计算机系统进行互动操作,通过该平台实现购买飞机票、股票等语音电子商务活动。归纳起来,该系统可分为信息查询、信息点播、交易处理、统一消息等4个功能模块。
信息查询功能
通过该功能模块,用户在全天24小时内可随时得到全方位的语音信息服务,企业也可通过该平台提高服务质量,并在实现了呼叫自动化的基础上节省企业运营成本。该模块的主要功能包括:
● 168、121等各种特服信息查询;
● 证券信息的公告和委托;
● 银行系统账目查询和电话银行;
● 社会调查;
● 法律、保险信息咨询;
● 旅游信息查询;
● 政府公告及各种法律法规查询;
● 运输业信息查询: 如航班查询、火车运行时刻查询和运送货物查询等。
用户对股票信息进行查询时,不但可查询实时股票行情,而且对另开户进行股票交易的客户和利用存折进行股票交易的客户,还提供资金查询服务;也可对客户所拥有的证券情况或客户的委托情况等进行全方位的信息查询服务。
信息点播功能
信息点播可以使用户订购和点播自己想得到的内容,如股票实时行情查询、证券指数查询、天气查询、出港航班查询等信息,可实现股票点播、天气预报、股票涨跌告警、体育(福利)彩票、航班信息、火车时刻、热点新闻、电视节目、生活常识等实用信息的点播服务。
交易处理功能
通过语音平台,用户可以实现电子化交易,即语音电子商务。该项业务可以针对某一行业进行定制,也可以提供多种行业的综合交易服务。
用户通过电话办理某项交易时,由于交易不同,所涉及的用户资料也不同,如用户业务性能和功能变化、用户产权变更等,所以必须先通过用户账号、密码管理系统等手段确认、证实,并制定相应的管理制度,以进行严格管理。
统一消息功能
信息社会的快速发展使每天都有各种各样的信息涌向我们每一个人,这些信息给我们带来巨大的便利和经济效益,同时也使我们处于这样一种窘境:我们拥有如此之多的通信联系方式,如电话、手机、呼机等,而这些通信工具又互不相干,无法实现信息互通,以至于我们不得不逐项检查这些信息源,去提取属于我们的有用信息。而语音平台中“统一消息”功能模块可将这些功能集中在一起,用户通过一个统一的号码接入系统,即可得到全部所需信息。
结 束 语
语言,一直是并且仍将是人们进行信息交流的最自然、最直接和最主要的方式。人们希望用语音和计算机直接进行交流,让计算机拥有能听懂语言的“耳朵”,这就是人们对计算机自动语音识别的构想。计算机智能语音识别的意义十分重大,它使人们可以方便地通过语音完成各种操作。目前,世界上一些服务行业的企业,如银行、股票公司、旅游服务公司、航空公司等,纷纷投资、合作开发或购买具有语音功能的服务系统,以此降低其运营成本。如AT&T电话公司,通过自动语音交互应答系统,可以识别出用户的付费方式。仅此一项,每年就为该公司节省下巨额成本。可见,语音识别系统应用已给一些发达国家带来了巨大的经济效益; 同时,也说明了自动语音识别服务系统已经形成了一定的市场规模,并将迅速成为具有市场竞争力的高技术含量的产品。
电话语音智能识别系统利用现有发达的电话网,使用户能够以最简单、最方便、最满意的方式获取信息。以“说话”的方式来操纵计算机网络系统,将彻底改变人们几十年形成的按键操作的传统概念和习惯,使人重归自然,轻松自由。美国朗讯科技公司在推广使用具有语音识别功能的电话自动服务系统时,做过一个统计: 在增加语音识别功能之前,大约有19%的打电话者听到第一组提示时没有任何反应; 增加该功能后,这个百分比降到了2%。此外,起初约有36%的打电话者仍坚持用按键方式,但在一星期后,完全使用语音识别功能的人数增加到46%。

这篇关于语音门户 让网络接入更便捷的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/827579

相关文章

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

让树莓派智能语音助手实现定时提醒功能

最初的时候是想直接在rasa 的chatbot上实现,因为rasa本身是带有remindschedule模块的。不过经过一番折腾后,忽然发现,chatbot上实现的定时,语音助手不一定会有响应。因为,我目前语音助手的代码设置了长时间无应答会结束对话,这样一来,chatbot定时提醒的触发就不会被语音助手获悉。那怎么让语音助手也具有定时提醒功能呢? 我最后选择的方法是用threading.Time

Linux 网络编程 --- 应用层

一、自定义协议和序列化反序列化 代码: 序列化反序列化实现网络版本计算器 二、HTTP协议 1、谈两个简单的预备知识 https://www.baidu.com/ --- 域名 --- 域名解析 --- IP地址 http的端口号为80端口,https的端口号为443 url为统一资源定位符。CSDNhttps://mp.csdn.net/mp_blog/creation/editor

ASIO网络调试助手之一:简介

多年前,写过几篇《Boost.Asio C++网络编程》的学习文章,一直没机会实践。最近项目中用到了Asio,于是抽空写了个网络调试助手。 开发环境: Win10 Qt5.12.6 + Asio(standalone) + spdlog 支持协议: UDP + TCP Client + TCP Server 独立的Asio(http://www.think-async.com)只包含了头文件,不依

poj 3181 网络流,建图。

题意: 农夫约翰为他的牛准备了F种食物和D种饮料。 每头牛都有各自喜欢的食物和饮料,而每种食物和饮料都只能分配给一头牛。 问最多能有多少头牛可以同时得到喜欢的食物和饮料。 解析: 由于要同时得到喜欢的食物和饮料,所以网络流建图的时候要把牛拆点了。 如下建图: s -> 食物 -> 牛1 -> 牛2 -> 饮料 -> t 所以分配一下点: s  =  0, 牛1= 1~

poj 3068 有流量限制的最小费用网络流

题意: m条有向边连接了n个仓库,每条边都有一定费用。 将两种危险品从0运到n-1,除了起点和终点外,危险品不能放在一起,也不能走相同的路径。 求最小的费用是多少。 解析: 抽象出一个源点s一个汇点t,源点与0相连,费用为0,容量为2。 汇点与n - 1相连,费用为0,容量为2。 每条边之间也相连,费用为每条边的费用,容量为1。 建图完毕之后,求一条流量为2的最小费用流就行了

poj 2112 网络流+二分

题意: k台挤奶机,c头牛,每台挤奶机可以挤m头牛。 现在给出每只牛到挤奶机的距离矩阵,求最小化牛的最大路程。 解析: 最大值最小化,最小值最大化,用二分来做。 先求出两点之间的最短距离。 然后二分匹配牛到挤奶机的最大路程,匹配中的判断是在这个最大路程下,是否牛的数量达到c只。 如何求牛的数量呢,用网络流来做。 从源点到牛引一条容量为1的边,然后挤奶机到汇点引一条容量为m的边

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出 在数字化时代,文本到语音(Text-to-Speech, TTS)技术已成为人机交互的关键桥梁,无论是为视障人士提供辅助阅读,还是为智能助手注入声音的灵魂,TTS 技术都扮演着至关重要的角色。从最初的拼接式方法到参数化技术,再到现今的深度学习解决方案,TTS 技术经历了一段长足的进步。这篇文章将带您穿越时

配置InfiniBand (IB) 和 RDMA over Converged Ethernet (RoCE) 网络

配置InfiniBand (IB) 和 RDMA over Converged Ethernet (RoCE) 网络 服务器端配置 在服务器端,你需要确保安装了必要的驱动程序和软件包,并且正确配置了网络接口。 安装 OFED 首先,安装 Open Fabrics Enterprise Distribution (OFED),它包含了 InfiniBand 所需的驱动程序和库。 sudo

【机器学习】高斯网络的基本概念和应用领域

引言 高斯网络(Gaussian Network)通常指的是一个概率图模型,其中所有的随机变量(或节点)都遵循高斯分布 文章目录 引言一、高斯网络(Gaussian Network)1.1 高斯过程(Gaussian Process)1.2 高斯混合模型(Gaussian Mixture Model)1.3 应用1.4 总结 二、高斯网络的应用2.1 机器学习2.2 统计学2.3