让实时音视频技术融于无形

2023-12-19 08:08

本文主要是介绍让实时音视频技术融于无形,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在2018云栖大会音视频专场中,作为阿里云的合作伙伴,即构科技CEO林友尧受邀参加,发表了“让实时音视频技术融于无形”主题演讲,跟大家分享了在行业深耕多年的思考。

演讲中,林友尧对音视频发展趋势进行了分析。他提到,随着行业应用的铺开,实时音视频新场景必定越来越多,市场规模越来越大,伴随而来的技术挑战越来越大。随着发展的加快,未来,实时音视频将无形融于各行各业。

以下是演讲内容节选。

从直播连麦起家,到深入各行各业

说到即构科技,大家首先想到的是“直播”和“连麦”,为什么这么说呢?因为花椒、映客、一直播等国内过半的头部直播平台,用的都是即构的技术。

2016年,即构推出了全球首创的直播连麦技术,用自研的技术,在不改造基点网络、不改造任何场景的情况下,后台服务器和前端引擎做到1到1.5秒的低延迟,在极低延迟下支持更多主播连麦。技术推出后,吸引了国内过半大型的直播平台,引入连麦的方式来丰富直播场景,“直播”和“连麦”也自然而然成了即构的标签。
在这里插入图片描述
除了直播和连麦,“QQ”、“自研”、“18年”、“32路”也是即构的标签。

“QQ”是因为即构团队很多人来自QQ团队,在腾讯待了超过10年的人很多,包括我自己。我们当时在腾讯主要做两个事情,一是花了五年来重构整个QQ的客户端,二是花了五年做了QQ的音视频引擎,在这两个五年中,我们获得了亿万级用户通讯产品技术经验。

2015年,从腾讯出来后,我们成立了即构。一开始我们就选择了一条最难的路:基于公有云开放的架构,重新自研音视频引擎和后台服务,开放技术去帮助企业做业务产品的开发,而不是为了省事而采用开源的代码。这样做成功率很低,花费的人力成本也很高。之所以这么硬气,是因为我们CTO金建忠和技术骨干,很多从大学开始就做音视频相关的技术,到现在有超过18年的技术积累。

因为我们自研的音视频引擎,用了比较好的架构设计,在软件层做到了同时支持多方通讯,2017年3月,即构推出了32路视频通话技术,在当时是业内首家,并且有了落地的应用,比今年6月苹果发布的FaceTime支持32路早了整整一年。

从创立以来,即构就专注做技术,事实证明,大家是愿意为好的技术买单的。在成立后三年多的时间里,即构得到了腾讯、花椒、映客、咪咕、好未来、喜马拉雅等500+家各行各业客户的信任,包括老东家腾讯。

音视频技术趋势:新场景层出不穷,玩法越来越多

随着接触到的客户越来越多,在行业里发展的越来越深,我们发现,音视频技术的应用场景远比想象中的多,应用规模也越来越大。

直播是音视频技术沉淀多年后得到的初步应用,也让大家意识到:音视频技术不仅局限用于会议系统这样的商业领域,也不仅仅是社交群聊,还能用在直播。而在直播中又延伸出如秀场直播、多主播连麦、直播相亲、直播答题、K歌合唱等泛娱乐直播场景。
在这里插入图片描述
泛娱乐直播无法忽视的是游戏直播,设备和网络的发展让游戏能支持更大的码率传输,音视频的介入,狼人杀、棋牌游戏等桌游线上化时更真实,玩MOWAA游戏、吃鸡、王者荣耀时语音沟通也让游戏更社交化,未来,音视频功能将会是游戏直播的标配,同时,越来越多游戏往社交化发展。

其中还延伸出彩票直播这种新奇的玩法,用户直接在线上购买彩票,即买即刮,直播兑奖,不再像以前一样需要到彩票点购买。

除了泛娱乐直播,音视频技术还能用在在线教育、金融、公检法、民生各种领域,还能跟各种硬件结合,实现不同的玩法。
在这里插入图片描述
在线教育不算是新场景,今年因为技术发展和环境的改善,还有教育机构的投入和运营,有很多种应用场景,如1对1、1对多的小班课堂,跨国小班、双师课堂、音乐陪练等。有个明显的改变就是体制内K12的中小学开始拥抱新技术,很多已经开始采用双师课堂的形式,实现了优质老师的共享。在学校推动和政府支持下,硬件发展也很快,像录播机、触控屏、黑板也改造成适应双师课堂的场景。

在线金融方面,视频开户、视频客服、视频投资顾问、视频双录很多证券公司和银行已经有在用了;企业级的又有企业直播、视频会议、呼叫中心、赛事直播等等,今年的世界杯和亚运会直播,咪咕直播就使用了即构的云导播台,不用专业的直播机器,就能快速地实现导播直播,融入更多互联网自由的元素。
在这里插入图片描述
即构为海淀工商分局打造的小程序视频办事平台

公检法也可以接入音视频技术,实现可视化执法、远程接访、视频庭审。民生政务方面,可以通过小程序接入技术,实现视频办事。即构6月给海淀工商分局做的平台,就让用户在小程序上通过视频通话就能咨询和办理业务,以往来几趟才弄好的事情现在几分钟就能搞定。

除了单一线上的支持,音视频技术也可以跟软硬件结合,形成一站式解决方案。拿线上抓娃娃机为例,线上涉及到APP/H5,线下涉及到一系列的娃娃机硬件,娃娃机要对接到互联网有很大障碍。去年娃娃机风口时,很多客户折腾了几个月,都没做起来。为了方便客户,即构直接在线下还建立了娃娃机房,将技术、软件、硬件全链条串起来,形成了一站式抓娃娃软硬件解决方案,客户只管专心做线上用户运营,其他全部由即构搞定。
在这里插入图片描述
我们也能看到,越来越多的智能硬件产品开始接入音视频技术,像无人机、车联网、机器人、智能眼镜等,两者结合后又能应用到不同的行业。以智能眼镜为例,能应用在铁路、电力、水利的巡检,巡检过程中和在办公室的专家远程互动,指导操作;同样的场景可以用在汽修厂、公安执法、银行导购当中。

技术的本质,是要无形融于各行业

综合以上使用场景,可以看到,实时音视频技术已经融于各行各业。

然而,在接触客户的过程中,我们发现很多客户排斥接入一个新技术,觉得技术和新场景结合起来非常痛苦,需要开发团队需要对原有业务进行改造,而这个改造的动作,造成了产品业务体验的差异,后续开发新的产品就有可能返工重造,扩展很不平滑,用户感受也不愉快,这种其实就是有形的技术。

我们要做的是将技术无缝融合到业务场景中,通过业务与技术结合,推动产品的持续发展,来增强用户的体验,而不是让其变得更差,用户在体验的时候是感受不到技术的,能感受到的是产品越来越好,用起来很愉快。
在这里插入图片描述
要真正把一个技术无形融合到产品当中,必须要下苦功。即构在三方面做了努力,一是坚持以技术驱动,自研音视频引擎,将80%的精力放在技术研发上。二是将技术从点做到面,从提供标准化的SDK,到提供全栈式的解决方案。三是以用户体验为导向,配置1对1咨询顾问,通过和客户深入交流产品应用的细节,及时收集解决问题,来不断打磨技术服务。

目前,即构已经服务了500+企业用户,覆盖了100+国家和地区,链接全球5亿+的终端用户。技术无形融入各行各业后,线上方式还原线下沟通场景,将帮助企业实现之前无法实现的场景,提高用户体验,让产品有更大的创新空间,也推动了整个社会高效地工作,加速全球资源共享和技术共享。

这篇关于让实时音视频技术融于无形的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/511473

相关文章

【专题】2024飞行汽车技术全景报告合集PDF分享(附原数据表)

原文链接: https://tecdat.cn/?p=37628 6月16日,小鹏汇天旅航者X2在北京大兴国际机场临空经济区完成首飞,这也是小鹏汇天的产品在京津冀地区进行的首次飞行。小鹏汇天方面还表示,公司准备量产,并计划今年四季度开启预售小鹏汇天分体式飞行汽车,探索分体式飞行汽车城际通勤。阅读原文,获取专题报告合集全文,解锁文末271份飞行汽车相关行业研究报告。 据悉,业内人士对飞行汽车行业

C#实战|大乐透选号器[6]:实现实时显示已选择的红蓝球数量

哈喽,你好啊,我是雷工。 关于大乐透选号器在前面已经记录了5篇笔记,这是第6篇; 接下来实现实时显示当前选中红球数量,蓝球数量; 以下为练习笔记。 01 效果演示 当选择和取消选择红球或蓝球时,在对应的位置显示实时已选择的红球、蓝球的数量; 02 标签名称 分别设置Label标签名称为:lblRedCount、lblBlueCount

金融业开源技术 术语

金融业开源技术  术语 1  范围 本文件界定了金融业开源技术的常用术语。 本文件适用于金融业中涉及开源技术的相关标准及规范性文件制定和信息沟通等活动。

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出 在数字化时代,文本到语音(Text-to-Speech, TTS)技术已成为人机交互的关键桥梁,无论是为视障人士提供辅助阅读,还是为智能助手注入声音的灵魂,TTS 技术都扮演着至关重要的角色。从最初的拼接式方法到参数化技术,再到现今的深度学习解决方案,TTS 技术经历了一段长足的进步。这篇文章将带您穿越时

系统架构设计师: 信息安全技术

简简单单 Online zuozuo: 简简单单 Online zuozuo 简简单单 Online zuozuo 简简单单 Online zuozuo 简简单单 Online zuozuo :本心、输入输出、结果 简简单单 Online zuozuo : 文章目录 系统架构设计师: 信息安全技术前言信息安全的基本要素:信息安全的范围:安全措施的目标:访问控制技术要素:访问控制包括:等保

音视频入门基础:WAV专题(10)——FFmpeg源码中计算WAV音频文件每个packet的pts、dts的实现

一、引言 从文章《音视频入门基础:WAV专题(6)——通过FFprobe显示WAV音频文件每个数据包的信息》中我们可以知道,通过FFprobe命令可以打印WAV音频文件每个packet(也称为数据包或多媒体包)的信息,这些信息包含该packet的pts、dts: 打印出来的“pts”实际是AVPacket结构体中的成员变量pts,是以AVStream->time_base为单位的显

前端技术(七)——less 教程

一、less简介 1. less是什么? less是一种动态样式语言,属于css预处理器的范畴,它扩展了CSS语言,增加了变量、Mixin、函数等特性,使CSS 更易维护和扩展LESS 既可以在 客户端 上运行 ,也可以借助Node.js在服务端运行。 less的中文官网:https://lesscss.cn/ 2. less编译工具 koala 官网 http://koala-app.

Spring的设计⽬标——《Spring技术内幕》

读《Spring技术内幕》第二版,计文柯著。 如果我们要简要地描述Spring的设计⽬标,可以这么说,Spring为开发者提供的是⼀个⼀站式的轻量级应⽤开发框架(平台)。 作为平台,Spring抽象了我们在 许多应⽤开发中遇到的共性问题;同时,作为⼀个轻量级的应⽤开发框架,Spring和传统的J2EE开发相⽐,有其⾃⾝的特点。 通过这些⾃⾝的特点,Spring充分体现了它的设计理念:在

java线程深度解析(六)——线程池技术

http://blog.csdn.net/Daybreak1209/article/details/51382604 一种最为简单的线程创建和回收的方法: [html]  view plain copy new Thread(new Runnable(){                @Override               public voi

java线程深度解析(二)——线程互斥技术与线程间通信

http://blog.csdn.net/daybreak1209/article/details/51307679      在java多线程——线程同步问题中,对于多线程下程序启动时出现的线程安全问题的背景和初步解决方案已经有了详细的介绍。本文将再度深入解析对线程代码块和方法的同步控制和多线程间通信的实例。 一、再现多线程下安全问题 先看开启两条线程,分别按序打印字符串的