10亿元砸向研发,小冰到底要搞什么?

2023-10-21 01:40
文章标签 到底 研发 亿元 小冰

本文主要是介绍10亿元砸向研发,小冰到底要搞什么?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

金磊 发自 凹非寺
量子位 | 公众号 QbitAI

意外。

今年科技圈的“寒冬”大潮还在持续上演着,而有这么一则消息却与这股大势“背道而驰”:

小冰公司,完成10亿元新一轮融资。

64becdcfe9387a46e5f4be0ec3b4275f.png

这家公司,很多友友们并不陌生。

因为近几年出自它家的众多虚拟人,经常活跃出现在人们的热议话题中。

而随着这次最新消息的曝光,新融资的归去来,也成了外界最关心的问题,特别还是大环境不好的当前。

对此,小冰公司在官宣中也直接做了解答:

用于加速AI Being小冰框架技术研发。

未来一个季度内,完成框架中正在运行的30万名虚拟员工(AI Being Employee)的升级。

更进一步的,小冰公司更是直言了这些动作背后的一个“小目标”——

推动虚拟员工的普及。

87145200ea4559803336b005ed67f073.gif

至此,新的疑问也接踵而至:

让虚拟员工普及,靠谱吗?不会影响人类员工吗?

为什么现在“寒冬”已然如此,这事还如此受资本热捧?

带着种种疑问,我们不妨一同来挖一挖。

虚拟员工,真的有在干实事吗?

或许很多人对虚拟人能做的事情,印象都停留在具备娱乐、艺术性质的创作上。

例如小冰公司最初一批走红的虚拟人之一,夏语冰,就是一位作画高手。

3db9be2fd8b1058ae9b930f3e2b5ace8.png

而在此之后,国内市场上也逐步浮现出众多颜值超高、擅长绘画唱歌的虚拟人。

47ce5d4d7d74567a01d1554b1eb8fe65.png
柳夜熙、Ayayi

但事实上,虚拟人现在在人类生活中起到的作用,可不只是“你以为的你以为”了。

因为他们已经悄然在人类社会中上岗打工了,也就是我们刚才提到的小冰公司的虚拟员工。

既然是上岗,业绩是考核虚拟人打工的一个很好的标准,我们不妨一同来看看他们做的事,到底够不够实在。

例如每日经济新闻的主播N小黑/N小白,他俩便是非常典型的虚拟员工代表选手。

而且最初由于形象、播报方式过于逼真,连续播报了70天新闻,愣是没有观众发觉他俩不是真人。

f65b66f144bb8cad7bcb34a97a215cf9.gif

再如招商集团最近推出的一名虚拟员工招小影,外貌上不仅实现了与真人无异的神态,更是身怀“十八般武艺”。

她既有工作汇总、信息通知等通用技能,又具备专业领域知识和业务自动处理等能力。

62afe7b797977c84f2151fa0be954de8.gif

而在今年的冬奥赛事上,也出现了虚拟员工的身影,他就是冬奥数字教练——观君

更令人诧异的是,从披露的信息来看,“观君”作为非人类,冬奥前已在自由式滑雪空中技巧运动队“服役”了三年,助力取得了两金一银。

观君会针对运动员的每一跳做出专业判断,严格判别扣分动作,而且是与国际裁判计分准则保持高度一致的那种。

bc5b05a5e0646af7d1fc58e5d1b52ba4.png

具体应用里,观君会在运动员起跳、空中和落地三个阶段,做一个全流程动作量化的工作。

例如在下面的这段训练过程中,观君便能实时提供运动出台的速度和角度、最高点达到了多少米,还有落地点等信息。

2e0b87c0c3627662e5f52b18ba91cbfe.gif

不仅如此,就连冬奥播报天气的主播,也是由虚拟员工冯小殊来担任。

更早像万科集团的财务数字员工崔筱盼,更是因为斩获集团总部优秀新人奖而破圈出名。

de988c8164db68e41b161c644e4b0128.jpeg

……

不难看出,从业务能力上来看,小冰公司的这些虚拟员工可以说是高分通过考核。

所以他们是如何做到的?

主要依托其自研的小冰框架技术(Avatar Framework)。

例如在面容、表情、肢体动作在内的整体自然度可以做到真假难辨,主要是结合了小冰深度神经网络渲染(Xiaoice Neural Rendering,XNR)及小样本学习技术。

简单来说,这项技术主要包含三个步骤。

第一步是构建两个专家模型。

第一个是语音专家模型,基本的思路便是利用很大量的数据来学习、理解人类的语音。

例如人类在讲话讲到激动的时候,他的嘴型都会有比较明显的变化,而语音专家模型就是学会这项技能。

第二个是专家模型,则是通过采集摄像机等设备拍出来的人物视频数据,学习人类在说话过程中,嘴部的变化与眼睛、脸部其它肌肉之间如何产生微妙的联动变化。

如此一来,就能会让虚拟人在说话时,整个面部表情能够变得自然流畅。

第二步便来到了渲染的环节。

也就是将语音输入到深度神经网络渲染模型,而后会一帧一帧地渲染出自然的脸,并形成动态的过程。

但在这个过程中,前两个专家模型也会起到一个监督的作用,目的还是让整体效果能够自然。

第三步,则是一个自动化的过程。

也就是当把文字输入进来的时候,就会通过TTS(TextToSpeech)的方式,将文本变成语音。

而当机器接收到这些语音信号后,又会将其联动虚拟人的所有姿态、动作、表情等,最终生成一个完整的视频。

也正是在这种技术路线上的改变,最终才得以让小冰的虚拟人“瞒天过海”地骗过了人眼。

除此之外,小冰框架中还会涉及情感计算、全双工交互、超级自然语音等等,可以说是从全方面让虚拟员工无限逼近真人。

在此次融资消息对外公布的同时,小冰公司也宣称要拿这笔钱全部投入到研发当中。

其中就包括对旗下人工智能虚拟员工产品线启动年度升级,加强的技术包括大模型对话引擎、3D神经网络渲染、超级自然语音及AIGC人工智能内容生成。

……

所以,如此对比下来之后,不难看出现在虚拟人已经不再是“花瓶”般的摆设。

而是确确实实在各自的岗位上干着实事,并且还是让工作效率变得更高、工作质量也能加强的那种。

但小冰公司很显然的没有满足于此,从此次消息公布上来看,它还要继续造“人”。

虚拟员工的未来如何?

要回答这个问题,我们不妨从虚拟人赛道的大环境着手来看。

单就从2020年以来,小冰公司自身便已经经历了三次融资,并且早在去年便已经被估值到了10亿美元之多。

58a868e51705bfafc85761fe4df85bfc.png

很显然的,市场和资本对于虚拟人赛道可以说是看好的态度。

在量子位智库的《虚拟数字人深度产业报告》中,更大范围来看亦是如此。报告预测:

在2030年,我国虚拟数字人整体市场规模将达到2700亿

其中,得益于虚拟IP的巨大潜力,以及虚拟第二分身的起步,身份型虚拟数字人将占据主导地位,约1750亿,并逐步成为Metaverse中的重要一环。

服务型虚拟数字人则相对稳定发展,多模态AI助手仍有待进一步发展,多种对话式服务升级至虚拟数字人形态,总规模超过950亿。

而且从目前虚拟人市场发展情况来看,这个赛道仍处于前期培育阶段。

9801c18e2c9d173f4fc5d1bd16f47c48.png

在各行业近两年开始意识到其技术可行性和商业价值后,虚拟人行业将快速进入高速发展期。

首先,作为多模态升级的代表技术,虚拟数字人的应用场景众多,可广泛与各行业领域相结合,变现路径和市场潜力明确。其中虚拟直播、虚拟偶像已得到明确的商业价值验证。而虚拟分身生成等场景也已得到了资本和相关产业方的认可。

其次,大多数国内玩家为综合实力较强,发展成熟的AI科技公司,在客户积累、技术实力、销售渠道、资金供给等方面较为可靠,行业预计可直接进入平稳发展期。

最后,在多家业内代表公司看来,虚拟数字人作为Metaverse 主要的交互载体,具有明确的巨大增长潜力,并基于NFT、VR等有理想的延展空间。行业天花板高,能够维持长期和衍生发展。

这也就不难理解为何市场和资本会如此青睐以小冰公司为代表的虚拟人赛道了。

但另一方面,从更大范围的AIGC(AI生成内容)市场发展来看,更是印证了这点。

像Stable Diffusion的爆火,在仅发布一个月的时间内,其背后的公司便被估值到了69亿元。

这种火爆,未来的市场规模和前景也已经有了推测:

到2030年,AIGC市场规模或将超过万亿人民币。

0443375e63447aa6d06d4ab47ca94ce1.png

这是市场对于虚拟人、AIGC的肯定,而回归到小冰公司自身,其“打法”也是值得讨论一番。

其实早在元宇宙、AIGC等成为热词出现之前,小冰公司已然在AI作画、创作,情感计算等方面着手发力,像夏语冰那批虚拟人,便是很好的印证。

并且像AI Being这样的概念,也是由小冰于2019年率先提出,其前瞻性可见一斑。

在2020年年末,小冰公司董事长、清华大学双聘教授沈向洋在给吴恩达的新年贺词中也表示:

我预见2021年,人工智能社区将创造出更多工具来释放人类的创造力。人工智能将帮助世界各地的人们,以各有态度的方式去沟通和表达情感和情绪。

过去,期待在艺术领域里有所成就的专业人士,比如绘画、音乐、诗歌和舞蹈,必须长年学习和苦练。用中国老话讲,是“台上三分钟,台下十年功”;用流行语说,就是从平凡到专业的“一万小时”门槛。

我预期,诸如小冰X Suites这样的工具,可以帮助每一个人减少花费在重复练习上的成本,把宝贵的精力投入到创造更圆融的创意、更具想象力的表达上。

从现在开始,我们应该将注意力转移到AI帮助人们释放创造力这件大事上。

就目前看来,小冰公司已经是率先在AIGC形成稳定商业落地与文本、声音、图像的产品化阵列。

例如文本方面,小冰金融文本生成产品覆盖约90%的机构投资人。

在绘画方面,“夏语冰”创作的水墨画是唯一入选去年迪拜世博会中国馆的人工智能绘画作品。

又比如声音,由小冰进行词曲创作及歌声生成的各类作品,先后被采用为上海大剧院演出季、成都大运会、世界人工智能大会等重要活动的主题曲,也是今年首届全民阅读大会推广曲集中,唯一入选的人工智能作品。

而至于现在为什么要推广虚拟员工,小冰公司此前也是有所透露,这样做的目的并不是要让虚拟人替代人类,而是释放机械性质的劳动力,让人类更专注于创造性工作:

但目前的创新成就与未来理想状态相比还有很长一段路要走。

因此,这次小冰公司的融资要全部投入研发也就不难理解了。

或许在不久的将来,和你共事的同事是虚拟人不再会是什么新鲜事,反倒身边没有虚拟人同事,会成为怪事儿。

这篇关于10亿元砸向研发,小冰到底要搞什么?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/251076

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

跨国公司撤出在华研发中心的启示:中国IT产业的挑战与机遇

近日,IBM中国宣布撤出在华的两大研发中心,这一决定在IT行业引发了广泛的讨论和关注。跨国公司在华研发中心的撤出,不仅对众多IT从业者的职业发展带来了直接的冲击,也引发了人们对全球化背景下中国IT产业竞争力和未来发展方向的深思。面对这一突如其来的变化,我们应如何看待跨国公司的决策?中国IT人才又该如何应对?中国IT产业将何去何从?本文将围绕这些问题展开探讨。 跨国公司撤出的背景与

半年高达552亿元,锁定云第一,中国电信天翼云紧追不舍

【科技明说 | 科技热点关注】 刚才我注意到中国电信公布2024年中期业绩,报告期内,中国电信实现营业收入为人民币2660亿元,同比增长2.8%,其中服务收入为人民币2462亿元,同比增长4.3%;净利润为人民币218亿元,同比增长8.2%。 其中亮点,2024年上半年,天翼云保持快速增长,收入达到了552亿元,同比增长20.4%,占服务收入比升至22.4%,市场头部地位进一步巩固。 为

【H2O2|全栈】Markdown | Md 笔记到底如何使用?【前端 · HTML前置知识】

Markdown的一些杂谈 目录 Markdown的一些杂谈 前言 准备工作 认识.Md文件 为什么使用Md? 怎么使用Md? ​编辑 怎么看别人给我的Md文件? Md文件命令 切换模式 粗体、倾斜、下划线、删除线和荧光标记 分级标题 水平线 引用 无序和有序列表 ​编辑 任务清单 插入链接和图片 内嵌代码和代码块 表格 公式 其他 源代码 预

【秋招笔试】9.07美团秋招改编题(研发岗)

🍭 大家好这里是 春秋招笔试突围,一起备战大厂笔试 💻 ACM金牌团队🏅️ | 多次AK大厂笔试 | 大厂实习经历 ✨ 本系列打算持续跟新 春秋招笔试题 👏 感谢大家的订阅➕ 和 喜欢💗 和 手里的小花花🌸 ✨ 笔试合集传送们 -> 🧷春秋招笔试合集 🍒 本专栏已收集 100+ 套笔试题,笔试真题 会在第一时间跟新 🍄 题面描述等均已改编,如果和你笔试题看到的题面描述

Linux block_device gendisk和hd_struct到底是个啥关系

本文的源码版本是Linux 5.15版本,有图有真相: 1.先从块设备驱动说起 安卓平台有一个非常典型和重要的块设备驱动:zram,我们来看一下zram这个块设备驱动加载初始化和swapon的逻辑,完整梳理完这个逻辑将对Linux块设备驱动模型有深入的理解。 zram驱动加载的时候会调用zram_add函数,源码如下: 1887/*1888 * Allocate and initia

MVVM到底是什么

MVVM到底是什么 文章目录 MVVM到底是什么一、MVVM是什么二、为什么这么定义1. 分离关注点2. 提高可维护性3. 数据绑定和事件驱动4. 支持前端框架的发展 三、底层逻辑1. ViewModel层2. 数据绑定3. 事件驱动4. 响应式系统 四、扩展与高级技巧1. 组件化开发2. 双向数据绑定3. 计算属性和侦听器4. 插槽

我们在学习Spark的时候,到底在学习什么?

我必须要说,Spark这个框架出现之前,我对很多大数据领域的框架源码甚至都是嗤之以鼻的。 很多小伙伴在群里或者私信留言问我关于Spark的学习路径问题。 Spark发展至今,应该说已经非常成熟了。是大数据计算领域不得不学习的框架。尤其是Spark在稳定性和社区发展的成熟度方面,基本可以吊打其他的大数据处理框架。 我之前发过一篇关于阅读Spark源码的文章:《Spark源码阅读的正确打开方式》

【硬刚大数据】我们在学习Flink的时候,到底在学习什么?

⭐⭐欢迎关注博客主页:https://blog.csdn.net/u013411339 ⭐⭐欢迎点赞 👍 收藏 ⭐留言 📝 ,欢迎留言交流! ⭐⭐本文由【王知无】原创,首发于 CSDN博客! ⭐⭐本文首发CSDN论坛,未经过官方和本人允许,严禁转载! 本文是对《【硬刚大数据之学习路线篇】从零到大数据专家的学习指南(全面升级版)》的面试部分补充。 这是一篇指南和大纲性质的文章。

【硬刚大数据】我们在学习Spark的时候,到底在学习什么?

欢迎关注博客主页:https://blog.csdn.net/u013411339 欢迎点赞、收藏、留言 ,欢迎留言交流!本文由【王知无】原创,首发于 CSDN博客!本文首发CSDN论坛,未经过官方和本人允许,严禁转载! 本文是对《【硬刚大数据之学习路线篇】从零到大数据专家的学习指南(全面升级版)》的面试部分补充。 很多小伙伴在群里或者私信留言问我关于Spark的学习路径问题。