旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问

本文主要是介绍旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

万万没想到,我和小伙伴们被旷厂拿去「炼丹」了。

没错,就是这个炼丹炉!

站在炉子中央,各种算法代码眼前飞闪,让我体验了一把时空穿梭的快乐。

OMG!真·颅内高潮...

业界认为「炼丹」过程正如算法研究过程。

众所周知,AI的三大支柱分别是数据、算法、算力。

那么在炼丹过程中,数据便是金木水火土等自然元素,算法框架是用来炼丹的炉子,算力就是炼丹炉下的三昧真火。

元素全不全,炉子好不好,火旺不旺决定了AI开发者能不能练出一颗AI的「灵丹妙药」。

从2014年至今,中国新一代炼丹宗师旷视经过多年的磨练打磨,打造了「炼丹房」—— Brain++。

MegEngine(深度学习框架天元)是丹炉,MegData(数据管理平台)是元素,MegCompute(深度学习云计算平台)便是那三昧真火。

这次,「炼丹房」 Brain++ 迎来了全新升级!

升级后的炼丹房,「自动」成为最大特色,炼丹师们不再需要经过九九八十一天这么漫长的时间来炼制丹药。

这个平台提供了怎样的最新功能,让AI开发者们更轻便地生产算法?

Brain++「神助攻」:一个「旗帜检测」算法诞生

熟悉旷视的人都应该知道,Brain++ 是旷视在AI领域创业多年的致胜法宝。

它将算法、算力和数据能力集为一体,核心能力包括:

数据的处理、清洗和管理能力,算力的共享、调度和分布式能力,算法的训练、推理及部署能力。

全面覆盖了从 AI 生产(输出算法模型)到应用(实现算法工程化封装)各环节。

因此,Brain++被内部定义为「AI生产力平台」。

但时局变了,数据满溢,算力飞升,算法无处不在。许多开发者们真正面临的挑战是:如何让算法生产更加高效?

要知道,算法生产能力决定算法价值上限。

当前的算法生产不仅仅是模型的训练,还包括需求分析、数据处理、上线部署、落地应用4个环节。

过程标准化是影响算法生产的关键要素,只有过程标准化才能实现算法生产的自动化。

让算法生产迈向自动化时代,便是Brain++迎接这一挑战的底气!

自动化的数据管理和质检——自动推荐合适的训练算法和模型——自动检查算法准确率并给出优化建议便是升级后Brain++的最新功能。

举个真实场景中的例子,

在钢铁冶炼厂中,存在一些比较危险的设备。根据生产安全的要求,这些设备周围需要插小红旗来做警示和标志。

如何能够检测出小红旗是否还插着?

这就需要做一个红旗检测的模型,通过安装的摄像头来进行自动化检查。

需求明确后就需要进行算法生产了。

首先,Brain++提供自动化的数据管理和质检,包含十余种质检策略,这个过程中可以排除无意义的数据。

下面这2个红旗就是通过自动化平台所发现,图片的画风其实和我们真实场景中的差别非常大,就属于一些无效数据,或者说噪音数据。

平台自动检测出后,就会在训练模型前帮你剔除。

然后便开始模型自动化训练,平台会根据部署资源的要求,为开发者自动推荐最合适的训练算法和策略。

这一环节中,就不需要开发者自己去学习到底应该怎样去选择算法或者调优模型。

接下来便是算法调优分析,Brain++集成十余大类不同的结果分析和对应的调优策略,比如漏检/误检结果呈现。

当红旗检测模型训练完成后,将其放到实际应用场景中测试,黄色框就是一次训练后的算法检测出来红旗的位置。

说明这一算法存在明显误检问题,特别可能在这样的一个场景误检率比较高,AI生产力平台便可帮助开发者自动发现问题,并给出针对性优化建议。

总的来看,当我们分析完想要做一个旗帜的检测需求之后,首先需要2个小时来做一个图像的质检和旗帜的标注,之后选择一个GPU的训练环境,模型训练的时间大概花费一个小时左右的时间。

在上线部署后,根据刚刚提到的分析和调优策略,研究人员进行了2轮左右的迭代,一个「旗帜检测」算法就诞生了!

你所感受到的便捷,是旷视通过总结过去10年算法生产落地的海量经验,探索出一套「快速、低成本生产算法」的模式,并将其沉淀在Brain++。

这十年,旷视AI创新走过怎样一个历程?

7月16日,由旷视首席科学家、研究院院长孙剑领衔的技术团队在2021旷视技术开放日(MegTech 2021)上分享了旷视十年来在AI技术上的实践和思考。

十年实践,首席科学家孙剑发AI「灵魂」三问

今年,是旷视成立的第十年。

我们来聊一聊旷视这十年的进阶之路。

首席科学家孙剑以旷视为例,总结了过去十年中国AI技术价值的发展历程。

2011年前后,AI发展的重点是基础科研。基础科研的关键点是突破单点算法,让AI率先在互联网等数字化程度高等领域应用落地,变得真正可用。

2015年起,AI需求越来越多,AI商业化落地也越来越多。这个过程中,算法在不断拓展应用的边界,从算法到软硬结合,AI创造的价值越来越大。

从2020年开始,AI成为新基建的重要部分,持续降低算法门槛,让AI生产变得更加容易,基础设施需要AI普惠化。

AI有没有用?AI在哪里用?AI易不易用?

这是AI行业的「灵魂」三问,是所有AI企业需要回答的问题。

孙剑认为,AI有没有用归根到底是看AI基础科研有没有突破。

基础科研是AI创新突破的基石,需要长期主义的坚持。

对旷视来说,要构建科学价值和产业价值统一的基础科研体系。

十年来,旷视不断突破创新:

在学术上发表85篇顶级会议论文,在竞赛上斩获40项冠军,在实用上研发了包括ShuffleNets系列在内的众多基础模型,已经广泛应用在手机等智能设备上,推动软硬协同发展。

基础科研有了,落地才是科研的价值,这就需要解决「AI在哪里用」的问题。

对于旷视,一直瞄准的是消费物联网、城市物联网和供应链物联网三大场景。

AI是核心能力,IoT是落地场景,在数字世界与物理世界融合的智能化时代,AI算法正在为产品带来更多的价值提升。

旷视认为,「算法不只让很多产品从好变更好,更能让产品从不可能变可能。」

在旷视十年的AI实践落地中发现,算法已不再仅仅是「软件物料」,而是成为「核心组件」。

从科研到落地,算法正在创造越来越大的价值,也在开始重新定义软硬件。

旷视研究员范浩强在MegTech 2021上的分享

AI落地是我们所有人都在讲的问题,但是当前,大量算法生产过程还是非标准化。因为非标准化所以算法生产过程充满不确定性。

旷视认为,落地实用是检验算法的最高标准之一,而生产落地实用算法的过程「只有先标准化才能自动化」,才能更进一步实现规模化的普惠易用。

从2014年至今,持续打磨升级的AI生产力平台Brain++,就是旷视推动算法生产迈向自动化时代的AI基础设施。

为什么是旷视?

不是炼丹「上瘾」,是AI进化

旷视是一家靠算法起家的公司。

准确来说,可以细分为两类:

一类是以深度学习(DL)和计算机视觉(CV)为基础的核心算法。

另一类则是行业算法 (或者称AIoT算法)。

旷视的算法之路,经历了从核心算法突破,到行业算法落地和创新,再到算法生产平台的拓展过程。

MegTech 2021上,旷视展示了其算法量产星空图。

算法量产不是一个单一产品,更不是「上瘾」,而是一种生产模式的理念革新和生产力进化。

旷视现场通过一系列技术Demo演示,系统展示了其最新的技术成果。

旷视研究院推出了面向服务器和下一代AI芯片的通用模型RepVGG,其在开源后Github star已超过1800。

还推出全景视频实时拼接算法。

全景视频拼接的实现,需要多个摄像头在同一场景下采集不同方向视频,然后逐帧地将各个方向的视频帧拼接起来,最终得到360度全景视频,甚至360度*180度的球面全景视频。

其核心是运用基于光流的多摄AI拼接算法,同时依靠实时动态无缝拼接网络模型,解决了多摄拼接计算量大、拼缝明显,以及拼接无法动态更新的技术难题。

还有单目3D车路感知:仅用单目可见光相机,就可以实现车路信息的3D感知。

旷视MegTech 2021上还展示了,目前性能最强的端到端实时全卷积全景分割算法,以及挑战经典,目标检测架构创新的YOLOF。

从基础科研,到行业落地,再到基础设施,这是人工智能技术价值跃迁的三个关键。

旷视正是沿着这样的路线在不断创新,务实落地。预研一代、孵化一代、交付一代,这是旷视技术创新研发模式。

在技术开放日现场,旷视将这一套创新研发模式首次对外完整的呈现出来。

孙剑总结道,「聚焦最优秀的人才,一起做最好的科研,通过产品让科研成果创造价值,不断探索新领域,这是旷视的秘诀,也是AI技术价值跃迁的秘诀。」

对了,忘了告诉你,这是一个北京新晋AI网红打卡圣地。

这篇关于旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/670529

相关文章

怎么关闭Ubuntu无人值守升级? Ubuntu禁止自动更新的技巧

《怎么关闭Ubuntu无人值守升级?Ubuntu禁止自动更新的技巧》UbuntuLinux系统禁止自动更新的时候,提示“无人值守升级在关机期间,请不要关闭计算机进程”,该怎么解决这个问题?详细请看... 本教程教你如何处理无人值守的升级,即 Ubuntu linux 的自动系统更新。来源:https://

Ubuntu系统怎么安装Warp? 新一代AI 终端神器安装使用方法

《Ubuntu系统怎么安装Warp?新一代AI终端神器安装使用方法》Warp是一款使用Rust开发的现代化AI终端工具,该怎么再Ubuntu系统中安装使用呢?下面我们就来看看详细教程... Warp Terminal 是一款使用 Rust 开发的现代化「AI 终端」工具。最初它只支持 MACOS,但在 20

你的华为手机升级了吗? 鸿蒙NEXT多连推5.0.123版本变化颇多

《你的华为手机升级了吗?鸿蒙NEXT多连推5.0.123版本变化颇多》现在的手机系统更新可不仅仅是修修补补那么简单了,华为手机的鸿蒙系统最近可是动作频频,给用户们带来了不少惊喜... 为了让用户的使用体验变得很好,华为手机不仅发布了一系列给力的新机,还在操作系统方面进行了疯狂的发力。尤其是近期,不仅鸿蒙O

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言