回顾 | 阿里达摩院、腾讯、滴滴、Hulu等公司大牛的机器学习专场分享

本文主要是介绍回顾 | 阿里达摩院、腾讯、滴滴、Hulu等公司大牛的机器学习专场分享,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

640?wx_fmt=jpeg


整理 | CTA 直播小分队

出品 | AI科技大本营(id:rgznai100)


杭州国际博览中心,这里曾经是二十国集团领导人第十一次峰会的主场馆,5 月 26 日 CTA 核心技术与应用峰会(杭州)同样在这里正式召开!


正如 CSDN 谷磊总编在大会开幕词中讲到的,在过去 20 年时间里,CSDN 见证了技术浪潮从 PC互联网到移动互联网、大数据、云计算、人工智能、万物互联的发展阶段,也见证了一代又一代开发者从优秀到卓越的心路历程。在 CSDN 社区,大家开放共享的精神,成为后来者技术精进的阶梯。


640?wx_fmt=jpeg


本次大会的指导单位工业和信息化部人才交流中心的党委副书记陈新,也在讲话中特别提到数字经济人才聚集区的人才建设问题,将聚焦人工智能、大数据、云计算、物联网、VR/AR等前沿技术。工信部人才交流中心将通过整合国内外专业资源,打造数字经济人才学习交流、创新创业、合作共赢的平台,为当地数字经济产业的发展营造良好的产业发展生态。


640?wx_fmt=jpeg


随后,大会就进入了全天的技术风暴中,来自阿里巴巴达摩院、腾讯音视频实验室、Hulu 研究院、腾讯优图、滴滴、微博等科技公司的一线技术专家,带来了当下最新的技术成果与解读,为开发者在机器学习的研究与应用之路提供了深度、有价值的意见。接下来,就跟着营长一起回顾今天不可错过的精彩内容。


华先胜:AI技术与应用成功的关键因素是创造价值


阿里达摩院城市大脑实验室负责人华先胜指出,人工智能技术发展“泼了一盆冷水”,然后指出 AI 技术和应用成功的关键因素是创造价值:锦上添花、雪中送炭、无中生有,最后是形成商业价值。


随后,基于阿里在大规模AI应用场景的基础,他从视觉智能、视觉智造、视觉诊断和城市大脑四个层面具体讲述了以机器视觉为主的技术应用案例。以视觉搜索为例,其中的关键技术是特征学习以及索引和搜索系统,从其应用中得到启发是视觉搜索应该关注核心需求:技术至上vs应用先行、刚性需求vs锦上添花、用户先行vs数据先行。


而视觉智造的主要应用有视觉编辑(比如广告植入)、自动平面设计等。对此,他给出了实践经验:要创造一个需求(不只是来自设计师),只和行业顶尖高手合作,另外,要先关注刚性需求,而不是炫酷的技术,要用商业创新反哺技术创新。


最后,他总结了对人工智能技术实践的看法。第一,人工智能发展势不可当,进展迅猛,局限巨大,无行业不 AI;第二,不深入行业,就没有深度的AI,AI+算力+数据等于价值,要首先看到价值到底是什么;第三,人工智能发展机会非常多,要用AI做人力所不能及的事情,要让AI服务于人。


640?wx_fmt=png


高孟平:音视频领域应用落地广泛,未来挑战同样艰巨


腾讯音视频实验室专家研究员高孟平讲述了腾讯音视频实验室的多模态机器学习技术在人眼视觉服务中的落地情况。他表示,在视频服务里有几个重要的环节,如视频理解、处理、编辑、质量评估。利用深度学习等AI技术、基于人眼视觉标准的端到端视频处理平台,在视频理解、视频处理、质量评估等三个方向有非常深入的研究。


随后,高孟平从视频、音频、图像三方面分别讲述了智能封面的架构。关于未来的工作与挑战,高孟平举了两个例子进行说明。一是 Semi-Reference Architecture,二是使用图像美学(Image Aesthetics)的通用模型,因为有些内容是无法用精彩视频描述的,如QQ音乐、K歌等,没有特定的动作。如果直接透过图像美学的评价,不用精彩视频,或许也是一个好的解决办法。


640?wx_fmt=jpeg


谢晓辉:推动 AI 认知,解决语义的鸿沟,需要借助知识图谱等技术


Hulu首席研究主管谢晓辉分享了视频理解在个性化推荐与内容发现中的应用,内容涉及视频理解在内容冷启动、视频精细化标签和分组、深度推荐模型中的应用等。


随后在 Panel 环节中他还提到,所有在 AI 领域深耕的人,包括 Hulu,都会发现语义的鸿沟仍然是一个非常具有挑战性的问题,这最终还需要借助知识图谱等技术,来帮助整个AI认知取得新进展。


640?wx_fmt=png


彭靖田:TensorFlow 2.0 力图实现普惠 AI


谷歌机器学习专家彭靖田以《TensorFlow 2.0实现AI大众化》为题进行了演讲。他为大家分享到:TensorFlow 2.0 力图打造易于上手、性能强劲和灵活通用的端到端机器学习平台。通过 tf.keras 定义的高层次机器学习 API,用户可以快速验证模型效果、一键实现分布式训练、跨平台部署模型等。未来,TensorFlow 社区将持续提升用户体验,真正实现普惠 AI。


640?wx_fmt=jpeg


彭湃:让 AI 更有温度,“科技向善”也是使命之一


腾讯优图实验室高级研究员彭湃为大家讲述了内容审核工作中 AI CV算法的实践与应用。AI 出现之前内容审核的方式都是人工审核,人工审核一百张违规照片需要 12 分钟左右,如果是 AI,只需要 1 秒钟。而 AI 审核模型是通过深度卷积神经网络实现的,从实际业务场景中探索出双模型级联合结构——DeepEye。数据是核心弹药,如何构建符合实际需要,性价比高的数据?采用主动学习机制进行数据积累,通过数据引擎挑选出值得标注的数据。


如何把网络模型 ResNet-152 变为 ResNet-50,效率提升 2 倍,精度损失降低于 1%?在性能优化工作中设计了 Deepsmart 高效模型,采用知识蒸馏兼顾大模型效果与小模型的效率,以及有助于提升模型鲁棒性的数据扩增工作。20年后的今天,AI 带来这么多的技术的升级,“科技向善”也是 AI 的使命之一,我们 AI 从业者需要有更多的社会责任感和担当,让AI更有温度,科技向善,以人为本。


640?wx_fmt=jpeg


谢迪:动态恒常性是深度学习模型优化和稳定性的核心


海康威视研究院前沿技术部负责人、资深算法专家谢迪讲述了团队在完善机器学习流水线上的实践,包括信息生成(Annotation)、模型训练(Train)以及部署(Deployment)。通过分析信息初始化方法(即静态恒常性和动态恒常性)的一些特点和优势,可以得知:训练一个真正的深度网络,批量标准化是必要条件;二动态恒常性相比静态恒常性更为重要;三是相较于单个方向保持动态恒常性,在训练时保持两个方向同时保持动态恒常性,才是解决问题的关键;四是如果模型非常深,可能还需要显示对传播的信号进行调控调试。


最后,谢迪还总结了四点看法:一是在目前的深度学习框架中,模型对信息生成方式是非常敏感的;二是需要找到超越Bounding Box的更加优雅的表示方式;三是训练神经网络时,一个非常关键的因素是动态恒常性(Dynamic isometry ),它是深度学习模型优化和稳定性的核心;四是可能还需要显式对传播信号进行调制。


640?wx_fmt=jpeg


齐彦杰:决定 Push 效果的背后机制——博文质量、算法模型与分发效率


微博研发中心技术专家齐彦杰分享了微博基于机器学习在个性化 Push 任务中的实践与应用。微博的 Push 任务有基于热点、人物关系、地理区域、个性化信息等多种类型,齐彦杰特别针对个性化 Push 场景下的技术实践与应用、打通链路的关键技术做了详细解读。


4.6 亿 MAU 的微博是如何进行用户增长的?这不得不提个性化 Push 任务。而决定 Push 效果的背后机制则主要是博文质量、算法模型与分发效率三方面。机器学习架构自底至上主要包括基础数据、特征工程、模型服务于排序策略四层。在此架构之后,还有一个重要的技术环节——构建推荐系统,最后,通过兴趣、实时、关系与环境四个维度构建特征体系,选择拟合与用户之间的关系模型,无论是早期的 LR 模型、还是 FM 模型、wide&deep 模型我们都进行过尝试,而样本数量在其中发挥着不可忽视的作用。


640?wx_fmt=jpeg


熊超:对话问答通过图灵测试还有很长一段路要走


滴滴 AI Labs NLP 智能对话团队负责人熊超在分享中讲到,对话问答领域面临的最大的挑战就是图灵测试,目前的多轮对话能很好的回复问题,但并不表示完全理解了用户背后真正的意图,想要顺畅的解决特定领域的对话任务还需更长时间。


640?wx_fmt=jpeg


圆桌讨论:AI 如何助力认知能力,提升业务水平?


数字化信息时代,虽然所有行业都在进行数字信息化,但是却没有将其真正利用。借助深度学习的快速发展,现在大家开始试图借助 AI 技术理解真实世界。”如何利用 AI 算法认知世界“就成为了核心问题。在本次 Panel 中,各位嘉宾就将围绕这个核心问题,并结合实际的业务场景中,为大家分享 AI 技术如何赋能与真实落地场景?又面临着哪些挑战?


640?wx_fmt=png


营长特意将圆桌讨论中每位嘉宾的精彩观点进行了摘录:


谢晓辉:所有在 AI 领域深耕的人,包括 Hulu,都会发现语义的鸿沟仍然是一个非常具有挑战性的问题。做标签会发现标签距离最终产品想要的标签,二者间语义的鸿沟很大的。最终都要借助知识图谱等技术,帮助整个 AI 认知取得下一步的进展。过去几年,AI 像脱疆的野马,快速奔跑,无论是否逼进峰值,技术的快速发展都给产业落地留下了广阔空间,未来仍大有可为!


齐彦杰:推荐系统构建于认知层之上。如何基于多模态信息理解用户是当下的一个挑战。业内现在不仅会分析文本内容,图像内容,视频内容理解也成为技术热点。当前技术飞速发展,技术团队需要随着发展做出调整,提高效率,让技术更好地落地。同时,需要知道自身数据和哪些新技术契合,才能够更高效的提升自己的业务,不被淹没在新技术的海洋之中。


高孟平:我的业务中更多的关注于视频本身的理解,如标签或者高阶语义的理解。技术进展也推动了应用的发展,提供了问题的解决方案,但是很多仍存在挑战,还有很多无法解决,如质量评估。我们的解决的思路是:先定位问题,然后寻找 AI 的解决方法,最后通过业务利用客观指标反映技术的提升效果。如果只是在某个领域里不断刷新指标,反而可能错失新领域的应用机会。


熊超:我们现在做的是智能客服,在对话问答领域面临的最大的挑战就是图灵测试,尤其是在对话非常丰富的情况下,更是一项艰巨的任务。能很好的回复问题,但并不表示完全理解了用户背后真正的意图。其次,想要顺畅的解决特定领域的对话任务还需要一个质的飞跃,也许几年、十年甚至更长的时间。


彭湃:首先,内容审核业务面临的一个非常大的挑战就是:不同的客户,因其业务的形态不同,需要过滤的规则边界也会有所差异。其次,从 To C 产品到现在助力产业互联网,会服务不同的产业客户、面临不同的需求,而这些是否都是 AI 可以解决的问题,是需要思考的。20年后的今天,AI 带来这么多的技术的升级,"科技向善"也是 AI 的使命之一,我们AI从业者需要有更多的社会责任感和担当,让AI更有温度,科技向善,以人为本。


正如谢晓辉所总结的:“未来,机器学习技术仍具有广阔的空间,大有可为”,这并不是一句简单的鼓舞人心的话语,而是在各行业技术专家、各行业的技术落地等综合考量下,深入机器学习领域本身,对未来给予的厚望。今日暴露的短板正是明日奋勇前进的方向,也更是证明了,作为中国开发者,我们想做的、能做的还很多!


最后,再次奉上本次大会官方链接,一键获取大会活动详情及部分嘉宾演讲PPT:

https://bss.csdn.net/m/topic/cta_meet/index#


(*本文为原创文章,转载请联系微信1092722531


精彩推荐


6月29-30日,「2019第二届以太坊技术及应用大会」将在北京重磅开启,届时V神将携以太坊核心团队与国内外区块链大咖共同出席,深入探讨以太坊生态,赶紧扫码报名吧,名额有限,先到先得哟


640?wx_fmt=jpeg

这篇关于回顾 | 阿里达摩院、腾讯、滴滴、Hulu等公司大牛的机器学习专场分享的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/228272

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

百度/小米/滴滴/京东,中台架构比较

小米中台建设实践 01 小米的三大中台建设:业务+数据+技术 业务中台--从业务说起 在中台建设中,需要规范化的服务接口、一致整合化的数据、容器化的技术组件以及弹性的基础设施。并结合业务情况,判定是否真的需要中台。 小米参考了业界优秀的案例包括移动中台、数据中台、业务中台、技术中台等,再结合其业务发展历程及业务现状,整理了中台架构的核心方法论,一是企业如何共享服务,二是如何为业务提供便利。

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

【专题】2024飞行汽车技术全景报告合集PDF分享(附原数据表)

原文链接: https://tecdat.cn/?p=37628 6月16日,小鹏汇天旅航者X2在北京大兴国际机场临空经济区完成首飞,这也是小鹏汇天的产品在京津冀地区进行的首次飞行。小鹏汇天方面还表示,公司准备量产,并计划今年四季度开启预售小鹏汇天分体式飞行汽车,探索分体式飞行汽车城际通勤。阅读原文,获取专题报告合集全文,解锁文末271份飞行汽车相关行业研究报告。 据悉,业内人士对飞行汽车行业

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学