Francois Chollet:Keras与Tensorflow,下一个5年计划(NVIDIA GTC 21演讲)

2023-10-27 19:40

本文主要是介绍Francois Chollet:Keras与Tensorflow,下一个5年计划(NVIDIA GTC 21演讲),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在GTC 21上,Keras的创建者Francois Chollet推出了了Keras和Tensorflow的下一个5年计划。 我们观看了演讲,将其中的要点摘录如下。

进度循环(Loop of Progress)

AI模型的改善遵循一个循环进步的模型,如下图所示。 加速技术进步的最有效方式,是消除循环中的瓶颈。
Loop of Progress
我们仔细考虑一下这个循环中的细节。从构想阶段开始,研究人员需要阅读文献,使用示例代码或自行复现结果,根据现有结果去提出新的假设,选择和调整模型。当模型部署在生产环境中,需要数据工程师版本化代码和模型,检测模型漂移,维护DevOps流水线,实现推理和监视性能。此阶段生成的高速数据,必须存储在实时数据库中,并使用Tensorboard等工具进行可视化,根据结果去修订之前的假设。这个过程不仅非常繁琐,而且还需要多领域的专业知识,对于较小的团队而言,这可能是不现实的。

Keras

Keras and TF

Keras是旨在使深度学习框架更易于访问的一个前端工具。 它最初是为Tensorflow编写的,但今天也可以兼容Pytorch,Theano等。 与软件业中常见的,以牺牲访问较低级别的API的自由为代价的封装方式不同,Keras应用了Chollet的“渐进的复杂性披露(Progressive Disclosure of Complexity)”哲学:逐渐提高的抽象层级服务不同角色和专业水平的用户。 机器学习工作流程的不同阶段也可以分别定制不同的复杂度,例如,数据科学家可以选择使用自定义运算符来在较低级别上构建模型,但是只需调用model.fit()方法即可对其进行训练。
在这里插入图片描述
在这里插入图片描述

Chollet将从事机器学习工作的用户大致分为三类:基本用户,工程师,研究人员;传统上他们仍然在各自的孤岛中工作,不便于思想的交流。Keras这个渐进的复杂性模式,为不同技能水平的用户提供了相对平滑的学习曲线。
Silos

可重用性(Reusability)

为了促进跨学科合作。 Keras将领域知识提炼成可重用的模块,例如用于计算机视觉的KerasCV和用于自然语言处理的KerasNLP。 终端用户也没有被忘记,Keras Applications,一个具有权重的预训练模型库将来也将被扩充。

自动化

自动化程度的提高同样遵循“复杂性的逐步披露”的座右铭,按复杂度由低到高顺序,Keras将会提供以下自动功能:

  • 超参数优化(KerasTuner)
  • 神经网络架构搜索
  • 功能库和终身学习
  • AutoML(AutoKeras)

KerasTuner

作为Keras超参数优化工具,KerasTuner是机器学习专家智慧的一个结晶,从一定程度上可以代替专家团队的不足:

  • 运行时自定义(define-by-run)动态搜索空间
  • 内置搜索策略:超频带(Hyperband),贝叶斯,随机搜索
  • 自定义搜索策略
  • 大规模分布式搜索
  • 内置“可调模型”:应用程序模板,只需要添加用户数据就可以自动实现超参数调优。

AutoKeras

上述的改进的升华产物,是一个叫做AutoKeras的AutoML工具,使得端到端机器学习工作流程像运行单个Python脚本一样便捷。
AutoKeras训练文本分类模型

生产化方面的改善

Loop of Progress,在云服务上的体现

Keras Preprocessing Layers(Keras 预处理层)

在现实环境中,常常会遇见生产数据与训练数据存在偏差,但是可以通过预处理的方式矫正的情形。这种预处理会引入训练/处理偏斜(training/serving skew),Keras对这个问题的回答是Keras Preprocessing Layers,这个处理层将预处理操作变成了模型的一部分,提高了模型的集成度。业界已经存在专业的图像预处理服务Roboflow,Keras除了图像处理之外,还引入了:

  • 文字向量化
    • 字符串的标准化(standardization)/清理
    • 标记化(Tokenization)
    • 索引(Indexing)
    • ngrams,TF-IDF(词频-反文档频率)
  • 图像预处理和增强
  • 结构化数据预处理
    • 索引
    • 哈希(Hashing)
    • 离散化(Discretization)

TensorFlow云

理想情况下,深度学习专业知识和基础架构等资源应该被包装成便于重用的形式。为了使Tensorflow更加接近这个理想,Chollet和团队开发了Tensorflow Cloud(TFC)。 TFC提供了一个方便的run方法,无需用户干预即可执行以下操作:将脚本或笔记本转换为可用于生产和发布的代码;构建具有所需依赖项的容器,并将容器映像存储在容器注册表中;部署容器,使用Tensorflow分发策略运行培训工作;使用Tensorboard传输日志并监控性能。

TensorFlow Tuner

TensorFlow Tuner是基于前述KerasTuner的一个优化工具,无缝集成了GCP上的Vizier。 Vizier是一个托管在GCP基础设施上的超参数优化服务,它是一个黑盒技术,所以采纳前需要考虑这个特点的影响。

睿极智能

睿极智能是专业的移动视频与融合通信解决方案提供商,以视频为核心,以技术创新为持续驱动,致力于无线视频通信技术研究,面向全球提供领先的可视化管理云平台、高度集成的无线图传核心模组、多样化的无线智能视频终端产品以及专业的行业应用解决方案。

作为国内移动视频领域的先行者之一,睿极智能一直在关注AI技术的最新动向,并积极的将最新算法和技术运用于我们的产品和服务中。我们将会在这里与大家分享我们的算法工程师在AI落地工作中的心得体会和对新技术的理解。欢迎读者在文末留言或私信,提供您的宝贵意见和观点!

这篇关于Francois Chollet:Keras与Tensorflow,下一个5年计划(NVIDIA GTC 21演讲)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/287922

相关文章

【LabVIEW学习篇 - 21】:DLL与API的调用

文章目录 DLL与API调用DLLAPIDLL的调用 DLL与API调用 LabVIEW虽然已经足够强大,但不同的语言在不同领域都有着自己的优势,为了强强联合,LabVIEW提供了强大的外部程序接口能力,包括DLL、CIN(C语言接口)、ActiveX、.NET、MATLAB等等。通过DLL可以使用户很方便地调用C、C++、C#、VB等编程语言写的程序以及windows自带的大

【JavaScript】LeetCode:21-25

文章目录 21 最大子数组和22 合并区间23 轮转数组24 除自身以外数组的乘积25 缺失的第一个正数 21 最大子数组和 贪心 / 动态规划贪心:连续和(count)< 0时,放弃当前起点的连续和,将下一个数作为新起点,这里提供使用贪心算法解决本题的代码。动态规划:dp[i]:以nums[i]为结尾的最长连续子序列(子数组)和。 dp[i] = max(dp[i - 1]

《计算机视觉工程师养成计划》 ·数字图像处理·数字图像处理特征·概述~

1 定义         从哲学角度看:特征是从事物当中抽象出来用于区别其他类别事物的属性集合,图像特征则是从图像中抽取出来用于区别其他类别图像的属性集合。         从获取方式看:图像特征是通过对图像进行测量或借助算法计算得到的一组表达特性集合的向量。 2 认识         有些特征是视觉直观感受到的自然特征,例如亮度、边缘轮廓、纹理、色彩等。         有些特征需要通

react笔记 8-21 约束性 表单

1、约束性组件和非约束性组件 非约束性组件<input type="text" name="" defaultValue={this.state.msg}></input>这里他的value是用户输入的值 并没有执行操作 只是获取到了msg的值 用户输入不会改变数据非约束性组件需要使用defaultValue获取数据 否则会报错约束性组件<input type="text

Claude Enterprise推出计划

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/ 今天推出的Claude Enterprise计划,专为企业打造安全的

为备份驱动器制定备份计划:维护数据的3大方法

时间:2014-02-26 14:49 来源:网管之家 字体:[大 中 小]   您可能已经对您的电脑进行了备份,但其实这样还是远远不够的,其并非如您所认为的那样安全。您企业备份驱动器上的文件可能与您的主系统上的文件一样,容易受到灾难的影响。根据最近流行的恶意软件CryptoLocker的感染途径显示,连接到PC的外置驱动器——辅助硬盘驱动器,例如,用于备份的外部USB硬盘驱动器,可以像

win10不用anaconda安装tensorflow-cpu并导入pycharm

记录一下防止忘了 一、前提:已经安装了python3.6.4,想用tensorflow的包 二、在pycharm中File-Settings-Project Interpreter点“+”号导入很慢,所以直接在cmd中使用 pip install -i https://mirrors.aliyun.com/pypi/simple tensorflow-cpu下载好,默认下载的tensorflow

稀疏自编码器tensorflow

自编码器是一种无监督机器学习算法,通过计算自编码的输出与原输入的误差,不断调节自编码器的参数,最终训练出模型。自编码器可以用于压缩输入信息,提取有用的输入特征。如,[1,0,0,0],[0,1,0,0],[0,0,1,0],[0,0,0,1]四比特信息可以压缩成两位,[0,0],[1,0],[1,1],[0,1]。此时,自编码器的中间层的神经元个数为2。但是,有时中间隐藏层的神经元

Tensorflow实现与门感知机

感知机是最简单的神经网络,通过输入,进行加权处理,经过刺激函数,得到输出。通过输出计算误差,调整权重,最终,得到合适的加权函数。 今天,我通过tensorflow实现简单的感知机。 首先,初始化变量:     num_nodes = 2     output_units = 1     w = tf.Variable(tf.truncated_normal([num_nodes,output

Tensorflow lstm实现的小说撰写预测

最近,在研究深度学习方面的知识,结合Tensorflow,完成了基于lstm的小说预测程序demo。 lstm是改进的RNN,具有长期记忆功能,相对于RNN,增加了多个门来控制输入与输出。原理方面的知识网上很多,在此,我只是将我短暂学习的tensorflow写一个预测小说的demo,如果有错误,还望大家指出。 1、将小说进行分词,去除空格,建立词汇表与id的字典,生成初始输入模型的x与y d