Transformer作者出走谷歌创业,专攻通用人工智能,已获得6500万美元投资

本文主要是介绍Transformer作者出走谷歌创业,专攻通用人工智能,已获得6500万美元投资,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

丰色 发自 凹非寺
量子位 | 公众号 QbitAI

最近,一家AI初创公司引起了不少人的注意。

在推特上宣布成立之时,有不少人为其点赞和转发。

5b55e87eb9282e40368c02b169bce61b.png

一上来就要搞通用人工智能,什么来头?

我们看了一下它的创始人名单:

fd087c2e0df64e47b6612d8281e9983e.png

Ashish Vaswani和Niki Parmar,这不是大名鼎鼎的Transformer论文作者吗?

这篇开山之作引用次数已高达4万,浏览新论文时经常会看到“(Vaswani et al., 2017)”的字样,以至于这个名字都快被刻进DNA了。

553b7b8b08a0030d96552a4f6ef3ef2b.png

他们这是,离开谷歌了?

Transformer作者出走谷歌创业

Ashish Vaswani和Niki Parmar两位作者在推特上的官宣证实了这一消息。

be5a60aa7fe122919c6937166e12f5e0.png
c34d54cb434a47c2ef3b87469d956b00.png

两位大佬在谷歌干了5年有余,做出了Transformer这一具有代表性的傲人成绩后,开始了新的职业生涯。

他们参与创办的这家AI公司,名叫Adept ,目标是创造让人和计算机能够协同工作的通用人工智能。

说的更直白一些,他们就是要打造一个通用模型,它能做到不是让人用计算机来完成工作,而是让人和计算机一起使用同样的工具合作完成工作。

至于为什么要离开谷歌创业,这事儿还是得从Transformer说起。

众所周知,2017年诞生的Transfromer,具有高度的通用能力,一路从最初的NLP横跨CV等领域,成为了不少巨型模型的基本架构,包括大名鼎鼎的GPT-3、BERT、AlphaFold等。

截止目前,Transfromer在谷歌学术上显示的引用次数已达40723次。

顺便还带火了“xxx is all you need”格式的论文标题党方式。

而Ashish Vaswani和Niki Parmar和其他创始人们,正是看重Transformer的通用智慧,他们表示:

Transformer应该是第一个对每个主要AI用例都能“正常工作”的神经网络。

这让他们相信:通用人工智能是完全有可能被实现的

但遗憾的是,尽管他们训练出了越来越大的Transformer,希望最终建立一个支持所有ML用例的通用Transformer,但眼下就已经出现了一个明显的限制:

Transformer可以写出一篇不错的文章,我们却没法要求它完成帮人订飞机票、给供应商开发票甚至做科学实验等等工作。

所以,这些人决定创办通用人工智能公司Adept。

正如前面所提到的,Adept要实现的通用人工智能模型不仅是读读写写,还能使用Airtable、Photoshop、ATS、Tableau、Twilio等工具帮你完成诸如“生成本月阅读报告”等工作。

因此有人认为,Adept的目标更像是协作智能,它选择了和其他通用人工智能(AGI)公司截然不同的实现道路,即并非建立AGI来接管各种有价值的任务,而是建立AI工具,来帮人类完成任务。这种方式更容易实现。

ff231b7192ec2aa61dccd8b3628485f2.png

创业阵容豪华

Ashish Vaswani博士毕业于南加州大学,在谷歌大脑工作已有5年;Niki Parmar则是在印度上完大学后,同样在南加州大学读完硕士,在谷歌工作了近7年。

Adept的创始团队阵容除了这两位以外也非常豪华:

  • Kelsey Schroeder,斯坦福大学计算数学(computational mathematics )专业硕士,前谷歌大模型生产infra的产品负责人;

  • Anmol Gulati,在谷歌主要做语音识别模型;

  • Augustus Odena,在谷歌领导大型语言模型相关的工作,也有不少图像合成方面的研究;

  • David Luan,前OpenAI加州实验室工程副总裁,参与过GPT-2、GPT-3、CLIP和DALL-E等模型的开发工作,后来他加入谷歌,担任谷歌大脑大模型研究的Director;

  • Erich Elsen,机器学习和高性能计算交叉领域的研究人员,前Deepmind员工,主要研究大模型,在更早之前,还分别在谷歌和百度(硅谷AI Lab)干了两年;

  • Fred Bertsch,谷歌数据和协作人工智能系统方面的专家。

最后一位,Maxwell Nye,是刚从MIT毕业的一位博士生,研究重点为自动代码生成。

总的来说,可谓大佬云集,且各有专攻。

他们的雄心壮志也顺利为公司拉来了6500万美元的天使轮融资,投资人包括Uber CEO、特斯拉自动驾驶负责人、Airtable创始人等。

目前,该公司已经开放招聘,共包含13种岗位。

4ba92e765a5fb98491ceb702c5f868f2.png

One More Thing

Transformer作者一共有8位,都具有同等贡献。

其实在Ashish Vaswani和Niki Parmar之前,已经有1位——Aidan N. Gomez也出来创业了

e8fccc3965037df1700ad758ea934c43.png

Aidan N. Gomez的公司Co:here还是专注于NLP。

Co:here去年5月成立,还不到一年,投资者阵容倒是也很强大,包括图灵奖得主Geoffrey Hinton、GAN之父Ian Goodfellow,以及斯坦福大学教授李飞飞等人。

不知道若干年以后,Adept以及Co:here能取得什么样的成果。

85ed117b5fa24939a1b986a7488169fd.png

参考链接:
[1]https://twitter.com/AdeptAILabs/status/1518975477917962245
[2]https://www.adept.ai/post/introducing-adept

这篇关于Transformer作者出走谷歌创业,专攻通用人工智能,已获得6500万美元投资的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/673177

相关文章

人工智能机器学习算法总结神经网络算法(前向及反向传播)

1.定义,意义和优缺点 定义: 神经网络算法是一种模仿人类大脑神经元之间连接方式的机器学习算法。通过多层神经元的组合和激活函数的非线性转换,神经网络能够学习数据的特征和模式,实现对复杂数据的建模和预测。(我们可以借助人类的神经元模型来更好的帮助我们理解该算法的本质,不过这里需要说明的是,虽然名字是神经网络,并且结构等等也是借鉴了神经网络,但其原型以及算法本质上还和生物层面的神经网络运行原理存在

人工智能做音乐

0 别人做的音乐demo https://yun.baidu.com/share/link?shareid=1799925478&uk=840708891 1 为什么人工智能能做音乐? 最下面蓝色的部分是你输入的音乐。 从上图可以看出,input是一个个的点,然后通过input来相互结合生成灰色的点,经过几层的连接之后,最后的Output就是新生成的音乐,也就是黄色的点。 把黄色的点

青龙面板部署通用教程,含服务器、路由器、X86等部署方法

1. 拉取镜像/更新镜像 docker pull whyour/qinglong:latest 2. 删除镜像 docker rmi whyour/qinglong:latest 3. 启动容器 普通服务器 docker run -dit \-v $PWD/ql/config:/ql/config \-v $PWD/ql/log:/ql/log \-v $PWD/ql/db:

“人工智能+”带来新变化

以生成式人工智能(AIGC)为代表的新一代人工智能技术创新加速演进,相关商业化应用成果也不断涌现,行业应用范围不断拓展,深度赋能实体经济,为行业提质增效与实现减排提供助力。 自主航运初创公司OrcaAI于6月18日发布研究报告显示,通过在海上航行中部署人工智能(AI),全球商业航运业每年可减少碳排放4700万吨。报告指出,借助AI技术,船员将能够得到实时提醒,因近距离遭遇

江西电信联合实在智能举办RPA数字员工培训班,培养“人工智能+”电信人才

近日,江西电信与实在智能合作的2024年数字员工开发应用培训班圆满闭幕。包括省公司及11个分公司的核心业务部门,超过40名学员积极报名参与此次培训,江西电信企业信息化部门总监徐建军出席活动并致辞,风控支撑室主任黄剑主持此次培训活动。 在培训会开幕仪式上,徐建军强调,科创是电信企业发展的核心动力,学习RPA技术是实现数字化转型的关键,他阐述了RPA在提高效率、降低成本和优化资源方面的价值,并鼓励学

如何在OS中获得SSD的寿命耐久度

这里还是以DELL的机器为例,通常DELL的服务器带有的磁盘会有显示SSD耐久度,当然也不排除SSD更新太快,有部分SSD无法在戴尔的服务器上查看到SSD的耐久度,但实际上本身只要是SSD肯定还是可以有方法查看SSD的耐久度,可以通过OS的方式进行查看,以RHEL7.9为例 首先我们需要下载安装DELL的PERCCLI的阵列卡工具,该工具可以很好的查看DELL服务器上的阵列卡对应的信息,如阵列卡

【图像识别系统】昆虫识别Python+卷积神经网络算法+人工智能+深度学习+机器学习+TensorFlow+ResNet50

一、介绍 昆虫识别系统,使用Python作为主要开发语言。通过TensorFlow搭建ResNet50卷积神经网络算法(CNN)模型。通过对10种常见的昆虫图片数据集(‘蜜蜂’, ‘甲虫’, ‘蝴蝶’, ‘蝉’, ‘蜻蜓’, ‘蚱蜢’, ‘蛾’, ‘蝎子’, ‘蜗牛’, ‘蜘蛛’)进行训练,得到一个识别精度较高的H5格式模型文件,然后使用Django搭建Web网页端可视化操作界面,实现用户上传一

通用大模型 vs垂直大模型:AI界的“宫斗大戏”

科技圈最近可真热闹,AI大模型的“宫斗大戏”让人眼花缭乱。两个阵营:通用大模型和垂直大模型,正在上演一场激烈的“权力的游戏”。到底谁能笑到最后?咱们一起来“吃瓜”看看吧! 首先,登场的是“全能王”通用大模型。它们就像是学习成绩顶尖、体育全能的学霸,什么都懂,什么都能干。 通用大模型:全能选手看看这家伙的优势: 通用大模型就像那种考上清华北大的学霸,不管是文科还是理科,全都能拿下。从写文章到

【JavaSE ⑧】P219 ~ 225 Date类‘’DateFormat类转化Date和字符串;Calendar类获得日历中某值,修改日历,日历转日期

目录 日期时间类1 Date类概述常用方法 2DateFormat类构造方法格式规则常用方法parse方法format方法 3 Calendar类概念获取方式常用方法get/set方法add方法getTime方法 ● 练习1.判断Date不同参数构造的输出2. 用日期时间相关的API,计算一个人已经出生了多少天。3. 获取Calendar对象,输出日历当前年,月,日4. 把日历转换为日期

游戏高度可配置化(一)通用数据引擎(data-e)及其在模块化游戏开发中的应用构想图解

游戏高度可配置化(一)通用数据引擎(data-e)及其在模块化游戏开发中的应用构想图解 码客 卢益贵 ygluu 关键词:游戏策划 可配置化 模块化配置 数据引擎 条件系统 红点系统 一、前言 在插件式模块化软件开发当中,既要模块高度独立(解耦)又要共享模块数据,最好的方法是有个中间平台(中间件)提供标准的接口来进行数据的交换,这在很多行业软件开发中已经广泛应用。但是,由于中间件的抽象和封