同样是人工智能研究,学术界与产业界有啥不同?

2023-11-04 03:40

本文主要是介绍同样是人工智能研究,学术界与产业界有啥不同?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

640?wx_fmt=jpeg

人工智能领域,产业界与学术界除了薪资不一样,究竟还有什么不同?

文︱Synced

译︱TechSugar编辑部

图︱网络


本文翻译自Synced,英文原链接见文末。原标题:Are Commercial Labs Stealing Academia’s AI Thunder?


由Google Research(谷歌研究院),DeepMind和OpenAI运营的产业研究实验室正在人工智能时代中“呼风唤雨”。大资本赞助的AI实验室正在席卷各大科技期刊,不断霸占主流媒体的头条。


然而,学术界却对产业界实验室所取得的关注持怀疑态度。许多大学教授认为,产业实验室的研究成果可以反映出工厂的研究工作,但没有任何科学见解。此外,教授们还担心学术届对应届毕业生和年轻研究员的吸引力正不断下降,尤其在薪资层面的对比上。此外,产业实验室也拥有更高的研究成果转换率。


从这些因素来看,学术界似乎缺乏推动创新和培养下一代的能力。


DeepMind AlphaFold来自学术界


去年12月,在蒙特利尔举行的“2018年神经信息处理系统会议”(NeurIPS)期间,英国研究公司DeepMind推出了AlphaFold,在“蛋白质结构预测奥运会”CASP13比赛中,力压其他参赛者。


在这项挑战赛中,各参赛队伍的任务是“蛋白质折叠问题”——基于蛋白质基因序列,预测其氨基酸残基将折叠成何种复杂的蛋白质3D结构。蛋白质越大,氨基酸之间的相互作用就越多,建模也就越复杂,困难会成倍上升。


DeepMind经常在高知名度的人工智能会议上宣布其人工智能技术的突破,尤其在NeurIPS(前NPIS)上。在NIPS 2013上,DeepMind推出了首个深度强化学习模型,在多数Atari游戏中取得最优的成绩,其中有三款游戏在测试中战胜了人类。在2017年的NIPS大会上,DeepMind创始人兼首席执行官Demis Hassabis宣布,其Go-master人工智能计算机AlphaZero 24小时内就能在国际象棋和围棋方面达到超人类水准。


DeepMind在蛋白质折叠方面的进展无疑令人印象深刻:AlphaFold的得分比排名第二的团队高出20分,实现了CASP所说的“在计算方法预测蛋白质结构方面的空前进步”。


640?wx_fmt=gif


然而,2018年的NeurIPS大会上几位教授表示,DeepMind的成就“缺乏创新”。杜克大学教授陈怡然称:“许多学者指出,DeepMind最近的蛋白质折叠研究在理论上没有任何创新,只是将现有的技术应用于新的场景。”


不少学者担心,那些关于DeepMind新闻稿中相关措辞会产生连锁反应。一位不愿透露姓名的学者告诉Synced,蛋白质折叠的新闻稿并没有提到这项是建立在此前学术界的基础之上的:“新闻稿在某种程度上误导了公众,让他们相信DeepMind发明了自己的深度学习算法。”


目前流行的蛋白质折叠技术通常包括两个主要步骤:1,了解蛋白质分子的形状与其氨基酸序列之间的关系;2,根据这些信息建立一个蛋白质的三维模型。过去几年的大多数研究工作(包括AlphaFold)都旨在提高第一步的准确性。


2017年1月,芝加哥丰田技术研究所(Toyota technology Institute at Chicago)教授Jinbo Xu开发了一种公认为该领域第一个实验可行的深度学习方法,并取得了重大进展。Jinbo Xu应用深度卷积残差神经网络预测哪些氨基酸残基处于接触状态,即接触预测。


Jinbo Xu的工作促使许多蛋白质折叠研究小组重新实现了他的算法,并产生了优于以往方法的性能。在CASP13比赛中,许多参赛团队的预测器(尤其是接触预测器)使用了深度卷积神经网络,其中包括DeepMind的AlphaFold。考虑到大多数团队都没有DeepMind的工程和计算资源,DeepMind的成功并非出乎意料。


由于DeepMind还没有发表关于AlphaFold的论文,他们的方法是基于基本的科学见解还是高超的工程技术,不得而知。哈佛医学院生物学家Mohammed AlQuraishi认为AlphaFold是两者的结合——因为DeepMind使用深度学习来预测氨基酸对之间的距离,而不是残基的接触。


Jinbo Xu于2017年首次提出将深度卷积残差神经网络扩展到距离预测中,并在其2018年发表的论文《利用残差协变和深度学习进行蛋白质线程化》(Protein threading using residual co-variation and deep learning)中提出了这一想法。在DeepMind公布研究结果的一个月前,徐教授在《深度学习驱动下的基于距离的蛋白质折叠》(the paper distance-based protein fold by Deep Learning)上发表了他关于基于距离的蛋白质折叠的最新研究成果,该论文发表在预印平台Biorxiv上,并被2019年顶级计算生物学大会RECOMB接收。



职业选择:学术or产业?


一位普通的计算机专业毕业生面临两种可能的职业道路:1,加入一个学术机构,从事基础研究或概念验证调查;2,成为一名行业研究人员,专注于产品或服务的改进。


随着DeepMind、谷歌研究院和微软研究实验室(Microsoft Research labs)越来越多的将触手伸到前沿研究,学术和商业公司之间的区别最近变得模糊起来。例如,在2015年NIPS上,谷歌有25篇论文被接受,到2018年,这个数字增加到了107篇,占会议接受论文总数的10.5%。


特斯拉人工智能总监Andrej Karpathy在他的博客中写道:“当我攻读博士学位(~2011年)时,行业研究还不那么普遍。在图形(如Adobe / Disney 等)中很常见,但在人工智能/机器学习中则不多见。时过境迁,单从主观角度,行业参与度已经显著提高。”


人工智能社区见证了人才从学术界流向商业届的单向流失。不可否认,成为行业研究员有很多优势。美国国际集团(AIG)统计机器学习主管Yuanyuan Liu表示:“行业研究员正专注于特定产品,却对特定领域不怎么感兴趣。他们的研究方向与现实世界相联系,研究成果到产品实现的转化率相对较高,有大量有价值的数据可供研究。”


640?wx_fmt=png

 

如前所述,毕业生职业规划的另一个强烈因素就是更高的薪水。据《纽约时报》报道,缺乏或没有行业经验的人工智能专家年薪和股票可达30万至50万美元。根据DeepMind在英国提交的年度财务文件,该公司2016年向其400名员工支付了总计1.38亿美元的薪酬。如此说来,包括研究员和其他工作人员在内,平均每人34.5万美元。相比之下,Glassdoor的数据显示,计算机科学教授的平均年薪不到9万美元。


科技巨头们不仅瞄准了最近的计算机科学毕业生,还把目光投向了知名大学教授。2018年图灵奖的三位获奖者中, Geoffrey Hinton和Yann LeCun自2013年以来分别在谷歌和Facebook工作。


2018年图灵奖唯一一位留在学术界的获奖者是蒙特利尔大学计算机科学与运筹学系主任Yoshua Bengio。他表示,几年前从学术界到产业界的人才迁移甚至更糟:“在我们这一代人中,仍然在大学工作并从事深度学习研究的高级研究人员寥寥无几。即使在20年前或10年前我那一代研究生中,也没有那么多的人。”


640?wx_fmt=png

Yoshua Bengio


除了资金之外,在学术环境中进行人工智能研究还有其他的缺点。阿尔伯塔大学博士、Attain.ai的创始人Yuxi Li认为,尽管我们正处于大数据和深度学习的时代,但一些高级研究项目的计算能力可能在大学中还不够。此外,在产业研究实验室的研究合作者通常比大学的博士生更有经验。教授也需要花时间撰写研究经费申请和教书。


然而,学术界提供了一个理想的环境——没有强大的交付压力或商业化导向的研究限制,以产生重大突破。


卡内基梅隆大学教授Simon DeDeo在一篇博客文章中,就谷歌大脑或其他行业实验室对研究科学家的吸引力发表了看法:“谷歌可以击败堪萨斯大学,唯一的原因是他们可以雇用十倍数量的研究生。当然,两者的区别在于,英国的研究生有机会在智力上做出有意义重大的事情。在GR(谷歌研究)不是这样。”


“试想,在事业上升期的某一刻,让你的头脑和灵魂突然转变来做推动人类两千年发展的游戏中去,身在谷歌或者Facebook的你,会去做吗?”


产学界关系的新趋势


尽管学术界和产业界之间存在明显的利益冲突,但最近的趋势表明,两者在寻求努力达到互补。谷歌、Facebook、微软和亚马逊等公司正在为学术研究团体提供更多的资金、数据和计算资源等便利。


CMU助理教授扎克·利普顿表示,现在产学界有非常好的合作案例:“许多学术实验室一直受到资助和博士生支持,学生们甚至会直接受到赞助,还有一些实验性的项目正在涌现,产业界的研究人员在雇主的全力资助下重返博士学位。”


同样值得注意的是,许多大学教授现在被提供了在产业实验室的高级研究员职位,同时他们能够在大学继续教学。


Lipton说,顶尖研究人员留在学术界的一个主要因素可能是在那种环境下存在年轻有才华的学生。“一个才华横溢但年轻的研究员可能从未写过一篇论文,把他们变成一个成熟的独立研究者,这很令人兴奋。更多的是利己主义,名校的博士生的工作效率非常高,与他们合作让你可以从事一个更广阔、更有雄心的研究项目。”


教授们在学术和产业之间的时间安排比例从2:8到8:2不等,有的是1:1。Bengio说:“这种模式的优势在于那些教授可以继续监督研究生。


尽管选择投身到产业界仍是主流选择,但许多人工智能成就都源于多年的学术工作。显然,学术界需要新鲜血液来继续推动创新。如今,我们看到一个更加包容的学术环境,欢迎来自顶尖学府的年轻研究生,他们既想研究根本问题,又想对现实世界产生深远影响。


Bengio说,他看到新一批年轻教师选择回到大学教深度学习。“我们以这种方式失去了很多人,但情况正在好转。”


英文原文链接为:

https://syncedreview.com/2019/07/10/are-commercial-labs-stealing-academias-ai-thunder/?utm_source=quora&utm_medium=referral 


640?

1.国内芯片60个细分领域重要代表企业!

2.【暑期精选】μC/OS-Ⅲ高阶培训火热报名中~

3.美国突然解禁供货华为?恐怕是一厢情愿

4.不建议用STM32F1的RTC实现日历功能

5.任正非称“鸿蒙”适用于自动驾驶,而非手机!

6.ARM与RISC-V之争,后起之秀的优势在哪儿?

640?wx_fmt=gif

免责声明:本文系网络转载,版权归原作者所有。如涉及作品版权问题,请与我们联系,我们将根据您提供的版权证明材料确认版权并支付稿酬或者删除内容。

这篇关于同样是人工智能研究,学术界与产业界有啥不同?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/342982

相关文章

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

2. c#从不同cs的文件调用函数

1.文件目录如下: 2. Program.cs文件的主函数如下 using System;using System.Collections.Generic;using System.Linq;using System.Threading.Tasks;using System.Windows.Forms;namespace datasAnalysis{internal static

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

uva 10061 How many zero's and how many digits ?(不同进制阶乘末尾几个0)+poj 1401

题意是求在base进制下的 n!的结果有几位数,末尾有几个0。 想起刚开始的时候做的一道10进制下的n阶乘末尾有几个零,以及之前有做过的一道n阶乘的位数。 当时都是在10进制下的。 10进制下的做法是: 1. n阶位数:直接 lg(n!)就是得数的位数。 2. n阶末尾0的个数:由于2 * 5 将会在得数中以0的形式存在,所以计算2或者计算5,由于因子中出现5必然出现2,所以直接一

速了解MySQL 数据库不同存储引擎

快速了解MySQL 数据库不同存储引擎 MySQL 提供了多种存储引擎,每种存储引擎都有其特定的特性和适用场景。了解这些存储引擎的特性,有助于在设计数据库时做出合理的选择。以下是 MySQL 中几种常用存储引擎的详细介绍。 1. InnoDB 特点: 事务支持:InnoDB 是一个支持 ACID(原子性、一致性、隔离性、持久性)事务的存储引擎。行级锁:使用行级锁来提高并发性,减少锁竞争

MyBatis 切换不同的类型数据库方案

下属案例例当前结合SpringBoot 配置进行讲解。 背景: 实现一个工程里面在部署阶段支持切换不同类型数据库支持。 方案一 数据源配置 关键代码(是什么数据库,该怎么配就怎么配) spring:datasource:name: test# 使用druid数据源type: com.alibaba.druid.pool.DruidDataSource# @需要修改 数据库连接及驱动u

基于人工智能的智能家居语音控制系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 随着物联网(IoT)和人工智能技术的发展,智能家居语音控制系统已经成为现代家庭的一部分。通过语音控制设备,用户可以轻松实现对灯光、空调、门锁等家电的控制,提升生活的便捷性和舒适性。本文将介绍如何构建一个基于人工智能的智能家居语音控制系统,包括环境准备

linux中使用rust语言在不同进程之间通信

第一种:使用mmap映射相同文件 fn main() {let pid = std::process::id();println!(

一种改进的red5集群方案的应用、基于Red5服务器集群负载均衡调度算法研究

转自: 一种改进的red5集群方案的应用: http://wenku.baidu.com/link?url=jYQ1wNwHVBqJ-5XCYq0PRligp6Y5q6BYXyISUsF56My8DP8dc9CZ4pZvpPz1abxJn8fojMrL0IyfmMHStpvkotqC1RWlRMGnzVL1X4IPOa_  基于Red5服务器集群负载均衡调度算法研究 http://ww

生信圆桌x生信分析平台:助力生物信息学研究的综合工具

介绍 少走弯路,高效分析;了解生信云,访问 【生信圆桌x生信专用云服务器】 : www.tebteb.cc 生物信息学的迅速发展催生了众多生信分析平台,这些平台通过集成各种生物信息学工具和算法,极大地简化了数据处理和分析流程,使研究人员能够更高效地从海量生物数据中提取有价值的信息。这些平台通常具备友好的用户界面和强大的计算能力,支持不同类型的生物数据分析,如基因组、转录组、蛋白质组等。