百度王海峰Quora总结百度工程师品质:务实,自驱,负责到底

本文主要是介绍百度王海峰Quora总结百度工程师品质:务实,自驱,负责到底,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

近日,百度副总裁王海峰博士受美国问答网站Quora邀请回答网友提问,回答了颇具代表性的十个问题,覆盖从中国人工智能的发展阶段到百度工程师的日常工作状态,十问十答的形式,为美国网友打开了解百度,了解中国人工智能的一扇窗。
图片描述

  Quora是问答型SNS网站,被誉为“获取高质量内容的来源地”,聚集了大量高质量知识用户。海峰受邀答疑的session上线后,大量海外网友关注,提问纷至沓来。

  王海峰是百度搜索业务的负责人,同时还负责手机百度、百度信息流、百度新闻、百度手机浏览器、自然语言处理、知识图谱、互联网数据挖掘等业务。他是自然语言处理领域世界上最具影响力的国际学术组织ACL(Association for Computational Linguistics)50多年历史上唯一出任过主席的华人,也是目前最年轻的ACL fellow,在人工智能领域有着重要影响力。此次参与网友问答,阐述他对人工智能及相关技术现状和未来的理解,王海峰在答案中写到,人类正在逐步进入人工智能时代,而百度的优秀工程师们将在其中发挥重要作用。
  图片描述

Quora问答为英文,以下为问答实录的中文翻译。

  1、中国人工智能的现状如何?

  中国的人工智能正在高速发展。今年,中国政府工作报告中首次提到人工智能,这表明中国十分重视人工智能的发展。包括百度在内的很多互联网企业都在加大人工智能方面的投入。其中许多企业都设立了专门的部门,推动人工智能在各自业务中的研发与应用。传统企业也在利用人工智能降低成本,以人工智能为核心业务的创业企业也像雨后春笋般涌现。

  此外,中国有许多大学和研究机构也在开展人工智能方面的研究。近些年来,越来越多的优秀科学家与学者们投入到人工智能领域,其中不乏业内公认的佼佼者。在今年的旧金山AAAI大会上,有大约三分之一的论文来自中国,比例与美国相当。

  人工智能不仅迅速应用于各大行业,也在改变人们的日常生活,包括交通、教育、医疗等各个方面。我相信,人类正逐步进入人工智能时代。

  2、百度的机器学习团队会不会录用不会讲中文的人才? 

  百度已经有不会讲中文的员工,而且不光是机器学习团队,其他团队也有。

  3、自然语言处理技术在中文和英文上主要有哪些不同? 

  从语言学上来讲,中文与英文截然不同。中文是孤立语,文本的词与词之间没有空格,主要通过词序来表示语法关系。这些因素加大了中文在词汇、句法和语义层面消除歧义的难度。相比中文,现代语言学的概念与语法更适用于英文。

  目前,大多数主流自然语言处理技术都同语言无关,比如各种统计或神经网络的算法。我们会根据不同的应用需求,对这些方法再进行语言相关的优化。

  比如,百度在2015年5月推出了首个在线神经机器翻译系统。其核心的NMT模型是与语言无关的,可以得到相当好的翻译结果。为进一步优化翻译效果,我们又根据具体语言的特征对翻译系统进行了优化。

   4、百度有没有与IBM Watson或者Facebook的Wit.ai类似的可访问的AIAPI? 

  请访问ai.baidu.com,就可使用语音、图以像、NLP、用户画像等百度人工智能技术。

   5、未来十年里搜索引擎会有怎样的发展? 

  现在一说到搜索引擎,大多数人会想到搜索框和搜索结果。那么未来的搜索引擎会是什么样子呢?现在还不好说。但是我们都愿意看到更加强大的搜索引擎,能够让我们在任意场景和产品中利用视觉、听觉甚至触觉等交互形式搜索。搜索将会无处不在。

  首先,对用户意图和内容更加深入的理解,以及更加精准的对意图与内容的匹配,都将大大增强搜索引擎的使用体验。理解用户意图不再仅依赖一次查询,而是包括更加复杂的搜索上下文、时间、位置、设备和用户的个性特征。而对内容的理解也将大大深入,不仅能更好的理解语义、语境、观点,还能理解内容的其他各个方面,从内容中抽取出知识。意图与内容的匹配也将考虑上述所有因素,提供更加贴合个人特征与具体语境的搜索结果。此外,搜索引擎也会更像“应答引擎”和“执行引擎”,能够直接回答问题或执行用户指令。

  其次,搜索引擎与用户的交互界面也将有更多创新变化。除键盘输入外,还将更加广泛地使用语音和图片等输入方式。随着语音、图像等技术更加成熟和实用,用户将可以使用更加高效、便捷的多模搜索。自然语言交互将成为搜索引擎的主流交互模式。用户可以与搜索引擎对话,直接告诉搜索引擎他们的需求,这比打开键盘输入要方便实用得多。用户可以通过多轮对话与搜索引擎交互,百度是最早尝试运用这种全新的交互方法提升用户搜索体验的公司之一。

  第三,搜索将不仅仅是使用搜索引擎,还会融入到各种产品中。比如说,搜索将成为智能硬件产品的核心功能。未来,搜索将无处不在,随处可见。而且,我们还将重新定义可搜索的内容,不仅包括当前搜索引擎已经索引的内容,还将纳入更多服务、物体、设备和数据。

  搜索引擎已是大家日常生活中必不可少的工具。用户需求决定搜索引擎的发展方向,而技术进步决定了搜索引擎的发展高度。

   6、百度产品如何应用NLP? 

  百度研发了多种NLP技术,包括知识图谱、语义理解、内容标签、情感分析、文本生成、摘要、深度问答、机器翻译和对话系统等。这些技术广泛应用于百度的搜索、信息流、智能助手等产品中,为数亿用户提供服务。我们还将这些技术集成到统一的平台之中,名为NLPC平台。NLPC平台提供二十多个NLP模块和技术解决方案,为百度产品提供全方位支持。我们的NLPC平台每天有上千亿次请求。

  比如在搜索上,分词、命名实体识别、句法分析和复述等NLP模块都是其必不可少的基础模块。这些模块一直在根据应用需求优化并实现技术突破。另一个NLP技术在搜索中的典型应用是问答。高性能的问答系统需要对查询实行精准的语义语法分析,构建大规模知识图谱,以及对网页搜索结果全面深入的分析。用户在搜索框中输入问题,搜索引擎就可以直接提供答案。很多用户会使用搜索引擎查找相关信息,来帮助做出决策。在这种情况下,情感分析(即观点挖掘),可以抽取出很多候选观点,聚合后提供给用户作为决策参考。

  再比如在信息流产品中,文章质量十分重要。NLP技术用于甄别并去除谣言、剽窃等垃圾文章。另外,文本分析可以识别出高质量文章,并为文章打上描述其质量的标签。从各个层面说明用户偏好的用户模型也要用到NLP技术。

  总而言之,对于各种与语言相关的产品,NLP技术都是必不可少。

   7、你如何看待自己从科学家到互联网公司业务副总裁的职业转变? 

  我热爱技术,并且喜欢投入到技术研究中去。我相信技术可以改变世界。百度为我提供了一个理想的平台,在这里,我的技术工作得以快速、直接地惠及用户。这就是我加入百度的首要原因。我在百度的前几年负责包括NLP、语音、图像、数据挖掘、知识图谱、机器学习和深度学习等在内的技术团队。

后来,我意识到伟大的产品是连接技术和广大用户的桥梁,并能推动技术进步。伟大的产品不仅需要先进的技术,更需要出色的产品设计、运营和高效管理。因此,我逐步从只带技术团队转变为全面的业务管理者。我现在的团队超过3000人,包括技术、产品、运营等各方面人才,他们年轻、充满活力、富有激情。我们同心协力,致力为用户提供更好的技术和产品,进而使人们的生活更美好。

  在管理大型综合业务团队时,首先要设定战略和目标,然后组建合适的执行团队。良好的制度和文化对于一个大团队来说非常重要,这是业务健康发展的支持和保证。与此同时,我会始终关注技术突破,用户需求的演变以及整个社会环境的发展变化。

   8、“百度”这个词的意思是什么? 

  我们的名字“百度”,其灵感来源于800年前中国宋代的一首词。“……众里寻他千百度,蓦然回首,那人却在灯火阑珊处。”百度的字面意思是“数百次”,代表对理想的不懈追求探索。

   9、在未来5到10年,我们将在自然语言处理领域看到哪些进步? 

  在机器翻译、语义理解、问答和对话技术方面将会有重大突破。而且这些技术将被广泛应用,使得人与计算机之间、人与各种智能硬件之间以及人与人之间的沟通和交互方式都会发生改变。

  上述技术进步将受益于以下四个方面的技术进展:大数据、学习机制、知识图谱、推理和规划。

  大数据——随着互联网的持续蓬勃发展,数据的数量和类型都在高速增长。即便是那些传统行业也开始把他们的数据迁移到线上,一切都在线上被连接起来。数据的价值随着物联网发展会越来越大。

  学习机制——学习机制也将持续进步,使我们能从更大规模数据中学习到更多知识。

  知识图谱——有了更大规模数据和更强大的学习机制,我们可以构建更完善更庞大的知识图谱,对整个现实世界进行建模。

  推理和规划——有了更完善更庞大的知识图谱,我们可以在推理和规划方面取得突破,推理和规划的能力将使自然语言处理系统变得更加智能。

   10、百度工作的工程师是怎样的? 

  百度工程师的典型工作状态是这样的:坐在工位戴上耳机一写代码就是数个小时;在会议室或休息室与其他工程师一起讨论技术问题或系统设计。你会看到他们一边在餐厅吃午饭或晚餐,一边在互相谈论算法优化;你会看到他们工作到深夜,废寝忘食。

  这里的工程师有他们自己鲜明的风格:务实、自驱和负责到底。我们鼓励工程师将想法付诸实践,有激情,有毅力,有责任感,能使梦想成真。百度搜索引擎每天为数亿人提供服务的同时,也使百度工程师能更好理解大多数用户的需求,进而有机会专注于最有价值的问题,并提出创新解决方案。百度作为一个平台,支持这有才华有热情的工程师实现他们的梦想。

  年轻的工程师也有机会去丰富自己的爱好,业余时间可以在健身房和瑜伽室进行锻炼。

  在百度,我们为每个新入职的工程师提供导师计划。导师会指导提升他们的技术能力,并帮助他们熟悉公司。我们为工程师提供在线学习课程,还有资深高工的技术讲座。工程师可以选择自己感兴趣的话题,了解前瞻技术进展。我们定期举办黑客马拉松,鼓励工程师大胆思考,与产品、设计等不同角色合作,创造出惊艳的产品。

  我相信百度是工程师钻研技术、提升自己最好的平台之一。

这篇关于百度王海峰Quora总结百度工程师品质:务实,自驱,负责到底的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/353714

相关文章

Python中实现进度条的多种方法总结

《Python中实现进度条的多种方法总结》在Python编程中,进度条是一个非常有用的功能,它能让用户直观地了解任务的进度,提升用户体验,本文将介绍几种在Python中实现进度条的常用方法,并通过代码... 目录一、简单的打印方式二、使用tqdm库三、使用alive-progress库四、使用progres

Android数据库Room的实际使用过程总结

《Android数据库Room的实际使用过程总结》这篇文章主要给大家介绍了关于Android数据库Room的实际使用过程,详细介绍了如何创建实体类、数据访问对象(DAO)和数据库抽象类,需要的朋友可以... 目录前言一、Room的基本使用1.项目配置2.创建实体类(Entity)3.创建数据访问对象(DAO

Java向kettle8.0传递参数的方式总结

《Java向kettle8.0传递参数的方式总结》介绍了如何在Kettle中传递参数到转换和作业中,包括设置全局properties、使用TransMeta和JobMeta的parameterValu... 目录1.传递参数到转换中2.传递参数到作业中总结1.传递参数到转换中1.1. 通过设置Trans的

C# Task Cancellation使用总结

《C#TaskCancellation使用总结》本文主要介绍了在使用CancellationTokenSource取消任务时的行为,以及如何使用Task的ContinueWith方法来处理任务的延... 目录C# Task Cancellation总结1、调用cancellationTokenSource.

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

百度/小米/滴滴/京东,中台架构比较

小米中台建设实践 01 小米的三大中台建设:业务+数据+技术 业务中台--从业务说起 在中台建设中,需要规范化的服务接口、一致整合化的数据、容器化的技术组件以及弹性的基础设施。并结合业务情况,判定是否真的需要中台。 小米参考了业界优秀的案例包括移动中台、数据中台、业务中台、技术中台等,再结合其业务发展历程及业务现状,整理了中台架构的核心方法论,一是企业如何共享服务,二是如何为业务提供便利。

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

git使用的说明总结

Git使用说明 下载安装(下载地址) macOS: Git - Downloading macOS Windows: Git - Downloading Windows Linux/Unix: Git (git-scm.com) 创建新仓库 本地创建新仓库:创建新文件夹,进入文件夹目录,执行指令 git init ,用以创建新的git 克隆仓库 执行指令用以创建一个本地仓库的

二分最大匹配总结

HDU 2444  黑白染色 ,二分图判定 const int maxn = 208 ;vector<int> g[maxn] ;int n ;bool vis[maxn] ;int match[maxn] ;;int color[maxn] ;int setcolor(int u , int c){color[u] = c ;for(vector<int>::iter

整数Hash散列总结

方法:    step1  :线性探测  step2 散列   当 h(k)位置已经存储有元素的时候,依次探查(h(k)+i) mod S, i=1,2,3…,直到找到空的存储单元为止。其中,S为 数组长度。 HDU 1496   a*x1^2+b*x2^2+c*x3^2+d*x4^2=0 。 x在 [-100,100] 解的个数  const int MaxN = 3000