Alexa Prize冠军团队导师 - UC Davis助理教授俞舟专访

2023-10-09 20:50

本文主要是介绍Alexa Prize冠军团队导师 - UC Davis助理教授俞舟专访,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Robin.ly 是立足硅谷的视频内容平台,服务全球工程师和研究人员,通过与知名人工智能科学家、创业者、投资人和领导者的深度对话和现场交流活动,传播行业动态和商业技能,打造人才全方位竞争力。点击上方蓝字关注Robinly公众号。

本期Robin.ly专访特邀加州大学戴维斯分校计算机科学系助理教授俞舟博士。俞舟博士主要研究方向包括自然语言处理,多模态传感分析以及人机交互机器学习技术。她所带领的学生团队赢得了2018年的Alexa Prize,该竞赛旨在鼓励高校学生打造顶级聊天机器人,以推进会话式人工智能技术的发展。同年,俞舟博士入选了2018年度福布斯“30 Under 30”科学家名单。

俞舟博士在硅谷接受Robin.ly专访,分享她在自然语言处理领域(NLP)的研究经历与最新研究成果,以及2018年率队夺得Alexa Prize的经历与感悟。

俞舟博士在硅谷接受Robin.ly专访

 

长按二维码或点击“阅读原文”

访问Robin.ly观看完整访谈视频

 

 

1

   从学生到教授

Wenli:我看过您之前的一些采访。您说当初在申请CMU博士项目时凭借计算机科学和语言学的双学位在一众申请人中脱颖而出。语言学是一门很有意思的学科,能够帮助我们了解人类的思想和行为。我想知道语言学对您现在的工作有什么样的影响?

 

Zhou Yu:

我的研究领域是自然语言处理,也有人称之为计算语言学,主要是通过将机器学习、统计方法和语言学知识相结合来解决与语言学影响相关的问题。比如通过建立更好的语言系统来解决自然语言理解、生成以及对话设计之类的实际问题。我们想要了解人们交谈时的对话结构。利用这个结构训练的对话系统可以更好的理解对话流,并针对不同的个体提供个性化的答复。为了使系统更加智能化,还要了解人们对话中所表达的语义和句法。例如,用户是在问我一个问题还是在给我一个意见?这些都是跟语义密切相关的信息。

 

俞舟博士入选2018年度福布斯“30 Under 30”的科学家名单 (来源:Forbes)

Wenli: 提到了对整个社会NLP的需求与日俱增,业界正在使用聊天机器人进行无监督学习。有一些研究表明,到2020年,聊天机器人将为工业界节省高达80亿美元的费用。我们知道您的研究领域正在越来越多的受到工业界的关注,这些公司对您的研究有什么影响?您觉得学术界的研究和大公司自己的实验室研究有什么差别?

Zhou Yu:

工业界研究和学术界研究之间肯定存在,也应该存在差异。我认为学术界是一个选择研究方向最自由的地方。我也一直在跟不同公司的人交流,了解他们在算法,模型或数据方面的需求,以帮助他们建立可以覆盖数百万人的优化模型。而他们在资金和资源方面为我们提供了巨大的支持,让我们得以在有前景的方向上继续钻研。我们希望可以做更多具有前瞻性的基础研究,创建更加标准化的平台,生成更好的数据和评估指标,帮助公司实现具体的应用和宏伟的发展目标。

 

Wenli: 我们再说说教学。我知道您担任助理教授已经近两年了,那么您从研究生到教授经历了怎样的角色转换?您认为以前的教授对您的教学风格有什么影响

 

Zhou Yu:

以前的导师和其他资深教员让我认识到,教授的工作其实是创造一个支持协作和创新的良好环境,让所有学生都能从中受益,也能吸引其他优秀的学生加入我们,而学生们反过来也能维持或进一步改善这样的环境。我的工作除了促进这种良性循环,还要保证实验室有充足的研究基金,让学生们能够自由的选择自己感兴趣的方向;同时也要确保我们的工作能够被业界认可,让更多人从中受益。

 

 

2

最新研究与观点

Wenli:最近,您的论文无监督对话结构学习UnsuperviseDialog Structure Learning)被NAACL(北美计算语言学协会)收录这篇文章中涉及了哪些技术上的突破?在这之后还有什么最新进展吗?

 

Zhou Yu:

本文主要是关于使用一些无监督学习方法对递归神经网络所做的一些改变。我们的设想是在没有任何监督的情况下尝试从人和人的对话中自动学习对话结构,并利用这种结构来建立更好的对话系统。

 

目前的对话系统通常有两种类型的管道。一种我们通常称之为基于规则的对话系统,整个对话管理器由一个示意图触发,根据规则从一个对话状态转换到其他状态。另外一个被称为端到端可训练或基于统计的对话模块,也就是说你的对话模型在结构上是一种统计规则,包含各个状态之间的转换概率。我们的目标就是在对话中不存在任何标签的时候,让人们运行我们的算法。我们将会提供一个流程图,类似基于规则的系统,并在其中提供所有状态相互转换的概率。因此,如果你想在行业中构建基于规则的系统,我们的学习结构可以在初始阶段为专业人士节省大量时间,并提供关于数据更详细的信息。如果想在统计对话模块上构建统计方法,还可以使用我们的学习结构和转换概率来为基于强化学习的方法设计更好的奖励函数。

 

在最近的一系列研究中,我们希望建立一个只需要少量监督的对话系统,因为在实际应用中,没有人可以提供上千个标签对话框来训练一个好的系统。因此,我们真正关注的是如何减少建立良好对话系统和开展客服工作所需的资源。我们的一些后续工作是关于如何使用元学习和其他转移学习方法,让学习模型在对话中从资源丰富的领域过渡到逐渐适应资源贫乏的领域。有人把这个过程叫做单次学习或少样本学习。这一系列的研究与我之前的研究有很大差别。我之前主要研究多模态对话系统,也就是如何将不同的信息流,即视觉和声学语言结合在一起,以获得更好的用户体验。当然利用较少的监督进行学习的研究也非常重要,能够直接帮助行业逐渐接受和适应采用基于ML的对话系统。

Wenli: 您对GoogleBERTBidirectional Encoder Representations from Transformer转换器双向编码器表征有什么看法?有人说BERTNLP领域带来了重大变革

 

俞舟谈谷歌BERT在自然语言处理领域的地位

Zhou Yu:

BERT的确是一项非常好的创新,有助于完成下游任务,但这并不意味大家可以一劳永逸了。表征是非常重要和基本的,但它只是一种表现形式,创新应该体现在各个方面。所以通常在BERT所完成工作的基础之上,我们还有很多事情要做。针对特定的单项测试或特定类型的模型,我们希望确保基于BERT的创新可以改善目前的结果。

 

 

3

Alexa Prize夺冠经历

 

Wenli: 去年所带领的团队参与了Amazon Alexa Prize的聊天机器人竞赛。您和UC Davis 的14名学生所打造的聊天机器人与人类对话时间达到了10分钟,在所有参赛团队中最长,从而获得了第一名。能给我们回顾一下这段经历吗

 

Zhou Yu:

Alexa Prize是去年我们团队中一个非常重要的大项目,主要专注于改善社交机器人的用户体验。这是一项跨学科的工作,需要将人机交互知识、自然语言处理、基于知识的数据挖掘等所有这些学科结合在一起,创建一个能够流畅对话的机器人。Amazon为我们提供了一个很好的平台,让我们能够收集真实的用户数据,这在对话系统研究中非常重要。我们的系统在过去一年中覆盖了数百万用户,收集到的大量数据点让我们在使用他们提供的数据时表现更出色。我们认为这也是一个更大的责任。我们希望确保我们的网络聊天机器人不会让与之交互的用户被来自社交媒体和网络的偏见所影响。这段精彩的旅程让我们在业界获得了大量的认可,但仍然还有很长的路要走。我们今年还会继续参加比赛,进一步提高机器人的交流时间。

 

在过去的一年中,我们主要致力于开发更好的语言理解工具应对这种特殊的开放域的对话,处理具有ASR(Automatic Speech Recognition)错误的表达方式,让机器自动纠正和处理没有标点符号,没有大写,非常不规则的文本和被省略的部分。我们为开放域聊天机器人打造了一个工具包来进行句子分割,ASR错误纠正,对话行为预测和句法依赖性解析。我们打算在下一个Alexa Prize竞赛开始前发布这个工具包和带注释的数据。

 俞舟教授团队获得2018年Alexa Prize第一名(来源:Amazon)

Wenli: 我知道很多团队参加了不止一届竞赛,而你们完全是从零开始搜集数据。你们是如何克服新手面临的种种困难,最后夺冠的呢?在为期八个月马拉松式的比赛过程中,您本人扮演着怎样的领导角色?

 

Zhou Yu:

没错。我们去年参加Alexa Prize比赛的时候还是一个新的团队,包括我在内的所有人都没有任何参赛经验,学生们也不知道如何建立对话系统。我们完全处于劣势:没有累积任何数据,也没有现成的对话系统管道可以用。好在我之前的博士论文涉及到了这方面的一些知识,可以把其中对话结构应用于我们的管道中。虽然我们的起点很低,但是进步很快,逐渐后来居上。我认为所有学生的表现都很出色。

 

半决赛的时候,如果参考过去两个月的累计得分,我们的分数并不高,只能以外卡团队的身份继续比赛。但是决赛前的一两周,我们开始长期占据第一的位置。在这个过程中我们遇到了一些系统上的问题,会加剧系统延迟,从而对我们的评分产生了负面影响。一旦我们解决了这些问题,表现就会越来越好。在系统开发过程中肯定总会出现这样那样问题,这些都是很好的经验。

 

如果说我在比赛中扮演了什么样的角色,应该就是直接参与整个筹备和比赛的过程,每周都跟学生进行讨论,保证团队的进度。大家分工明确,团结协作。

 

UC Davis参赛机器人Gunrock(来源:Amazon)

Wenli: 你们为什么给机器人取名“Gunrock”为了夺冠做了怎样的准备工作?

 

Zhou Yu

这是个很有意思的问题。通常当人们想到“Gunrock”时,会觉得这是个男性的名字,跟Alexa的女性声音刚好相反。但“Gunrock”实际上不是人名,是UC Davis的吉祥物,一批蓝色的马的名字。所以我们团队是借用了这个名字。

 

针对比赛中的开放式对话系统,我们开发了新的自然语言理解工具包,也修改了语言的生成过程。例如,我们构建了自动算法,在恰当的时候插入一些停顿或者高级韵律提示音,比如“哇!”“哈哈!”,让这些对话系统更具情感色彩。这样一来,人们就会认为这种系统具备了更生动的表现力,不太流畅的表达听起来也更自然。

 

 

4

展望未来

Wenli: 在自然语言处理中通常使用什么样的指标来定义对话的优劣

 

Zhou Yu

这实际上取决于所构建的系统类型或所关注的任务。如果面对的是一个非常明确的协作任务,比如预订餐厅或者电影票,那么很多人会使用诸如任务完成率或者平均对话长度/效率等客观指标。还有一些比较主观的指标,例如用户可能会根据机器人的对话参与度,积极性或想要再次与机器人交谈的意愿来对机器人进行评价。但如果面对的是更复杂的测试,比如谈判或者劝说你做出什么样的决定,就更难评价机器人的表现。比如我们最近有一个新项目,利用一个名为“劝说”的新数据集说服人们给慈善机构捐款。你可以根据被劝说的对象,劝说成功的可能性以及捐款的数额来设计任务并收集反馈。

 

Wenli: 与计算机视觉技术等其他领域相比,人类的语言性更难预测您在面对技术瓶颈时所做出的权衡是什么?

 

俞舟谈自然语言处理技术中的瓶颈

Zhou Yu

对话中的语言通常是按照一定的顺序出现的。但是这种形式可能表面上看起来很相似,表达的却是完全不同的意思,系统的分析就会进入完全不同的路径。所以通过一个大数据集覆盖所有的可能性是很难的,尤其是对于交互系统来说。这就是为什么很多人会建议使用模拟器来模拟用户的行为方式。那么另一个问题就是如何建立一个标准化的优质用户模拟器,以便人们知道他们在使用相同的标准进行测试。这些都是对话领域比较大的问题。

 

我们最近正在为EMNLP会议(自然语言处理实证方法大会,NLP领域顶级会议)做准备,将使用所训练过的各种模型发布不同的用户模拟器,人们就不再需要构建自己的模拟器。我们还会为模拟器提供用户排行榜,让大家了解其他比较对象的信息。

 

Wenli: 您在这个领域有什么具体的目标吗?还有哪些地方需要改进?

 

Zhou Yu:

我一直想要打造一个真正智能化的系统,尽一切可能让机器理解常识和会话情境,有求必应。 我们现在离那个目标还很远。可以参考那些脍炙人口的科幻小说和电影。比如之前一部著名的电影,《她》。电影中斯嘉丽·约翰逊所配音的一个语音助理可以帮助用户完成各种各样的任务,比如安排会议,阅读信件和撰写文稿;但它同时也能够以朋友的身份谈天说地,理解人类的情绪并做出回应。一个能够完成大部分任务的系统可以让人类从繁琐的任务中解脱出来。除此之外,能够真正理解人类情感并与人类建立友谊也是另一个重要的目标。(完)


相关阅读

Otter.ai创始人Sam Liang:智能记录你的生活对话

Mosaix首席科学家劳逆:弱监督学习是未来发展趋势

嬴彻科技CEO马喆人:构建智能卡车物流网络,引领自动驾驶落地

金沙江创投 张予彤:互联网下半场—从连接到数据

[对话大师: 李开复] 逐鹿AI, 真的有后发优势吗?

你“在看”吗?

这篇关于Alexa Prize冠军团队导师 - UC Davis助理教授俞舟专访的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/175490

相关文章

Science Robotics 首尔国立大学研究团队推出BBEX外骨骼,实现多维力量支持!

重复性举起物体可能会对脊柱和背部肌肉造成损伤,由此引发的腰椎损伤是工业环境等工作场所中一个普遍且令人关注的问题。为了减轻这类伤害,有研究人员已经研发出在举起任务中为工人提供辅助的背部支撑装置。然而,现有的这类装置通常无法在非对称性的举重过程中提供多维度的力量支持。此外,针对整个人体脊柱的设备安全性验证也一直是一个缺失的环节。 据探索前沿科技边界,传递前沿科技成果的X-robot投稿,来自首尔国立

docker基于minio部署outline团队知识库

outline 介绍 Outline 是一个开源的Wiki 知识库和团队协作文档管理工具,美观、实时协作、功能丰富且兼容 Markdown,设计用于帮助团队和组织有效地创建、共享和管理文档。 Outline 具有简单易用的界面和强大的功能,可以替代传统的文档管理系统,如 Google Docs 或 Confluence。Outline 提供了一种结构化的方式来组织信息,使团队成员可以快速访问和

2024数学建模国赛选题建议+团队助攻资料(已更新完毕)

目录 一、题目特点和选题建议 二、模型选择 1、评价模型 2、预测模型 3、分类模型 4、优化模型 5、统计分析模型 三、white学长团队助攻资料 1、助攻代码 2、成品论文PDF版 3、成品论文word版 9月5日晚18:00就要公布题目了,根据历年竞赛题目,可以分析A/B/C/D/E题目大概的类型,提前了解题目特点,在选题上就不会浪费过多时间。下面总结了一下5个题目各

PMP–一、二、三模–分类–14.敏捷–技巧–帮助团队交付价值的执行实践迭代和增量如何帮助交付工作产品

文章目录 技巧一模14.敏捷--实践--帮助团队交付价值的执行实践--持续集成--在不同层面测试、验收测试驱动开发 (ATDD) 、测试驱动开发和行为驱动开发、刺探 。90、 [单选] 敏捷项目的第一次迭代即将开始。发起人召集团队、Scrum主管、产品负责人和其他项目干系人参加启动会议。发起人强调需要在项目尽可能早的时候以最小的成本识别和应对项目风险。与会者实现发起人要求的最佳方式是什么?

一个人就能干一个团队剪辑工作?云微客就是这么神奇

你知道拍摄、剪辑一条视频需要花费多长时间吗?半个小时?还是一个小时呢?如果我想一天发布上百条视频,你觉得可能吗?很显然,仅凭个人是很难办到的,那么就需要借助工具,而云微客AI批量剪辑系统正好可以解决这个难题。 在当下这个短视频风靡的时代,不管是企业还是个人创作者们都需要借助各种工具和系统来提升创作内容的生产效率和传播效果。而云微客AI批量剪辑系统凭借着批量剪辑的功能,为创作者带来了很大的

掌握Git分支管理策略:让团队协作更高效

在现代软件开发过程中,版本控制系统(VCS)是不可或缺的一部分。Git作为目前最流行的分布式版本控制系统之一,为开发者提供了强大的工具集来管理代码变更历史。然而,仅仅掌握Git的基本命令并不足以应对大型项目和团队协作的需求。有效的分支管理策略对于保持代码库的整洁、促进团队间的高效协作至关重要。本文将探讨几种常用的Git分支管理模型,并提供一些建议来帮助你的团队选择最适合的策略。 常见的分支管

全国机器人大赛 Robocon 常州工学院团队首战国三

全国机器人大赛 Robocon 常州工学院团队首战国三 通宵7天7夜,常州工学院RC团队,首次闯入全国机器人大赛国赛,并成功得分! 不同于老牌强队,常州工学院(下面用"常工"代替)的这只队伍,大多数成员由大一组成,核心岗位由一些大二各个专业基础最为扎实的学生担任。 7月7日,19:26分。卡在报道的最后10分钟,由在团队项管和电控成功领队签到,光电Robot成为最近几年唯一一只冲入Roboc

Python知识点:如何使用Slack与Python进行团队协作

使用Slack与Python进行团队协作可以通过Slack的API来实现自动化消息发送、处理事件和管理频道等功能。以下是一些基本的步骤和示例代码来帮助你开始: 1. 创建Slack应用 首先,你需要在Slack上创建一个应用,以便获取API凭证: 访问 Slack API 页面 并登录你的Slack帐户。点击 “Your Apps”,然后点击 “Create New App”。选择 “Fro

活动预告|“AI+Security”系列第3期:AI安全智能体,重塑安全团队工作范式

由安全极客、Wisemodel社区、InForSec网络安全研究国际学术论坛和海升集团联合主办的 “AI+Security”系列第3期: AI 安全智能体,重塑安全团队工作范式  线下活动 将于2024年9月11日下午14:00 在中关村智造大街G座路演厅 正式举行 欢迎扫描海报中二维码报名参与 【会议议程】

职场关系课:团队坚决不能留的四种人(背叛者、搅局者、吸血鬼、吃白食者)

文章目录 引言I 团队坚决不能留的四种人背叛者搅局者吸血鬼吃白食者 II 和下属解约,追求的目标 引言 作为领导,不论好坏一视同仁是假公平,勤奋忠诚的员工们会很委屈,剔除害群之马,才是对好员工最大的尊重。 如果发现员工有背叛或者搅局的恶习,不要耽搁,你要赶紧解约。发现谁有吸血或者吃白食的兆头,你提示一次,最多两次已经足够。如果不改,那他就是禀性难移,也要趁早遣散。 过多的批评、