除了AI赋能,讯飞年度发布会还上演了一场「意念控制家居」秀

2023-11-09 10:40

本文主要是介绍除了AI赋能,讯飞年度发布会还上演了一场「意念控制家居」秀,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

撰文 | 王艺


目前,使用科大讯飞的人次超过 40 亿次,其中 20% 是用于教育学习,其余与社交、生活等相关。科大讯飞董事长刘庆峰在作主旨演讲时表示。


11 月 9 日,2017 年科大讯飞年度发布会在国家会议中心举行。在这场主题为「顶天立地、AI 赋能」的发布会上,我们看到了以语音技术起家的讯飞,正进一步加强 AI 在教育、医疗、车载、家居等领域的落地。在人工智能技术基础上,讯飞针对产品做了大量设计和工程化处理,直击用户痛点,努力实现普惠和赋能。


2016 年成立的消费者 BG,被视作集团最高权重的业务单元,当前该业务尚无营收权重,但它承载了讯飞所有的美誉度和「愿景」。从今年前三季度的表现看,C 端业务占讯飞总业务量的 20%,毛利占 30%,刘庆峰表示,预计在未来,C 端业务将和 B 端与 G 端(比如司法)各占半壁江山。


本次发布会上,我们看到 C 端产品的迭代与创新。


去年发布的晓译翻译机 1.0 已经开售便被抢购一空。通过对已经售出的 20 万台翻译机的超 1 亿次请求进行分析,讯飞发现了晓译翻译机存在的以下三个痛点。


在外出游时,经常会遇到网络不佳的问题,讯飞为此新增离线翻译功能;除英语外,日语、法语、西班牙语的需求非常高,总和大于 80%,为此在新版本中,讯飞进丰富了语种覆盖;在国际局势不稳定的情况下,在外出游或许会需要紧急求救,讯飞在新一代的晓译翻译机背部新增 SOS 按钮,用户按下按钮便可与讯飞本部的救援中心进行连线,中心将根据具体情形帮助用户联络当地大使馆或紧急联络人。


车载语音系统「飞鱼」在常规功能之外,与汽车总线联通,可以控制车辆相关部件,例如车窗、空调。这与阿里巴巴和上汽的合资公司「斑马」语音系统相近,该系统搭载到汽荣威的车辆系统,可直接语音控制车体。不过,区别在于,讯飞还设计了一个「小飞鱼」系统,用户不用换车也能使用讯飞的车载语音技术,「斑马」目前还处在与车辆绑定的阶段。


除此之外,「飞鱼」还与家居智能系统联通,借助声纹识别功能,该助手能够对不同的家庭成员提供定制化的一贯制服务。


智能家居场景下,除了常规的开关窗帘等,讯飞巧妙地将远讲功能运用到了电视视频通话功能中。用户能够在客厅的任何地方通过电视与家人朋友视频,不用对手机麦克讲话。


另外,智能家居还加入了手势控制功能。比如,在电视场景下,选择想要看的电影时,可用手势进行翻页;将食指放在嘴前摆出安静的手势,即可让电视静音。


发布会现场,还出现了「魔幻」的一幕。负责讲解的产品经理身着特定的服装与头盔,演示用脑电波控制家电的开关,展示代表未来的家居场景技术。


不过,目前该技术还不成熟,不能进行广泛的商业化。据刘庆峰介绍,主要有三个方面的原因。施令者必须全神贯注才能完成脑电波指令的发送;仅限于家居场景如「打开空调」、「关闭窗帘」等几十条指令;指令并非实时传送,延迟超过 3 秒。


就在发布会召开的 3 天前,也就是 11 月 6 日,讯飞的「智医助理」在「2017 年国家执业医师考试临床综合笔试」取得了 456 分的成绩,超临床执业医师合格线(360 分)96 分,在安徽省两万多名考生中位列前 100 名。


这在董事长刘庆峰眼中,是「可以载入人工智能史册的事件」。发布会一开始,刘庆峰就兴高采烈地宣布这件事。「有些人认为这个考试全是选择题,简单得不得了。但其实不是这样的,事实上非常难。」刘庆峰会后答记者问说道。「IBM 的 Watson 在医学领域是很有名气的,他们在 2012 年就开始参加美国的医考,到现在也没及格。」


据悉,让「智医助理」参加考试,主要需过两大关。


海量的医学知识在计算机中如何表示,是一大挑战。传统上基于搜索的方案,和构建结构化知识库的方案,面对纷繁复杂的医学知识都明显能力不足。近几年来发展迅速的知识图谱技术,也不足以满足描述医学知识的需要; 以三元组为基础的半结构化知识图谱优点是比较符合人的直观、容易理解,但是知识图谱在描述能力上存在不足,其构建需要专家耗费大量的时间,扩展更新维护都非常困难,所以并不适合执业医师考试这样的大规模复杂任务。


为此,研究团队提出了一整套「语义张量」方法,针对医考需求,利用「多语义深度学习」方法通过学习人民卫生出版社五年制医学本科的全部教材、临床指南和经典病例等资料,获得医学领域张量化的的概念表示和关系表示,让机器拥有了庞大的医学知识库。


运用医学知识去分析和解决问题是第二个挑战,这也是系统能否做对考题的关键。团队提出了包「关键点语义推理」,「上下文语义推理」,「证据链语义推理」在内的多尺度融合推理算法,让机器具备了词汇、句子、段落间的多层次推理能力。


答题时,「智医助理」通过自主思考首先对题干和选项进行全面分析,在拥有的医学知识库中为每个选项寻找成为正确答案的可能证据,衡量评估题干、选项和证据三者之间的相关性和可信度,最终对各个选项证据得分进行综合决策,得出考题的答案。


发布会上,讯飞展示了其三款医疗相关工具,包括大家最熟知的「语音电子病历系统」,解放了医生的双手;能够帮助医生排查肿瘤与结节的「医学影像辅助诊断系统」;以及基于医学知识图谱技术与大数据,能够针对患者病情答疑解惑的医疗对话机器人「智医助理」。三款产品将分别于 11 月、12 月、以及明年 3 月面世。


今年,发布会上亮相的十款产品,五款与教育行业相关。这也再次表明教育 B 端在讯飞业务所占权重。


如何让孩子减少无效的学习时间,进而有时间发展体育特长和业余爱好,事关下一代人。对此,讯飞的「AI+教育」解决方案能够实现「精准教学、因材施教」。


基于人工智能技术,讯飞升级了一系列教育产品。包括帮助任课教师实现自助式课程录制的「智慧微课」;让学生在保留纸笔学习习惯的同时,又能利用人工智能技术进行作业批改的「智慧纸笔课堂」;只要通过拍照,就能实现纸笔作业实时修改反馈的「智慧作业平台」;帮助老师设计考卷的「智慧组卷工具」;以及基于知识图谱技术,为考生指明当下需要解决的知识点并能对知识点掌握情况进行动态跟踪的「智学 2.0」。


目前,这些教育产品已覆盖全国一万所学校、1500 多万师生,在使用过程中产生了 350 万份课件和 800 多万道试题,以及多达 350 亿条全过程数据。


更重要的是,数字化的课程与教学资源能够从一定程度上解决教育分配不公的问题,让山区的孩子也能听到省重点教师的课程。


这一年,讯飞继续进行语音技术上的探索。


2017 年,公司语音技术屡获国际比赛的认可。例如,在感知技术最重要的、国际最权威的语音合成比赛「暴风雪竞赛中」,讯飞已 12 年蝉联冠军。与往年不同的是,随着人工智能技术的进步,今年的比赛中加入了使用无监督学习的规则,也就是在无标记的情况下,让机器自己学习。结果表明,讯飞在蝉联第一的同时,与第二名也拉开了较大的差距。


目前,讯飞语音识别技术已经覆盖 2012 种方言,且准确率超过 90% 方言已接近 10 种。为了让老人、偏远地区人民、以及更多社会人群使用人工智能技术,自成立以来,讯飞不断地投入大量金钱、人力、时间成本录制方言音频。


教育、司法领域大量需要手写识别及机器阅卷技术,目前讯飞的技术也已经超过一般教师评卷水平。今年 8 月,科大讯飞刷新了全球肺结节测试的世界纪录,准确率达到 94.1%。在安徽省立医院等三甲医院的测试结果表明,其对肺结节的判断已经达到了三甲医院平均医生水平。


这篇关于除了AI赋能,讯飞年度发布会还上演了一场「意念控制家居」秀的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/375622

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

Spring Security 基于表达式的权限控制

前言 spring security 3.0已经可以使用spring el表达式来控制授权,允许在表达式中使用复杂的布尔逻辑来控制访问的权限。 常见的表达式 Spring Security可用表达式对象的基类是SecurityExpressionRoot。 表达式描述hasRole([role])用户拥有制定的角色时返回true (Spring security默认会带有ROLE_前缀),去

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/

【北交大信息所AI-Max2】使用方法

BJTU信息所集群AI_MAX2使用方法 使用的前提是预约到相应的算力卡,拥有登录权限的账号密码,一般为导师组共用一个。 有浏览器、ssh工具就可以。 1.新建集群Terminal 浏览器登陆10.126.62.75 (如果是1集群把75改成66) 交互式开发 执行器选Terminal 密码随便设一个(需记住) 工作空间:私有数据、全部文件 加速器选GeForce_RTX_2080_Ti

AI Toolkit + H100 GPU,一小时内微调最新热门文生图模型 FLUX

上个月,FLUX 席卷了互联网,这并非没有原因。他们声称优于 DALLE 3、Ideogram 和 Stable Diffusion 3 等模型,而这一点已被证明是有依据的。随着越来越多的流行图像生成工具(如 Stable Diffusion Web UI Forge 和 ComyUI)开始支持这些模型,FLUX 在 Stable Diffusion 领域的扩展将会持续下去。 自 FLU