27分钟,路透社用人工智能抢到了一条全球新闻

2023-12-19 09:10

本文主要是介绍27分钟,路透社用人工智能抢到了一条全球新闻,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

路透社正在用人工智能系统采集全球新闻

“网络的出现以及随之而来的信息爆炸,让记者准确迅速地报道新闻变得越来越具有挑战性。”全球新闻机构路透社的研发团队本周在arXiv上发表的一篇论文用了这样一句开场白。

对路透社而言,假新闻的出现让问题变得更加严重,这些假新闻扭曲了事件认知。

不过,像美联社等新闻机构已经开始采用自动化的新闻写作服务。这些报道使用了标准化的模式,例如财经新闻或者特定体育比赛结果,将数据填到预先写好的模板之中:“X在第三季度的财报显示盈利为Y百万,这一数值超出了华尔街的预期……”

所以其他新闻机构在自动化新闻制作方面都面临着很大的压力。今天,路透社介绍了该社是如何几乎完全自动化地识别突发新闻报道的。刘晓莫(Xiaomo Liu,音译)以及路透社研发部门和阿里巴巴的同事表示,新系统表现良好。事实上,它有可能能够彻底革新新闻业务。但是它也引发了人们的担忧——心怀叵测的人会如何利用这样一个系统。

这个新系统被称为路透社追踪器Reuters Tracer)。它将推特(Twitter)作为一种全球传感器加以利用,新闻事件在发生的过程中,就会在推特上有相关记录。然后该系统会使用各种数据挖掘和机器学习技术来挑选最为相关的事件,确定它们的主题,排列它们的优先级,并写出标题和摘要。这个消息随后会被分发到该公司的全球新闻专线上。

整个流程的第一步是提取推特的数据流。该追踪器每天要查看大约1200万条推特消息,占所有推特消息总数的2%。其中一半是随机抽样,另外一半来自路透社记者创建的推特账户列表。其中包含其他新闻机构的账户、重要的公司、有影响力的个人等等。

下一步是确定新闻事件发生的时间。追踪器(Tracer)是根据这样一个前提假设完成这项工作的:如果几个人同时开始谈论这件事,这个事件就已经发生了。因此它使用聚类算法来寻找这些对话。

当然,这些聚类中包括垃圾邮件、广告、普通聊天等。其中只有一部分是具有新闻价值的事件。

所以下一个阶段是对事件进行分类和排序。追踪器(Tracer)使用一些算法来完成这项工作。第一个算法确定谈话的主题。然后将它与一个主题数据库进行比较,这个主题数据库中的内容是由路透团队从31个官方新闻账户——例如@CNN、@BBCBreaking和@nytimes,以及@BreakingNews等新闻聚合器所发布的推特消息中收集的。

在这个阶段,该算法还会使用包含了城市和基于位置关键字的数据库来确定事件发生的地点。

一旦一段谈话或流言被认定为新闻,一个重要的考量就是确认其准确性。为了确定这一点,追踪器(Tracer)通过识别对话中最早提及该话题的推特消息及其指向的站点来寻找来源。然后,它会查询一个数据库,其中列出了已知的假新闻的制作者,例如国家报告(National Report),或是洋葱(The Onion)这类讽刺新闻网站。

最后,该系统会写出标题和摘要,并在路透社整个组织内分发该消息。

在试验过程中,路透社的团队表示该系统表现良好。他们表示:“追踪器(Tracer)能够在新闻检测和提交方面实现很有竞争力的准确度、召回率、时效性和准确度。”

他们有统计数据可以支持这一观点。该系统每天处理1200万条推特消息,将其中的大约百分之八十的内容作为噪声加以拒绝。其余的内容则被划分进入6000个聚类,系统用这种方式将新闻事件划分为不同的类型。所有的这一切工作全部由13台运行着10种不同算法的服务器完成。

相比之下,路透社在全球雇佣了大约2500名新闻记者,他们每天使用各种来源——包括推特——总共产生大约3000条新闻提醒。其中,大约有250条被写成了新闻报道。

路透社将追踪器(Tracer)识别出的新闻同BBC和CNN等新闻机构的推送新闻进行了比较。刘和他的同事表示,“结果表明,追踪器(Tracer)可以用2%的推特数据覆盖大约70%的新闻报道。”

而这套系统的工作当然是非常迅速的。该团队举了2017年10月份在拉斯维加斯发生的枪击案作为例证,在那次事件中,有58人丧生。一位目击者在凌晨1点22分报告了这一事件,随即触发了一个追踪器(Tracer)聚类。但是,该聚类到凌晨1点39分之前都没有达到该系统确认新闻的标准。刘和他的同事表示:“路透社在凌晨1点49分报道了这一事件。”

这是一个有趣的工作,引发了很多问题,特别是围绕着该系统是多么容易被操纵这个问题。不难想象会有心怀叵测的人设计推特消息,以欺骗追踪器(Tracer),实现特定目的。

但是这套系统是否会比现有的系统更好糊弄,恐怕还很难说,人类也经常会被各种假消息欺骗。

还有人类在新闻业中扮演的角色。新闻的未来显然会变得日益自动化。人类如何适应这种变化还未见端倪。







原文出处:科技行者
转载请与作者联系,同时请务必标明文章原始出处和原文链接及本声明。

这篇关于27分钟,路透社用人工智能抢到了一条全球新闻的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/511634

相关文章

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

高效+灵活,万博智云全球发布AWS无代理跨云容灾方案!

摘要 近日,万博智云推出了基于AWS的无代理跨云容灾解决方案,并与拉丁美洲,中东,亚洲的合作伙伴面向全球开展了联合发布。这一方案以AWS应用环境为基础,将HyperBDR平台的高效、灵活和成本效益优势与无代理功能相结合,为全球企业带来实现了更便捷、经济的数据保护。 一、全球联合发布 9月2日,万博智云CEO Michael Wong在线上平台发布AWS无代理跨云容灾解决方案的阐述视频,介绍了

总有一条路,我们很迷茫

十年前,我家还处于一个贫穷落后的小山村,周围的人会根据我父母的收入来对待我,而十年后的今天,我家的那座小山村医成为重点开发的地区,一夜之间我家成了所谓的土豪,周围的人依然根据我家的收入对待我。现实,什么是现实?这就是现实。从那一刻,我开始明白要想得到别人的尊重,首先你得有别人尊重的实力。 所以,这么多年来不管自己过得多累,走得多艰辛,我都会一直坚持。在人生前进的道路,我们总会经历风雨,难免感到迷

Vue3项目开发——新闻发布管理系统(六)

文章目录 八、首页设计开发1、页面设计2、登录访问拦截实现3、用户基本信息显示①封装用户基本信息获取接口②用户基本信息存储③用户基本信息调用④用户基本信息动态渲染 4、退出功能实现①注册点击事件②添加退出功能③数据清理 5、代码下载 八、首页设计开发 登录成功后,系统就进入了首页。接下来,也就进行首页的开发了。 1、页面设计 系统页面主要分为三部分,左侧为系统的菜单栏,右侧

基于人工智能的智能家居语音控制系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 随着物联网(IoT)和人工智能技术的发展,智能家居语音控制系统已经成为现代家庭的一部分。通过语音控制设备,用户可以轻松实现对灯光、空调、门锁等家电的控制,提升生活的便捷性和舒适性。本文将介绍如何构建一个基于人工智能的智能家居语音控制系统,包括环境准备

软件架构模式:5 分钟阅读

原文: https://orkhanscience.medium.com/software-architecture-patterns-5-mins-read-e9e3c8eb47d2 软件架构模式:5 分钟阅读 当有人潜入软件工程世界时,有一天他需要学习软件架构模式的基础知识。当我刚接触编码时,我不知道从哪里获得简要介绍现有架构模式的资源,这样它就不会太详细和混乱,而是非常抽象和易

树莓派5_opencv笔记27:Opencv录制视频(无声音)

今日继续学习树莓派5 8G:(Raspberry Pi,简称RPi或RasPi)  本人所用树莓派5 装载的系统与版本如下:  版本可用命令 (lsb_release -a) 查询: Opencv 与 python 版本如下: 今天就水一篇文章,用树莓派摄像头,Opencv录制一段视频保存在指定目录... 文章提供测试代码讲解,整体代码贴出、测试效果图 目录 阶段一:录制一段

从希腊神话到好莱坞大片,人工智能的七大历史时期值得铭记

本文选自historyextra,机器之心编译出品,参与成员:Angulia、小樱、柒柒、孟婷 你可能听过「技术奇点」,即本世纪某个阶段将出现超级智能,那时,技术将会以人类难以想象的速度飞速发展。同样,黑洞也是一个奇点,在其上任何物理定律都不适用;因此,技术奇点也是超越未来理解范围的一点。 然而,在我们到达那个奇点之前(假设我们能到达),还存在另一个极大的不连续问题,我将它称之

[Day 73] 區塊鏈與人工智能的聯動應用:理論、技術與實踐

AI在健康管理中的應用實例 1. 引言 隨著健康管理需求的提升,人工智能(AI)在該領域的應用越來越普遍。AI可以幫助醫療機構提升效率、精準診斷疾病、個性化治療方案,以及進行健康數據分析,從而改善病患的健康狀況。這篇文章將探討AI如何應用於健康管理,並通過具體代碼示例說明其技術實現。 2. AI在健康管理中的主要應用場景 個性化健康建議:通過分析用戶的健康數據,如飲食、運動、睡眠等,AI可

全球AI产品Top100排行榜

Web Top50的榜单里,AIGC类型的应用占比52%,遥遥领先。AIGC类型包括图像、视频、音乐、语音等的内容生成和编辑。音乐生成应用Suno在过去六个月中的排名跃升最为显著,从第36位上升至第5位。排名第二大类是通用对话/AI聊天/角色扮演类型的应用,占比20%,包括常见的ChatGPT、Claude、Character.ai等。其他是AI写作(8%)、AI搜索/问答(6%)、Agent/