大数据时代,路透社如何玩转“原生数据”做新闻?

2023-12-19 09:10

本文主要是介绍大数据时代,路透社如何玩转“原生数据”做新闻?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

什么是数据新闻

数据新闻简单来讲就是利用真实有效的数据来发现、辅证和讲述新闻故事。举个最简单的例子,人的身体需要各种各样的营养,缺维生素B1可能导致消化不良,缺少维生素C导致抵抗力下降。事实上,我们的身体也可以理解为一个永不休息的数据新闻记者,搜集身体营养数据,向大脑报告发现的问题。当如此这般的“健康报告”不再是关乎一个人,而是一群人的时候,这就成了我们所说的数据新闻了。

如今,可视化数据已经成为数据新闻的饕餮盛宴,例如《卫报》的数据新闻博客,采用图表、地图以及互动效果图等不同形式,既有量化数据也有质性数据,还有两者兼顾的混合数据。可是路透对这一形式的数据新闻并不感冒。不论是数字堆砌出来的路透财经新闻,还是技术搜集获得的平民新闻,路透社追求的永远是数据本身所蕴含的道理,而不是对数据做过多的视觉化修饰。路透社的网络编辑迪恩-赖特表示:“在辩论和真相方面,媒体已经不再是垄断力量了。所以对于数据新闻,我们只是在做一种服务,更多的是做一个收集的渠道,运用我们的技术进行最准确的分析,为大众提供了一个互动、交流的一个平台。”

“我们需要做的就是减少各种数据噪音,以便为客户提供更有价值的数据。”克雷格说,“随着社交媒体增多,人们获取免费数据的途径也越来越多,此时如何挖掘出值得信赖的、客户需要的数据,才是最有价值的。”所以说,路透数据新闻,就是用原生数据,做大数据时代的“过滤器”。

如何运用数字技术为美国选举推力

纽约时间2016年2月23日 路透社报道称路透与SAP(全球领先的企业管理软件解决方案提供商)合作,发布了名为《Reuters White House Run》的ios移动游戏,让选民模拟美国总统候选人和竞选的选举。

大数据

路透社说,用户可以建立自己的候选人,并通过声明对问题的立场进入选举。这可以测试游戏用户的时事知识。 候选人的选择是由路透/益普索调查数据(2012年,路透社设置了美国政治话题的题目,并与益普索公司合作,通过预先筛选,在线调查,电话普查等多种形式开展调查和收集。三年多来,每个月调查人数超过11000人)来确定,让用户的舆论来选择美国的下一任领导人,享受一番真实的体验。在游戏外,用户也可以在应用程序内获取当前路透社政治新闻,并可以进行投票和查看投票结果。执行主编Reginald Chua表示:““白宫运行”使用户与路透社丰富的调查数据结合在一起,把政治新闻与数字技术相结合,是对数据新闻一种新的尝试。通过投票结果,用户可以把自己的看法与民意相比较,以及他们如何应对这些政治问题的立场都会在投票中公布。”

数字技术正在改变政治和选举,使美国选民转变成数字选民。SAP北美总裁珍妮弗·摩根说,“能够直接访问实时数据驱动的信息和公众的情绪不仅能让记者们创建引人入胜的和令人信服的内容,而且还赋予消费者和公民提供独特的见解的机会。”

丹尼尔·曼德尔,路透社媒体的首席执行官说,“选民依靠我们的报道做出明智的决定。通过建立这样一个数据分享平台,让“我们”把最公正,最原始的新闻和信息交付给读者,这正是路透社的期望。”

路透社的数据新闻从来没有富于表现力的信息图来讲述错综复杂的新闻故事,也没有交互的、有趣的视觉化图表来吸引读者。可是路透的数字新闻却永远不缺读者,这又是为什么呢?

20160422021901371.png

  (图为iTunes Preview的部分评论)

什么是数字新闻的核心竞争力

数据新闻既要处理数据,又要不断检验数据的信度与价值,并通过多种手段和渠道完成报道。英国伯明翰城市大学教授布拉德肖依照传统新闻学“倒金字塔”结构理论,提出数据新闻采编流程“双金字塔”结构。倒金字塔部分自上而下包括数据搜集、清洗、情境化、合并等4个环节,以传播为纽带,形成一个自上而下包括视觉化、叙事、社交化、人性化、个性化和应用化等6个环节的正金字塔结构。他强调,数据新闻通过可视化形成新闻故事之后在各种平台发布实现社交化,读者可根据个人的兴趣和需求对新闻作品加以应用

笔者认为,尽管上述说法各异,但数据新闻生产流程都离不开数据搜集、数据处理和数据呈现3个阶段。而这3个阶段最重要的就是搜集和整理。如何把搜集到的数据不断的提炼,把原始数据转换成有意义的信息,才是数据新闻的核心竞争力。正如记者David Mccandless, 《信息之美》一书的作者所言,“数据正变得越来越重要, 这并不是因为数据的量大, 而是我们拥有了工具和能力去分析数据, 找出模式、结构并揭示趋势。为此,路透社也正是这么做的。”

2006年路透社与牛津大学合作一同创办了路透研究社(Reuters Institute),研究所的目的就是通过数据搜集、观察、为长期问题提供理论分析。一直以来,路透研究所的报告,都是业界和学界对新闻研究的重要参考资料,因为该报告既权威又全面。它的研究结果是通过大量的调查,对不同的国家,国内外知名媒体的长期观察,依靠路透强大的数字技术和专业人士分析得到。

基于数据搜集及价值挖掘这一核心逻辑关系的战略选择,路透数据新闻才能有今天。但许多业内人士表示,路透这种只依靠强大数据能力的数字新闻,它的路并不会走多远。将来会是怎样,让我们拭目以待吧。



本文转自d1net(转载)

这篇关于大数据时代,路透社如何玩转“原生数据”做新闻?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/511633

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

关于数据埋点,你需要了解这些基本知识

产品汪每天都在和数据打交道,你知道数据来自哪里吗? 移动app端内的用户行为数据大多来自埋点,了解一些埋点知识,能和数据分析师、技术侃大山,参与到前期的数据采集,更重要是让最终的埋点数据能为我所用,否则可怜巴巴等上几个月是常有的事。   埋点类型 根据埋点方式,可以区分为: 手动埋点半自动埋点全自动埋点 秉承“任何事物都有两面性”的道理:自动程度高的,能解决通用统计,便于统一化管理,但个性化定

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

烟火目标检测数据集 7800张 烟火检测 带标注 voc yolo

一个包含7800张带标注图像的数据集,专门用于烟火目标检测,是一个非常有价值的资源,尤其对于那些致力于公共安全、事件管理和烟花表演监控等领域的人士而言。下面是对此数据集的一个详细介绍: 数据集名称:烟火目标检测数据集 数据集规模: 图片数量:7800张类别:主要包含烟火类目标,可能还包括其他相关类别,如烟火发射装置、背景等。格式:图像文件通常为JPEG或PNG格式;标注文件可能为X

pandas数据过滤

Pandas 数据过滤方法 Pandas 提供了多种方法来过滤数据,可以根据不同的条件进行筛选。以下是一些常见的 Pandas 数据过滤方法,结合实例进行讲解,希望能帮你快速理解。 1. 基于条件筛选行 可以使用布尔索引来根据条件过滤行。 import pandas as pd# 创建示例数据data = {'Name': ['Alice', 'Bob', 'Charlie', 'Dav

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者