独家 | 7个新手数据讲述者犯下的致命错误

2024-04-14 00:18

本文主要是介绍独家 | 7个新手数据讲述者犯下的致命错误,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

640?wx_fmt=png

作者(本文内容来源):Think Like a Data Storyteller workshop

翻译:王威力

校对:白静

本文约1800字建议阅读5分钟。

本文介绍了新手数据讲师所犯的最常见的错误,以及如何改正它们。


640?wx_fmt=png

图1 在墙上贴便签的女人 来自Unsplash网站上的rawpixel


在制作数据故事时,很容易迷失在细节中,并且无法创造出可以激发别人动手操作的数据故事。下面是新手数据讲师所犯的最常见的错误,以及如何改正它们。这些技巧来自“像数据讲述者一样思考”研究会。

 

1. 数据故事不适合听众


不是所有的听众都是相同的,不是所有的听众都有一样的目标。即使您自己审视自己团队内部,也可以考虑一个技术支持专家和一个运营主管如何具有不同的观点。尽管两者都有共同的目标即服务客户,但每个人对于这个目标能够实现的方法和原因具有不同的观点。

 

许多展示数据故事的讲师只创建一套目标过于广泛的幻灯片。在这些故事中,听众可能不理解接下来会发生什么,或者可能无法理解这个问题。所以请确保仔细思考,您的听众可能会遇到什么问题并通过故事的讲述回答这些疑问。

 

2. 数据支持的是另一个不同版本的故事


研究数据的很多时候,研究者允许偏差蔓延。偏差可能源于我们为了得到想要的结果,精心选择特定数据。在“醉酒与癌症之间的混乱关系”一文中,作者说,表明酒精是健康的先前研究受到了偏差选择的影响。该文中的原始数据把健康的饮酒者和因病戒酒者混在一起,作者将其描述为非饮酒者和适度饮酒者相比,实际上这些“非饮酒者”是一些曾经的酗酒者或者因病不能再继续喝酒的人组成的,而这些人通常比健康的适度饮酒者病得更严重。这个结果证明该研究得到了错误的结论。

 

在制作数据故事时,请确保你正在使用合适的统计技术,并让其他人严格地审查您的结论。


3. 数据故事缺乏重点


对于一个数据故事,为有效地促成听众进行操作,信息必须是简单的。新手的数据讲师大多使用多个信息形成一个复杂的故事。听众会因此变得困惑甚至有挫败感。

 

1854年,约翰·斯诺博士用一个简单的信息讲述了一个数据故事:“我们可以通过关闭被污染的布罗德街水泵来阻止霍乱流行。”这不仅是一个简单的信息,也是一个可行的信息。

 

让你的信息简单和重点明确。想一想,“在看了我的数据故事后,我想让听众做些什么?”那么就在那个元素周围加工你的信息。

 

4. 数据故事充满了数据


我们的大脑对故事更敏感而非数据。在“Made to Stick”这本书中,作者Chip and Dan Heath提及了一项研究,研究要求学生向班里的同学展示一分钟有说服力的演讲。平均每个演讲 包含2.5个数据。只有一个演讲包含了一段故事。

 

十分钟之后,研究者要求这些学生拿出一张纸并且写下他们记得的信息。只有5%的同学记住了数据;63%的学生记住了故事。想一想——这个故事是听众能够保留下来的。这是因为故事能激发我们的情感,使我们能够成功地回忆起故事。

 

讲述数据故事时,试着把统计数据限定在最重要的几个方面。你使用的任何统计数据都应该是效果出色的并且有助于叙述。请仔细选择那些具有重要影响的部分。

 

5. 恰当的数据可视化方法被忽视了


许多数据故事陈述者并不精通展示数据的方法。因此,信息在不恰当的表达方式下变得混乱和费解。可以把这件事比作有人在同时说两种语言,但你只会理解你所知道的语言。

 

在制作数据故事前,确保理解如何编码变量。研究数据可视化技术或者与能助你成功完成展示的专家合作。

 

想想已故的汉斯·罗斯林教授在他的TED演讲中讲述的故事,或者他为BBC4创作的这个叫做“The Joy of Stats”的故事。他巧妙地用一张图表将120个数字简化成关于健康和财富的简单信息。

 

6. 缺乏引人入胜的叙述


当数据呈现出令人意外的结果时,听众会很激动。但如果你的数据故事没有展示出任何新结论,那么听众也会失去兴趣,没有动力去尝试。

 

Freakanomics这本书的作者Steve Levitt 和Steve Dubner,在数据中找到了意想不到的答案。在一项研究中,他们发现,低级别的毒贩可能赚不到比在快餐店工作更多的钱。由于大多数人认为毒品交易能带来奢华的生活,因此这个发现令人意外。然而,在每一个播客中,他们都讲述了一个吸引人的故事。

 

如果你的数据甚至无法让你发出一声“哇”的惊叹,或许你的叙述方式是不对的。

 

7. 数据故事中缺乏“人”


人们都对其他人的故事感兴趣。如果你了解过历史上的伟大故事,那么你会知道所有这些故事都是关于某人如何成功地处理逆境。“某人”可能是卢克·天行者或李尔王这样的个体,也可能是一个群体,比如军队如何打败敌人。故事帮助我们了解生活是如何变化的以及它为什么会改变。这些故事可以教会听众如何处理反对意见,如何面对困难的决定,以及如何采取最佳行动。

 

我们的大脑关注其他人的故事。在罗斯林的“Numbers are Boring, People are Interesting”演讲中,他用自己举例来鼓励听众改变对于家庭的看法。他讲述了自己牺牲职业目标,在家陪伴孩子的故事。他的题目泄露了一个讲好故事的秘密——这是关于人的故事,不是关于数字的故事。

 

你的关键点


你可能会多次重复修改你的数据故事,就像在写小说一样。没关系,这是过程的一部分,每次都会有提升。


原文标题:

Seven Deadly Mistakes New Data Storytellers Make

原文链接:

https://towardsdatascience.com/seven-deadly-mistakes-new-data-storytellers-make-aac32d06d702


译者简介

640?wx_fmt=png

王power,求职狗,在香港科技大学学习大数据科技。感觉数据科学很有难度,也很有意思,还在学(tu)习(tou)中。一个人肝不动的文献,来数据派follow大佬一起肝。

翻译组招募信息

工作内容:需要一颗细致的心,将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生,或在海外从事相关工作,或对自己外语水平有信心的朋友欢迎加入翻译小组。

你能得到:定期的翻译培训提高志愿者的翻译水平,提高对于数据科学前沿的认知,海外的朋友可以和国内技术应用发展保持联系,THU数据派产学研的背景为志愿者带来好的发展机遇。

其他福利:来自于名企的数据科学工作者,北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴。


点击文末“阅读原文”加入数据派团队~

转载须知

如需转载,请在开篇显著位置注明作者和出处(转自:数据派ID:datapi),并在文章结尾放置数据派醒目二维码。有原创标识文章,请发送【文章名称-待授权公众号名称及ID】至联系邮箱,申请白名单授权并按要求编辑。

发布后请将链接反馈至联系邮箱(见下方)。未经许可的转载以及改编者,我们将依法追究其法律责任。

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

点击“阅读原文”拥抱组织

这篇关于独家 | 7个新手数据讲述者犯下的致命错误的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/901620

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

关于数据埋点,你需要了解这些基本知识

产品汪每天都在和数据打交道,你知道数据来自哪里吗? 移动app端内的用户行为数据大多来自埋点,了解一些埋点知识,能和数据分析师、技术侃大山,参与到前期的数据采集,更重要是让最终的埋点数据能为我所用,否则可怜巴巴等上几个月是常有的事。   埋点类型 根据埋点方式,可以区分为: 手动埋点半自动埋点全自动埋点 秉承“任何事物都有两面性”的道理:自动程度高的,能解决通用统计,便于统一化管理,但个性化定

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

烟火目标检测数据集 7800张 烟火检测 带标注 voc yolo

一个包含7800张带标注图像的数据集,专门用于烟火目标检测,是一个非常有价值的资源,尤其对于那些致力于公共安全、事件管理和烟花表演监控等领域的人士而言。下面是对此数据集的一个详细介绍: 数据集名称:烟火目标检测数据集 数据集规模: 图片数量:7800张类别:主要包含烟火类目标,可能还包括其他相关类别,如烟火发射装置、背景等。格式:图像文件通常为JPEG或PNG格式;标注文件可能为X

pandas数据过滤

Pandas 数据过滤方法 Pandas 提供了多种方法来过滤数据,可以根据不同的条件进行筛选。以下是一些常见的 Pandas 数据过滤方法,结合实例进行讲解,希望能帮你快速理解。 1. 基于条件筛选行 可以使用布尔索引来根据条件过滤行。 import pandas as pd# 创建示例数据data = {'Name': ['Alice', 'Bob', 'Charlie', 'Dav

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者