饼图,为何是数据界最被诟病的图表?

2023-10-29 07:20
文章标签 数据 图表 诟病

本文主要是介绍饼图,为何是数据界最被诟病的图表?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

饼图,为何是数据界最被诟病的图表?

  • 饼图的缺点
    • 缺点一:饼图不能详细展现每部分的细节情况
    • 缺点二:违反视觉感知规律:人们并不能真正理解圆形和角度的大小
    • 缺点三:依赖数据标签说明信息
  • 那在我们得知饼图的优劣势,是否有其他替代饼图的图表呢?
    • 条形图
    • 树状图

饼图(Pie Chart) 的每个切片代表整体的一部分,通常切片大小用于显示百分比,扇区的总和为100%。

但在数据可视化不断发展中,饼图被广为诟病为是最糟糕的展现形式之一。

当然还存在其他更冗杂和麻烦的数据展现形式,但饼图是广为公众熟悉的图表之一。文章接下来将分析饼图在数据可视化中的劣势以及可替代的图表。

饼图的缺点

缺点一:饼图不能详细展现每部分的细节情况

饼图的意义在于展现各部分相对于总体的关系。以下是三张饼图表示五个候选人在A,B,C三个时间段内的获票情况。
在这里插入图片描述
图表应该让读者明确看出每个候选人在不同时间段的得票比重,以及候选人之间的得票角逐。然而上述饼图展现出来的效果并非如此。无法通过上述饼图回答以下几点问题:

  • 五号候选人和三号候选人相比,哪个表现更好?

  • AB时间段内,候选人二号和候选人四号,哪个表现更好?

  • 哪位候选人在选票上领先?

如果图表的意义在于更容易解读信息,如果直接给投票数据表格,是否相比上述饼图更容易让读者获取信息呢?

同样的数据换一种展现方式——条形图——则清晰很多:
在这里插入图片描述
通过上述条形图,读者能直观到每个候选人在每个时间段的具体获票情况。即使饼图的意义就在于展现部分和整体关系,但上述条形图比饼图更加清晰展现出部分相对于整体的情况。

缺点二:违反视觉感知规律:人们并不能真正理解圆形和角度的大小

是否能从以下的饼图找出最大的一组,并按照值大小排序切片?答案可能是否定的。
在这里插入图片描述
如果你仍然不信?那尝试通过以下饼图中辨别出哪个组的值最高,并且尝试弄清楚各组的数值变化过程。或许仍非常困难找出差异。

在这里插入图片描述
如果使用条形图表示完全相同的数据呢?

结果一目了然!正如条形图展现,三个饼图之间存在着巨大的差异
在这里插入图片描述
同理,以下这张饼图展现欧洲议会的党派的划分:
在这里插入图片描述
你是否可以通过比较切片找出每个切片之间的大小差异么?

如果仅针对这一个问题,那么确实可以。从以上饼图可知EPP党的份额大于S&D党。那么该饼图的重点又是什么?图表只有在我们能够比较其中每个元素的时候才有用。

在这里插入图片描述
那么出于比较目的,我们单独脱离整体和文本对比单个切片。

事实证明,人们并不擅长通过比较饼图切片来衡量大小。这就是为什么人们会认为三角形学和弧度比矩形几何更难

以下条形图同样展现党派细分信息:在这里插入图片描述
通常人们只会比较矩形的长度来了解数据的变化。若将左纵坐标轴改成百分比,读者可以得知议会内不同的党派分配。对比可见,条形图可以看到每个党派拥有多少席位,但此信息无法从饼图得知

以下是同样的党派细分信息,但以3D饼图的效果呈现:
在这里插入图片描述
有角度的3D饼图非常能给出迷惑读者的信息!上述3D饼图中红方的S&D党似乎与深青色方的EPP党大致持平。然而这样的扭曲视觉的效果完全可以人为操作

缺点三:依赖数据标签说明信息

在这里插入图片描述
上述饼图旨在展现男性中红绿色盲的比例。但我们并不能由上述饼图直接得知男性色盲的占比约为10%。一般来说,越高级的图表越不需要数据标签。如果必须得依靠数据标签才能表达信息,大概率你则使用了错误的图表。

饼图的优势
在这里插入图片描述
在对比2-3个具备较大差异的数据点时,饼图还是具备优势的。上述饼图表示的是底特律房产拖欠情况。上述图表能清晰告诉读者,100人中有32人是什么情况。

综上:
以下情况饼图不适合使用:

  • 每当可用信息存在相似性时;

  • 每当由多个(三个或者更多)不同数据点时;

  • 如果必须标记每个数值的百分比才能读取信息时。

以下情况会让饼图更糟糕:

  • 3D效果;

  • 保留图例;

  • 扇区各部分总和不足100的百分比;

  • 过多数据点比较;

  • 切割所有切片脱离整体单独对比(ExplodedPie Charts)。

那在我们得知饼图的优劣势,是否有其他替代饼图的图表呢?

条形图

如果有多个值需要展示,可以采用比柱状图更加优雅简洁的“棒棒糖图”(Lolipop Plot)。以下图展现几个代表国家出售武器的数量情况:

在这里插入图片描述

树状图

如果你想描述整体的组成情况,那么树状图是个不错的选择

在这里插入图片描述
简而言之,在对比多个不同数据点或者必须依赖数据标记才能得知数据间相似性时,应该尽量避免使用饼图。饼图大多时不能达到理想的数据可视化的效果,而且视觉效果太容易被搞砸。因此,在使用饼图时,请多考虑是否能有可替代的图表呈现出更理想的效果

这篇关于饼图,为何是数据界最被诟病的图表?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/299127

相关文章

Python将大量遥感数据的值缩放指定倍数的方法(推荐)

《Python将大量遥感数据的值缩放指定倍数的方法(推荐)》本文介绍基于Python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处理,并将所得处理后数据保存为新的遥感影像... 本文介绍基于python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处

使用MongoDB进行数据存储的操作流程

《使用MongoDB进行数据存储的操作流程》在现代应用开发中,数据存储是一个至关重要的部分,随着数据量的增大和复杂性的增加,传统的关系型数据库有时难以应对高并发和大数据量的处理需求,MongoDB作为... 目录什么是MongoDB?MongoDB的优势使用MongoDB进行数据存储1. 安装MongoDB

Python MySQL如何通过Binlog获取变更记录恢复数据

《PythonMySQL如何通过Binlog获取变更记录恢复数据》本文介绍了如何使用Python和pymysqlreplication库通过MySQL的二进制日志(Binlog)获取数据库的变更记录... 目录python mysql通过Binlog获取变更记录恢复数据1.安装pymysqlreplicat

Linux使用dd命令来复制和转换数据的操作方法

《Linux使用dd命令来复制和转换数据的操作方法》Linux中的dd命令是一个功能强大的数据复制和转换实用程序,它以较低级别运行,通常用于创建可启动的USB驱动器、克隆磁盘和生成随机数据等任务,本文... 目录简介功能和能力语法常用选项示例用法基础用法创建可启动www.chinasem.cn的 USB 驱动

Oracle数据库使用 listagg去重删除重复数据的方法汇总

《Oracle数据库使用listagg去重删除重复数据的方法汇总》文章介绍了在Oracle数据库中使用LISTAGG和XMLAGG函数进行字符串聚合并去重的方法,包括去重聚合、使用XML解析和CLO... 目录案例表第一种:使用wm_concat() + distinct去重聚合第二种:使用listagg,

Python实现将实体类列表数据导出到Excel文件

《Python实现将实体类列表数据导出到Excel文件》在数据处理和报告生成中,将实体类的列表数据导出到Excel文件是一项常见任务,Python提供了多种库来实现这一目标,下面就来跟随小编一起学习一... 目录一、环境准备二、定义实体类三、创建实体类列表四、将实体类列表转换为DataFrame五、导出Da

Python实现数据清洗的18种方法

《Python实现数据清洗的18种方法》本文主要介绍了Python实现数据清洗的18种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学... 目录1. 去除字符串两边空格2. 转换数据类型3. 大小写转换4. 移除列表中的重复元素5. 快速统

Python数据处理之导入导出Excel数据方式

《Python数据处理之导入导出Excel数据方式》Python是Excel数据处理的绝佳工具,通过Pandas和Openpyxl等库可以实现数据的导入、导出和自动化处理,从基础的数据读取和清洗到复杂... 目录python导入导出Excel数据开启数据之旅:为什么Python是Excel数据处理的最佳拍档

在Pandas中进行数据重命名的方法示例

《在Pandas中进行数据重命名的方法示例》Pandas作为Python中最流行的数据处理库,提供了强大的数据操作功能,其中数据重命名是常见且基础的操作之一,本文将通过简洁明了的讲解和丰富的代码示例,... 目录一、引言二、Pandas rename方法简介三、列名重命名3.1 使用字典进行列名重命名3.编

Python使用Pandas库将Excel数据叠加生成新DataFrame的操作指南

《Python使用Pandas库将Excel数据叠加生成新DataFrame的操作指南》在日常数据处理工作中,我们经常需要将不同Excel文档中的数据整合到一个新的DataFrame中,以便进行进一步... 目录一、准备工作二、读取Excel文件三、数据叠加四、处理重复数据(可选)五、保存新DataFram