在数睿数据nextionBI线上发布会上,传统企业展示了对数据分析的深度理解

本文主要是介绍在数睿数据nextionBI线上发布会上,传统企业展示了对数据分析的深度理解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

2022年2月25日,数睿数据正式发布下一代专注知识的BI产品——nextionBI,启动了自己“无代码+BI”的双产品战略布局。数睿数据总裁刘超总结,当前的BI产品过于依赖专业人员,但从根本上看是由于对于机器、知识和环境的依赖。表面上是BI产品需要专业的人去治理机器产生的脏数据,去梳理专业领域的知识,去完成知识在系统间的迁移。但本质是BI产品要求机器需要产出标准统一、质量上乘的基础数据,要求有大量可以直接录系统的行业知识,要求有一个统一的外部环境供知识在系统间自由分享。过渡的依赖外部环境,反而限制的BI产品自身的发展。下一代BI应该专注于从内部出发,主动去解决这些依赖,发展知识积累能力,主动优化融合现有数据资产,发展知识发现能力,能够快速总结归纳行业知识,发展知识传播能力,能够便捷打包成果对外输出。

而早在之前,传统行业也发现了现有的BI产品只能帮助他们看清现在,但无法看到未来,没有办法对发现的异常,从根本上给出措施建议开始探索通过新的视角重新审视业务痼疾,寻求解决之道。

nextionBI也在发布会上分享了和一些传统企业共谋数字化解决方案的真实故事,这些企业试图解决所在行业的共性问题,基于传统手段已经很难取得显著的突破。而通过与数睿数据这样的数字科技企业的合作,探索问题的另一种解法,将逐渐成为所在行业技术创新的主流。

发布会上首先分享的是一家纸材料生产制造企业,主要生产白卡纸。白卡纸属于工业用纸,采用100%漂白化学制浆抄制,具有坚挺厚实、平滑度高的特点,一般定量在210g-400g/㎡。白卡纸的产品类型主要分为纸盒、卡纸、纸袋,分别占比60%、20%、10%;下游主要应用于各类精细产品包装,如烟酒、化妆品、日用品、药品、食品、3C等日常消费产品包装。白卡纸的下游应用以必需消费品包装为主,终端需求持续稳定增长。

从中国造纸协会发布的《中国造纸工业2020年度报告》中数据来看,2020 年包装用纸生产量 705 万吨,较上年增长 1.44%;消费量 718 万吨,较上年增长 2.72%,是2020年纸产品中少数消费增长高于产量增长的品类。

白卡纸当前已呈现寡头垄断格局,以金光纸业、博汇纸业、晨鸣纸业、万国太阳为代表的寡头合计产能占比高达79%。金光、博汇和晨鸣的白卡纸年产能均达到200万吨以上,其中,金光纸业旗下的白卡纸生产企业包括亚洲浆纸业(150万吨/年)、广西金桂(100万吨/年)、宁波中华(62万吨/年),分布在浙江、广西等地;博汇纸业的白卡纸生产规模仅次于金光,产能主要分布在山东和江苏,合计年产能215万吨/年;晨鸣的产能主要分布在广东、山东、江西等地,合计年产能200万吨/年。

会上分享的企业作为现有的寡头之一,希望在良好的市场环境下,保持现有的竞争优势,除了营销工作之外,产品质量的稳定性是一个重要的基础。对于白卡纸来说,纸张的克重是衡量产品质量的重要指标。每个批次的纸张克重偏差越小,产品的质量稳定度也就越高。

但该企业的研发部门统计数据之后发现,目前白卡纸产品存在克重偏差较大的质量稳定性问题。由于克重不稳定,为了保证整体良品率,就不得不增加每个批次生产过程中的原料使用,从而保证即使偏差较大,但多数产品仍能够满足质量要求。但这样做显然会提高企业的生产成本,且整体的产品质量参差不齐,极大的损害了产品口碑,优化生产过程刻不容缓。

在接触nextionBI之前,该企业也早就开始针对这一问题探索解决方案,但是遇到几个现实的困难。首先,造纸过程相关的数据量极大,种类繁多。有的来自于自动化设备,有的来自于软件系统,有的靠人员手工记录,还有部分非结构化数据。这其中还包含大量的脏数据,存在诸如标准不统一、空值比例高、数据乱码等问题。在数据分析之前需要先完成复杂的数据清洗、数据标准化、数据关联等工作。企业研发部的人员虽然了解纸张生产数据的正确格式、知道不同字段的标准度量、能够将编码代号翻译成文本,但是他们大多不懂SQL语句,无法完成批量的数据加工处理工作。其次,经过材料研发人员对于大量历史数据的整理,生产制造过程中影响纸张克重的因素超过140种。但是具体是哪个因素对于克重有影响,是正相关还是负相关,这都需要一一测试。按照控制变量法的理论要求,至少要测试140次,每次都需要设计实验,调整参数,统计结果,这显然不具备可操作性。最后,难以定位影响因素对最终质量的影响值,不知道如何进行优化,针对某个因素具体优化值是多少?明确相关性只是第一步,下一步需要明确是线性相关还是指数相关,要有具体的相关函数才能形成量化可落地的操作建议。

对于数字化生产,企业认为不能简单的只是通过大屏展示生产结果数据现状,然后靠老师傅的经验决定优化方式,再通过一段时间的数据反馈判断优化效果,这种模式周期长,风险高。合理的方式应该是基于生产过程的数据分析,给出精准的操作建议,再通过生产测试进行验证,敲定生产优化措施。这就需要用到nextionBI的数据融合能力与增强分析中的主因子分析和根因定位能力。

针对第一个痛点,nextionBI对接生产数据,通过强大的数据交换机能力,完成复杂的数据处理流程,实现接入数据的清洗加工,排除异常数据对于分析结果的影响。这个过程不用写任何技术代码,一个纸材料的研发人员经过简单的培训,自己就可以通过拖拽数据加工算子的方式,配置加工流程,完成大量原始数据的加工处理。如上图所示是将三个来自不同系统的数据表经过加工处理,最终融合形成了一个数据资产。整个过程清晰可见,每个步骤对应的模块都可以动态调整,大大提升了数据处理过程的灵活度。这样就解决了数据分析基础素材的问题,为后续的分析打好了基础。

针对第二个痛点,利用nextionBI增强分析中的主因子分析能力,帮助客户从140多个影响因子中,快速定位影响纸张克重的主要影响因子,并提供主因子对结果的影响分析,并提供每个因子的影响值分析。如上图所示,影响因子的影响值排名从高到低分别显示的是2号浆液流量、车速、1号浆液流量、冲浆流量这四个因子,并且给出了具体的影响值,这就为下一步的分析工作提供了量化的参考依据。

 针对第三个痛点,采用根因分析,通过根因定位分析能力,对影响纸张克重的可能进行根因组合,列出组合排名。提取主因子,将每种组合的具体值列出,提供系数调整优化值建议,直接提供量化的指导。

 

如上图中所示,为不同因子分配不同的参数选择,形成多种组合。针对不同的组合分析其可能性的占比。比如图中的组合三就代表了2号纸浆流量小于等于14.25,1号纸浆流量小于等于32.05,车速小于 33.156这种参数组合形式,但是这种组合方式相较于组合一的可能性占比是偏低的,为了达到优化目标,最终应该选择组合一对应的参数设计。基于这些分析,进行了多次实验,研发部门给出了具体操作建议,帮助生产部门快速改善生产过程,稳定生产质量。

企业按照准备数据,确定方向,量化措施的过程,一步一步有条不紊的完成之前一直困扰他们的产品质量稳定性问题。nextionBI作为新发布的下一代BI的代表,其强大的数据融合处理能力、增强分析能力都很好地帮助企业完成了这次优化生产过程的目标。下一代BI的新能力,给企业提供了解决问题的新手段和方向。

这篇关于在数睿数据nextionBI线上发布会上,传统企业展示了对数据分析的深度理解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/657453

相关文章

Python获取中国节假日数据记录入JSON文件

《Python获取中国节假日数据记录入JSON文件》项目系统内置的日历应用为了提升用户体验,特别设置了在调休日期显示“休”的UI图标功能,那么问题是这些调休数据从哪里来呢?我尝试一种更为智能的方法:P... 目录节假日数据获取存入jsON文件节假日数据读取封装完整代码项目系统内置的日历应用为了提升用户体验,

SpringCloud动态配置注解@RefreshScope与@Component的深度解析

《SpringCloud动态配置注解@RefreshScope与@Component的深度解析》在现代微服务架构中,动态配置管理是一个关键需求,本文将为大家介绍SpringCloud中相关的注解@Re... 目录引言1. @RefreshScope 的作用与原理1.1 什么是 @RefreshScope1.

Java利用JSONPath操作JSON数据的技术指南

《Java利用JSONPath操作JSON数据的技术指南》JSONPath是一种强大的工具,用于查询和操作JSON数据,类似于SQL的语法,它为处理复杂的JSON数据结构提供了简单且高效... 目录1、简述2、什么是 jsONPath?3、Java 示例3.1 基本查询3.2 过滤查询3.3 递归搜索3.4

MySQL大表数据的分区与分库分表的实现

《MySQL大表数据的分区与分库分表的实现》数据库的分区和分库分表是两种常用的技术方案,本文主要介绍了MySQL大表数据的分区与分库分表的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有... 目录1. mysql大表数据的分区1.1 什么是分区?1.2 分区的类型1.3 分区的优点1.4 分

Mysql删除几亿条数据表中的部分数据的方法实现

《Mysql删除几亿条数据表中的部分数据的方法实现》在MySQL中删除一个大表中的数据时,需要特别注意操作的性能和对系统的影响,本文主要介绍了Mysql删除几亿条数据表中的部分数据的方法实现,具有一定... 目录1、需求2、方案1. 使用 DELETE 语句分批删除2. 使用 INPLACE ALTER T

Python 中的异步与同步深度解析(实践记录)

《Python中的异步与同步深度解析(实践记录)》在Python编程世界里,异步和同步的概念是理解程序执行流程和性能优化的关键,这篇文章将带你深入了解它们的差异,以及阻塞和非阻塞的特性,同时通过实际... 目录python中的异步与同步:深度解析与实践异步与同步的定义异步同步阻塞与非阻塞的概念阻塞非阻塞同步

Python Dash框架在数据可视化仪表板中的应用与实践记录

《PythonDash框架在数据可视化仪表板中的应用与实践记录》Python的PlotlyDash库提供了一种简便且强大的方式来构建和展示互动式数据仪表板,本篇文章将深入探讨如何使用Dash设计一... 目录python Dash框架在数据可视化仪表板中的应用与实践1. 什么是Plotly Dash?1.1

Redis 中的热点键和数据倾斜示例详解

《Redis中的热点键和数据倾斜示例详解》热点键是指在Redis中被频繁访问的特定键,这些键由于其高访问频率,可能导致Redis服务器的性能问题,尤其是在高并发场景下,本文给大家介绍Redis中的热... 目录Redis 中的热点键和数据倾斜热点键(Hot Key)定义特点应对策略示例数据倾斜(Data S

Python实现将MySQL中所有表的数据都导出为CSV文件并压缩

《Python实现将MySQL中所有表的数据都导出为CSV文件并压缩》这篇文章主要为大家详细介绍了如何使用Python将MySQL数据库中所有表的数据都导出为CSV文件到一个目录,并压缩为zip文件到... python将mysql数据库中所有表的数据都导出为CSV文件到一个目录,并压缩为zip文件到另一个

Redis中高并发读写性能的深度解析与优化

《Redis中高并发读写性能的深度解析与优化》Redis作为一款高性能的内存数据库,广泛应用于缓存、消息队列、实时统计等场景,本文将深入探讨Redis的读写并发能力,感兴趣的小伙伴可以了解下... 目录引言一、Redis 并发能力概述1.1 Redis 的读写性能1.2 影响 Redis 并发能力的因素二、