在数睿数据nextionBI线上发布会上,传统企业展示了对数据分析的深度理解

本文主要是介绍在数睿数据nextionBI线上发布会上,传统企业展示了对数据分析的深度理解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

2022年2月25日,数睿数据正式发布下一代专注知识的BI产品——nextionBI,启动了自己“无代码+BI”的双产品战略布局。数睿数据总裁刘超总结,当前的BI产品过于依赖专业人员,但从根本上看是由于对于机器、知识和环境的依赖。表面上是BI产品需要专业的人去治理机器产生的脏数据,去梳理专业领域的知识,去完成知识在系统间的迁移。但本质是BI产品要求机器需要产出标准统一、质量上乘的基础数据,要求有大量可以直接录系统的行业知识,要求有一个统一的外部环境供知识在系统间自由分享。过渡的依赖外部环境,反而限制的BI产品自身的发展。下一代BI应该专注于从内部出发,主动去解决这些依赖,发展知识积累能力,主动优化融合现有数据资产,发展知识发现能力,能够快速总结归纳行业知识,发展知识传播能力,能够便捷打包成果对外输出。

而早在之前,传统行业也发现了现有的BI产品只能帮助他们看清现在,但无法看到未来,没有办法对发现的异常,从根本上给出措施建议开始探索通过新的视角重新审视业务痼疾,寻求解决之道。

nextionBI也在发布会上分享了和一些传统企业共谋数字化解决方案的真实故事,这些企业试图解决所在行业的共性问题,基于传统手段已经很难取得显著的突破。而通过与数睿数据这样的数字科技企业的合作,探索问题的另一种解法,将逐渐成为所在行业技术创新的主流。

发布会上首先分享的是一家纸材料生产制造企业,主要生产白卡纸。白卡纸属于工业用纸,采用100%漂白化学制浆抄制,具有坚挺厚实、平滑度高的特点,一般定量在210g-400g/㎡。白卡纸的产品类型主要分为纸盒、卡纸、纸袋,分别占比60%、20%、10%;下游主要应用于各类精细产品包装,如烟酒、化妆品、日用品、药品、食品、3C等日常消费产品包装。白卡纸的下游应用以必需消费品包装为主,终端需求持续稳定增长。

从中国造纸协会发布的《中国造纸工业2020年度报告》中数据来看,2020 年包装用纸生产量 705 万吨,较上年增长 1.44%;消费量 718 万吨,较上年增长 2.72%,是2020年纸产品中少数消费增长高于产量增长的品类。

白卡纸当前已呈现寡头垄断格局,以金光纸业、博汇纸业、晨鸣纸业、万国太阳为代表的寡头合计产能占比高达79%。金光、博汇和晨鸣的白卡纸年产能均达到200万吨以上,其中,金光纸业旗下的白卡纸生产企业包括亚洲浆纸业(150万吨/年)、广西金桂(100万吨/年)、宁波中华(62万吨/年),分布在浙江、广西等地;博汇纸业的白卡纸生产规模仅次于金光,产能主要分布在山东和江苏,合计年产能215万吨/年;晨鸣的产能主要分布在广东、山东、江西等地,合计年产能200万吨/年。

会上分享的企业作为现有的寡头之一,希望在良好的市场环境下,保持现有的竞争优势,除了营销工作之外,产品质量的稳定性是一个重要的基础。对于白卡纸来说,纸张的克重是衡量产品质量的重要指标。每个批次的纸张克重偏差越小,产品的质量稳定度也就越高。

但该企业的研发部门统计数据之后发现,目前白卡纸产品存在克重偏差较大的质量稳定性问题。由于克重不稳定,为了保证整体良品率,就不得不增加每个批次生产过程中的原料使用,从而保证即使偏差较大,但多数产品仍能够满足质量要求。但这样做显然会提高企业的生产成本,且整体的产品质量参差不齐,极大的损害了产品口碑,优化生产过程刻不容缓。

在接触nextionBI之前,该企业也早就开始针对这一问题探索解决方案,但是遇到几个现实的困难。首先,造纸过程相关的数据量极大,种类繁多。有的来自于自动化设备,有的来自于软件系统,有的靠人员手工记录,还有部分非结构化数据。这其中还包含大量的脏数据,存在诸如标准不统一、空值比例高、数据乱码等问题。在数据分析之前需要先完成复杂的数据清洗、数据标准化、数据关联等工作。企业研发部的人员虽然了解纸张生产数据的正确格式、知道不同字段的标准度量、能够将编码代号翻译成文本,但是他们大多不懂SQL语句,无法完成批量的数据加工处理工作。其次,经过材料研发人员对于大量历史数据的整理,生产制造过程中影响纸张克重的因素超过140种。但是具体是哪个因素对于克重有影响,是正相关还是负相关,这都需要一一测试。按照控制变量法的理论要求,至少要测试140次,每次都需要设计实验,调整参数,统计结果,这显然不具备可操作性。最后,难以定位影响因素对最终质量的影响值,不知道如何进行优化,针对某个因素具体优化值是多少?明确相关性只是第一步,下一步需要明确是线性相关还是指数相关,要有具体的相关函数才能形成量化可落地的操作建议。

对于数字化生产,企业认为不能简单的只是通过大屏展示生产结果数据现状,然后靠老师傅的经验决定优化方式,再通过一段时间的数据反馈判断优化效果,这种模式周期长,风险高。合理的方式应该是基于生产过程的数据分析,给出精准的操作建议,再通过生产测试进行验证,敲定生产优化措施。这就需要用到nextionBI的数据融合能力与增强分析中的主因子分析和根因定位能力。

针对第一个痛点,nextionBI对接生产数据,通过强大的数据交换机能力,完成复杂的数据处理流程,实现接入数据的清洗加工,排除异常数据对于分析结果的影响。这个过程不用写任何技术代码,一个纸材料的研发人员经过简单的培训,自己就可以通过拖拽数据加工算子的方式,配置加工流程,完成大量原始数据的加工处理。如上图所示是将三个来自不同系统的数据表经过加工处理,最终融合形成了一个数据资产。整个过程清晰可见,每个步骤对应的模块都可以动态调整,大大提升了数据处理过程的灵活度。这样就解决了数据分析基础素材的问题,为后续的分析打好了基础。

针对第二个痛点,利用nextionBI增强分析中的主因子分析能力,帮助客户从140多个影响因子中,快速定位影响纸张克重的主要影响因子,并提供主因子对结果的影响分析,并提供每个因子的影响值分析。如上图所示,影响因子的影响值排名从高到低分别显示的是2号浆液流量、车速、1号浆液流量、冲浆流量这四个因子,并且给出了具体的影响值,这就为下一步的分析工作提供了量化的参考依据。

 针对第三个痛点,采用根因分析,通过根因定位分析能力,对影响纸张克重的可能进行根因组合,列出组合排名。提取主因子,将每种组合的具体值列出,提供系数调整优化值建议,直接提供量化的指导。

 

如上图中所示,为不同因子分配不同的参数选择,形成多种组合。针对不同的组合分析其可能性的占比。比如图中的组合三就代表了2号纸浆流量小于等于14.25,1号纸浆流量小于等于32.05,车速小于 33.156这种参数组合形式,但是这种组合方式相较于组合一的可能性占比是偏低的,为了达到优化目标,最终应该选择组合一对应的参数设计。基于这些分析,进行了多次实验,研发部门给出了具体操作建议,帮助生产部门快速改善生产过程,稳定生产质量。

企业按照准备数据,确定方向,量化措施的过程,一步一步有条不紊的完成之前一直困扰他们的产品质量稳定性问题。nextionBI作为新发布的下一代BI的代表,其强大的数据融合处理能力、增强分析能力都很好地帮助企业完成了这次优化生产过程的目标。下一代BI的新能力,给企业提供了解决问题的新手段和方向。

这篇关于在数睿数据nextionBI线上发布会上,传统企业展示了对数据分析的深度理解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/657453

相关文章

Vue项目的甘特图组件之dhtmlx-gantt使用教程和实现效果展示(推荐)

《Vue项目的甘特图组件之dhtmlx-gantt使用教程和实现效果展示(推荐)》文章介绍了如何使用dhtmlx-gantt组件来实现公司的甘特图需求,并提供了一个简单的Vue组件示例,文章还分享了一... 目录一、首先 npm 安装插件二、创建一个vue组件三、业务页面内 引用自定义组件:四、dhtmlx

Python与DeepSeek的深度融合实战

《Python与DeepSeek的深度融合实战》Python作为最受欢迎的编程语言之一,以其简洁易读的语法、丰富的库和广泛的应用场景,成为了无数开发者的首选,而DeepSeek,作为人工智能领域的新星... 目录一、python与DeepSeek的结合优势二、模型训练1. 数据准备2. 模型架构与参数设置3

javaScript在表单提交时获取表单数据的示例代码

《javaScript在表单提交时获取表单数据的示例代码》本文介绍了五种在JavaScript中获取表单数据的方法:使用FormData对象、手动提取表单数据、使用querySelector获取单个字... 方法 1:使用 FormData 对象FormData 是一个方便的内置对象,用于获取表单中的键值

Rust中的BoxT之堆上的数据与递归类型详解

《Rust中的BoxT之堆上的数据与递归类型详解》本文介绍了Rust中的BoxT类型,包括其在堆与栈之间的内存分配,性能优势,以及如何利用BoxT来实现递归类型和处理大小未知类型,通过BoxT,Rus... 目录1. Box<T> 的基础知识1.1 堆与栈的分工1.2 性能优势2.1 递归类型的问题2.2

Python使用Pandas对比两列数据取最大值的五种方法

《Python使用Pandas对比两列数据取最大值的五种方法》本文主要介绍使用Pandas对比两列数据取最大值的五种方法,包括使用max方法、apply方法结合lambda函数、函数、clip方法、w... 目录引言一、使用max方法二、使用apply方法结合lambda函数三、使用np.maximum函数

Java深度学习库DJL实现Python的NumPy方式

《Java深度学习库DJL实现Python的NumPy方式》本文介绍了DJL库的背景和基本功能,包括NDArray的创建、数学运算、数据获取和设置等,同时,还展示了如何使用NDArray进行数据预处理... 目录1 NDArray 的背景介绍1.1 架构2 JavaDJL使用2.1 安装DJL2.2 基本操

最长公共子序列问题的深度分析与Java实现方式

《最长公共子序列问题的深度分析与Java实现方式》本文详细介绍了最长公共子序列(LCS)问题,包括其概念、暴力解法、动态规划解法,并提供了Java代码实现,暴力解法虽然简单,但在大数据处理中效率较低,... 目录最长公共子序列问题概述问题理解与示例分析暴力解法思路与示例代码动态规划解法DP 表的构建与意义动

Redis的数据过期策略和数据淘汰策略

《Redis的数据过期策略和数据淘汰策略》本文主要介绍了Redis的数据过期策略和数据淘汰策略,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 目录一、数据过期策略1、惰性删除2、定期删除二、数据淘汰策略1、数据淘汰策略概念2、8种数据淘汰策略

轻松上手MYSQL之JSON函数实现高效数据查询与操作

《轻松上手MYSQL之JSON函数实现高效数据查询与操作》:本文主要介绍轻松上手MYSQL之JSON函数实现高效数据查询与操作的相关资料,MySQL提供了多个JSON函数,用于处理和查询JSON数... 目录一、jsON_EXTRACT 提取指定数据二、JSON_UNQUOTE 取消双引号三、JSON_KE

Python给Excel写入数据的四种方法小结

《Python给Excel写入数据的四种方法小结》本文主要介绍了Python给Excel写入数据的四种方法小结,包含openpyxl库、xlsxwriter库、pandas库和win32com库,具有... 目录1. 使用 openpyxl 库2. 使用 xlsxwriter 库3. 使用 pandas 库