一分钟5万个文件,分布式存储在“数字机台”场景下的应用实践

2023-10-30 14:01

本文主要是介绍一分钟5万个文件,分布式存储在“数字机台”场景下的应用实践,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、 什么是“数字机台”?

从一个普普通通的螺丝,到一台复杂精密的汽车,现代工业让数以万计的零部件在流水线上彼此组合。但复杂的分工和流程,也给各个制造环节设置了极为苛刻的标准。比如一个小小的汽车组件,就有数百种尺寸要求,在生产时每个尺寸都需要通过X、Y、Z三轴数据进行确认。如何保证这些零部件的尺寸、质量符合标准,“数字机台”由此在智能制造的创新中应运而生。

通过“数字机台”的部署,新一代生产线可以利用机器视觉技术从各个不同角度快速获取被检测产品的信息,实现自动化的装配定位、质量检测、产品识别、尺寸测量等功能,可以极大程度上提升生产的效率,并已在电子制造、半导体、新汽车制造中实现了规模化应用。但随之而来的是生产线上出现了大量小至几KB大至几十MB的文本、图片数据,这些非结构化的数据让传统存储难以应付。

二、新华三分布式存储X10000助力“数字机台”场景应用的优势解析

在数字机台中,AOI(Auto Optical Inspection,自动光学检测)是核心设备之一,一台AOI设备在一分钟时间内就能产生5万多个大小在十几K到几百K左右的小文件,同时这些小文件要被打上标签,被AI计算设备读取分析,并在后续进行全生命周期的管理。但这种独特应用场景的传统存储方式存在众多问题,比如多个客户端协议导致统一管理不便,单点故障容易导致业务中断和数据丢失等问题,并且存储需要高的可扩展性,便于应对业务增长的需求,并且要有能力做好亿级小文件的高效检索和全生命周期管理,以低成本应对海量存储的需要。

在这里插入图片描述

从上图可以看到,“数字机台”对于底层数据存储平台的需求是极其复杂和多变的,其中既包括了通用网络文件系统CIFS、文件传输协议FTP、简单存储服务S3等各种协议,让底层的存储集群疲于应对,而且在集群内部也需要处理好不同数据的传输和管理。显而易见,传统本地存储和集中式NAS存储都无法独立满足这些严格需求。
在这里插入图片描述

为什么本地存储和NAS存储都无法满足数字机台的需求

作为新华三集团自主研发的存储“代表作”,X10000存储凭借高达8192个节点的高扩展性,提供EB级的大容量存储,能够以五大亮点应对“数字机台”特定场景的高标准要求。

  • 亮点一:统一存储,简便运维

X10000支持HDFS、S3、iSCSI、NFS、CIFS、CSI等全存储协议,基于硬盘池划分实现块、文件、对象、大数据等不同类型数据的融合部署,做到按需扩容,多集群的统一管理。

- 亮点二:数据安全多重保障
X10000还提供了多副本、纠删码等诸多功能保障数据实现11个9的高可靠,WORM、回收站、多版本等数据保护手段能有效避免数据丢失、损坏等风险,并能通过跨越上千公里的远程复制构建完备的容灾体系。

- 亮点三:读写性能全面提升
X10000打造了一个由SSD+HDD组成的 “缓存池”,智能化地处理不同IO需求,前台写小IO,并通过小IO聚合为大IO的方式提升性能加速,借助ROW无损快照将性能下降控制在5%以内,单桶20亿的性能下降控制在了10%以内。
在这里插入图片描述

- 亮点四:检索效率提升几十倍

X10000通过自动定时推送、自动打标签、元数据检索等用户友好型特性,实现亿级文件秒级检索,帮助企业减少人工操作,融合非结构化数据资源池,更好地利用机台数据进行质检分析,帮助提升产线产品质量,释放机台数据的业务价值。

  • 亮点五:线性扩容,低TCO

8+2的大比例纠删,支持图片重删压缩,让数字机台在同等硬件配置下,有效磁盘空间从三副本的33%提升到了80%。而且X10000支持无缝的不停机扩容,做到性能线性增加,避免新购License提升成本。而且X10000支持硬盘一键换盘,支持热插拔,并支持自动化的文件分级存储和对象生命周期管理,能够有效提升存储效率。

在这里插入图片描述

三、落地有为,在实践中印证实力

如果说技术和参数让X10000具备承载数字机台高效运转的全能实力,那么在半导体、制造等行业中的真实应用,就给出了这一能力的实践印证。在某家国内知名的半导体企业,X10000成为了应对ADC业务数亿小文件的创新“利器”,通过小IO聚合、读写缓存、ROW等提升读写性能,并借助线性平滑扩容和大规模集群应对数据量的大幅度增长,提升生产效率。在某家全球领先的制造企业,X10000帮助其破解数据统一管理难题,以多种存储类型和协议的广泛兼容,为未来的业务增长预留创新空间,并通过EB级的扩展性和全方位的运维保障特性,提供全生命周期的数据服务。

在核心的制造业之外,X10000也在能源、汽车等行业中广泛应用。在某能源企业内,CCD机器视觉检测业务每天都会产出几百KB的小文件,并且这些文件要保证未来15年的存放和管理。为了应对这一高难度的需求,X10000通过大比例纠删冗余策略提升空间利用率,并通过自动分级和归档在满足快速访问查询的需求的同时,满足数据低成本长期存储。

四、小结

从制造到智造注定不是一个一蹴而就的过程,而是需要长期的创新探索和实践变革。在这背后,新华三以对智能存储创新的持续投入为更多行业转型场景构筑坚实有力、智能高效的数字底座,让数据这一指数级增长的生产要素在未来焕发新的价值和生命力。

这篇关于一分钟5万个文件,分布式存储在“数字机台”场景下的应用实践的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/308417

相关文章

Oracle查询优化之高效实现仅查询前10条记录的方法与实践

《Oracle查询优化之高效实现仅查询前10条记录的方法与实践》:本文主要介绍Oracle查询优化之高效实现仅查询前10条记录的相关资料,包括使用ROWNUM、ROW_NUMBER()函数、FET... 目录1. 使用 ROWNUM 查询2. 使用 ROW_NUMBER() 函数3. 使用 FETCH FI

Mysql虚拟列的使用场景

《Mysql虚拟列的使用场景》MySQL虚拟列是一种在查询时动态生成的特殊列,它不占用存储空间,可以提高查询效率和数据处理便利性,本文给大家介绍Mysql虚拟列的相关知识,感兴趣的朋友一起看看吧... 目录1. 介绍mysql虚拟列1.1 定义和作用1.2 虚拟列与普通列的区别2. MySQL虚拟列的类型2

使用MongoDB进行数据存储的操作流程

《使用MongoDB进行数据存储的操作流程》在现代应用开发中,数据存储是一个至关重要的部分,随着数据量的增大和复杂性的增加,传统的关系型数据库有时难以应对高并发和大数据量的处理需求,MongoDB作为... 目录什么是MongoDB?MongoDB的优势使用MongoDB进行数据存储1. 安装MongoDB

在C#中获取端口号与系统信息的高效实践

《在C#中获取端口号与系统信息的高效实践》在现代软件开发中,尤其是系统管理、运维、监控和性能优化等场景中,了解计算机硬件和网络的状态至关重要,C#作为一种广泛应用的编程语言,提供了丰富的API来帮助开... 目录引言1. 获取端口号信息1.1 获取活动的 TCP 和 UDP 连接说明:应用场景:2. 获取硬

Java内存泄漏问题的排查、优化与最佳实践

《Java内存泄漏问题的排查、优化与最佳实践》在Java开发中,内存泄漏是一个常见且令人头疼的问题,内存泄漏指的是程序在运行过程中,已经不再使用的对象没有被及时释放,从而导致内存占用不断增加,最终... 目录引言1. 什么是内存泄漏?常见的内存泄漏情况2. 如何排查 Java 中的内存泄漏?2.1 使用 J

在MyBatis的XML映射文件中<trim>元素所有场景下的完整使用示例代码

《在MyBatis的XML映射文件中<trim>元素所有场景下的完整使用示例代码》在MyBatis的XML映射文件中,trim元素用于动态添加SQL语句的一部分,处理前缀、后缀及多余的逗号或连接符,示... 在MyBATis的XML映射文件中,<trim>元素用于动态地添加SQL语句的一部分,例如SET或W

将Python应用部署到生产环境的小技巧分享

《将Python应用部署到生产环境的小技巧分享》文章主要讲述了在将Python应用程序部署到生产环境之前,需要进行的准备工作和最佳实践,包括心态调整、代码审查、测试覆盖率提升、配置文件优化、日志记录完... 目录部署前夜:从开发到生产的心理准备与检查清单环境搭建:打造稳固的应用运行平台自动化流水线:让部署像

VUE动态绑定class类的三种常用方式及适用场景详解

《VUE动态绑定class类的三种常用方式及适用场景详解》文章介绍了在实际开发中动态绑定class的三种常见情况及其解决方案,包括根据不同的返回值渲染不同的class样式、给模块添加基础样式以及根据设... 目录前言1.动态选择class样式(对象添加:情景一)2.动态添加一个class样式(字符串添加:情

Linux中Curl参数详解实践应用

《Linux中Curl参数详解实践应用》在现代网络开发和运维工作中,curl命令是一个不可或缺的工具,它是一个利用URL语法在命令行下工作的文件传输工具,支持多种协议,如HTTP、HTTPS、FTP等... 目录引言一、基础请求参数1. -X 或 --request2. -d 或 --data3. -H 或

java如何分布式锁实现和选型

《java如何分布式锁实现和选型》文章介绍了分布式锁的重要性以及在分布式系统中常见的问题和需求,它详细阐述了如何使用分布式锁来确保数据的一致性和系统的高可用性,文章还提供了基于数据库、Redis和Zo... 目录引言:分布式锁的重要性与分布式系统中的常见问题和需求分布式锁的重要性分布式系统中常见的问题和需求