一分钟5万个文件,分布式存储在“数字机台”场景下的应用实践

2023-10-30 13:04

本文主要是介绍一分钟5万个文件,分布式存储在“数字机台”场景下的应用实践,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、 什么是“数字机台”?

从一个普普通通的螺丝,到一台复杂精密的汽车,现代工业让数以万计的零部件在流水线上彼此组合。但复杂的分工和流程,也给各个制造环节设置了极为苛刻的标准。比如一个小小的汽车组件,就有数百种尺寸要求,在生产时每个尺寸都需要通过X、Y、Z三轴数据进行确认。如何保证这些零部件的尺寸、质量符合标准,“数字机台”由此在智能制造的创新中应运而生。

通过“数字机台”的部署,新一代生产线可以利用机器视觉技术从各个不同角度快速获取被检测产品的信息,实现自动化的装配定位、质量检测、产品识别、尺寸测量等功能,可以极大程度上提升生产的效率,并已在电子制造、半导体、新汽车制造中实现了规模化应用。但随之而来的是生产线上出现了大量小至几KB大至几十MB的文本、图片数据,这些非结构化的数据让传统存储难以应付。

二、新华三分布式存储X10000助力“数字机台”场景应用的优势解析

在数字机台中,AOI(Auto Optical Inspection,自动光学检测)是核心设备之一,一台AOI设备在一分钟时间内就能产生5万多个大小在十几K到几百K左右的小文件,同时这些小文件要被打上标签,被AI计算设备读取分析,并在后续进行全生命周期的管理。但这种独特应用场景的传统存储方式存在众多问题,比如多个客户端协议导致统一管理不便,单点故障容易导致业务中断和数据丢失等问题,并且存储需要高的可扩展性,便于应对业务增长的需求,并且要有能力做好亿级小文件的高效检索和全生命周期管理,以低成本应对海量存储的需要。

在这里插入图片描述

从上图可以看到,“数字机台”对于底层数据存储平台的需求是极其复杂和多变的,其中既包括了通用网络文件系统CIFS、文件传输协议FTP、简单存储服务S3等各种协议,让底层的存储集群疲于应对,而且在集群内部也需要处理好不同数据的传输和管理。显而易见,传统本地存储和集中式NAS存储都无法独立满足这些严格需求。
在这里插入图片描述

为什么本地存储和NAS存储都无法满足数字机台的需求

作为新华三集团自主研发的存储“代表作”,X10000存储凭借高达8192个节点的高扩展性,提供EB级的大容量存储,能够以五大亮点应对“数字机台”特定场景的高标准要求。

  • 亮点一:统一存储,简便运维

X10000支持HDFS、S3、iSCSI、NFS、CIFS、CSI等全存储协议,基于硬盘池划分实现块、文件、对象、大数据等不同类型数据的融合部署,做到按需扩容,多集群的统一管理。

- 亮点二:数据安全多重保障
X10000还提供了多副本、纠删码等诸多功能保障数据实现11个9的高可靠,WORM、回收站、多版本等数据保护手段能有效避免数据丢失、损坏等风险,并能通过跨越上千公里的远程复制构建完备的容灾体系。

- 亮点三:读写性能全面提升
X10000打造了一个由SSD+HDD组成的 “缓存池”,智能化地处理不同IO需求,前台写小IO,并通过小IO聚合为大IO的方式提升性能加速,借助ROW无损快照将性能下降控制在5%以内,单桶20亿的性能下降控制在了10%以内。
在这里插入图片描述

- 亮点四:检索效率提升几十倍

X10000通过自动定时推送、自动打标签、元数据检索等用户友好型特性,实现亿级文件秒级检索,帮助企业减少人工操作,融合非结构化数据资源池,更好地利用机台数据进行质检分析,帮助提升产线产品质量,释放机台数据的业务价值。

  • 亮点五:线性扩容,低TCO

8+2的大比例纠删,支持图片重删压缩,让数字机台在同等硬件配置下,有效磁盘空间从三副本的33%提升到了80%。而且X10000支持无缝的不停机扩容,做到性能线性增加,避免新购License提升成本。而且X10000支持硬盘一键换盘,支持热插拔,并支持自动化的文件分级存储和对象生命周期管理,能够有效提升存储效率。

在这里插入图片描述

三、落地有为,在实践中印证实力

如果说技术和参数让X10000具备承载数字机台高效运转的全能实力,那么在半导体、制造等行业中的真实应用,就给出了这一能力的实践印证。在某家国内知名的半导体企业,X10000成为了应对ADC业务数亿小文件的创新“利器”,通过小IO聚合、读写缓存、ROW等提升读写性能,并借助线性平滑扩容和大规模集群应对数据量的大幅度增长,提升生产效率。在某家全球领先的制造企业,X10000帮助其破解数据统一管理难题,以多种存储类型和协议的广泛兼容,为未来的业务增长预留创新空间,并通过EB级的扩展性和全方位的运维保障特性,提供全生命周期的数据服务。

在核心的制造业之外,X10000也在能源、汽车等行业中广泛应用。在某能源企业内,CCD机器视觉检测业务每天都会产出几百KB的小文件,并且这些文件要保证未来15年的存放和管理。为了应对这一高难度的需求,X10000通过大比例纠删冗余策略提升空间利用率,并通过自动分级和归档在满足快速访问查询的需求的同时,满足数据低成本长期存储。

四、小结

从制造到智造注定不是一个一蹴而就的过程,而是需要长期的创新探索和实践变革。在这背后,新华三以对智能存储创新的持续投入为更多行业转型场景构筑坚实有力、智能高效的数字底座,让数据这一指数级增长的生产要素在未来焕发新的价值和生命力。

这篇关于一分钟5万个文件,分布式存储在“数字机台”场景下的应用实践的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/308108

相关文章

kotlin中const 和val的区别及使用场景分析

《kotlin中const和val的区别及使用场景分析》在Kotlin中,const和val都是用来声明常量的,但它们的使用场景和功能有所不同,下面给大家介绍kotlin中const和val的区别,... 目录kotlin中const 和val的区别1. val:2. const:二 代码示例1 Java

Python FastAPI+Celery+RabbitMQ实现分布式图片水印处理系统

《PythonFastAPI+Celery+RabbitMQ实现分布式图片水印处理系统》这篇文章主要为大家详细介绍了PythonFastAPI如何结合Celery以及RabbitMQ实现简单的分布式... 实现思路FastAPI 服务器Celery 任务队列RabbitMQ 作为消息代理定时任务处理完整

Spring Boot 配置文件之类型、加载顺序与最佳实践记录

《SpringBoot配置文件之类型、加载顺序与最佳实践记录》SpringBoot的配置文件是灵活且强大的工具,通过合理的配置管理,可以让应用开发和部署更加高效,无论是简单的属性配置,还是复杂... 目录Spring Boot 配置文件详解一、Spring Boot 配置文件类型1.1 applicatio

C# WinForms存储过程操作数据库的实例讲解

《C#WinForms存储过程操作数据库的实例讲解》:本文主要介绍C#WinForms存储过程操作数据库的实例,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、存储过程基础二、C# 调用流程1. 数据库连接配置2. 执行存储过程(增删改)3. 查询数据三、事务处

Python中随机休眠技术原理与应用详解

《Python中随机休眠技术原理与应用详解》在编程中,让程序暂停执行特定时间是常见需求,当需要引入不确定性时,随机休眠就成为关键技巧,下面我们就来看看Python中随机休眠技术的具体实现与应用吧... 目录引言一、实现原理与基础方法1.1 核心函数解析1.2 基础实现模板1.3 整数版实现二、典型应用场景2

tomcat多实例部署的项目实践

《tomcat多实例部署的项目实践》Tomcat多实例是指在一台设备上运行多个Tomcat服务,这些Tomcat相互独立,本文主要介绍了tomcat多实例部署的项目实践,具有一定的参考价值,感兴趣的可... 目录1.创建项目目录,测试文China编程件2js.创建实例的安装目录3.准备实例的配置文件4.编辑实例的

Python 中的异步与同步深度解析(实践记录)

《Python中的异步与同步深度解析(实践记录)》在Python编程世界里,异步和同步的概念是理解程序执行流程和性能优化的关键,这篇文章将带你深入了解它们的差异,以及阻塞和非阻塞的特性,同时通过实际... 目录python中的异步与同步:深度解析与实践异步与同步的定义异步同步阻塞与非阻塞的概念阻塞非阻塞同步

Python Dash框架在数据可视化仪表板中的应用与实践记录

《PythonDash框架在数据可视化仪表板中的应用与实践记录》Python的PlotlyDash库提供了一种简便且强大的方式来构建和展示互动式数据仪表板,本篇文章将深入探讨如何使用Dash设计一... 目录python Dash框架在数据可视化仪表板中的应用与实践1. 什么是Plotly Dash?1.1

Android Kotlin 高阶函数详解及其在协程中的应用小结

《AndroidKotlin高阶函数详解及其在协程中的应用小结》高阶函数是Kotlin中的一个重要特性,它能够将函数作为一等公民(First-ClassCitizen),使得代码更加简洁、灵活和可... 目录1. 引言2. 什么是高阶函数?3. 高阶函数的基础用法3.1 传递函数作为参数3.2 Lambda

springboot集成Deepseek4j的项目实践

《springboot集成Deepseek4j的项目实践》本文主要介绍了springboot集成Deepseek4j的项目实践,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价... 目录Deepseek4j快速开始Maven 依js赖基础配置基础使用示例1. 流式返回示例2. 进阶