杉岩数据:智能化管理10亿文件,G证券是如何做到的?

2024-02-26 17:59

本文主要是介绍杉岩数据:智能化管理10亿文件,G证券是如何做到的?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

证券公司每天产生的数据中80%以上是非结构化数据,持续的数据增长,证券服务向智能化、敏捷化、价值化方向发展,对后端存储提出了挑战。

1、变革的动力:证券信息化升级

以影像、图片、扫描件为主的非结构化数据激增,数据量从TB级向PB级跃进。每年新增大量应用,复杂性增加,海量文件的访问性能面临新挑战。

机构内部业务繁杂,存在数据壁垒,需搭建统一数据平台,提高跨业务共享效率。技术演进推动应用的容器化部署,这要求存储吸收容器技术提供持久化存储服务。利用大数据的价值,借力AI实现业务创新,比如智能运维(AIOps),进一步降本提效也是大势所趋。如果存储自身能够提供AI能力,支撑智能运维,自然是锦上添花。

G证券公司(后文简称“G证券”)选择分布式存储,开启了集约式数字化档案管理的全新探索。

2、变革迫在眉睫:长期痛点驱使新方案落地

从外部环境来看,2014年以前,证券业客户档案都采用营业部分散管理的方式,风险多,一线员工压力大,掣肘业务开展。从内部需求看,业务数据以小文件为主,且增速很快;加之“双录”规范要求文件保存20年且随时调阅,存储性能严重不足。

G证券面临痛点如下:NAS存储7000万文件,秒级延时性能差;NAS瓶颈凸显,扩容困难;多站点管理不便,主备中心难以高效协同;业务高峰期带宽不足,资源无法合理分配;大文件读取慢,视频播放卡顿,用户体验差;人工运维效率低,构建智能运维平台是刚需。这一切促使G证券面向市场寻求新的存储解决方案。

3、众多方案角逐:G证券为何选择杉岩?

备选方案中,一类是传统存储方案,即用高端NAS满足需求,但未来频繁扩容以及性能瓶颈依旧令人头疼;另一类是分布式存储方案,其在容量、性能、扩展性等方面具备天然优势。

针对前述痛点,方案选型需关注:PB级容量,灵活扩容;性能无瓶颈,访问性能高;运维简单,效益显著;测试对接顺利,业务上线快;售后及时,提供原厂支持。

竞争者中不乏传统存储领域的知名大厂,以及新兴存储领域的创业厂商,杉岩最终凭何赢得G证券认可?

产品及方案完善

杉岩MOS海量对象存储支撑5亿文件毫秒级访问。独有的AI处理引擎,帮助优化质检算法。已接入MOS的业务,无需开发元数据的迁移功能,元数据检索和主数据读取均在MOS内部完成,效率显著提升。

杉岩的三层数据保护方案也让客户感到放心:通过副本和纠删机制,提高数据可靠性;通过内置备份功能,取代外置的备份软硬件;通过跨数据中心容灾,保障业务连续性。

测试结果优异

客户主要关注MOS能否与现有业务顺利对接,以及产品可靠性和稳定性。MOS的S3接口顺利通过接口测试,客户仅用一个小时就完成了单系统对接。近一个月的异常测试,杉岩都顺利通过。

实施服务周到

客户只对原业务进行微小改造,就将原数据无缝迁到MOS。为不影响证券交易,项目实施都在18:00到第二天06:00进行,服务周到。

4、海量、智能、敏捷,杉岩为档案管理提供新选择

先从档案中心宏观架构入手,如图1所示,MOS将源数据区的数据存下来,并与计算层交互。通过部署同城双活,实现RPO分钟级灾备。

在这里插入图片描述

图1.G证券档案中心整体架构

具体到解决方案的实现,如图2所示。

(1)MOS替代NAS,保障毫秒级访问;利用小文件合并提升空间利用率;

(2)基于分布式架构,扩展灵活,容量和性能线性增长;

(3)跨数据中心双活模式,多数据中心可同时读写,保障高连续和高可用;

(4)通过智能QoS合理分配带宽和优先级,避免资源抢占;

(5)营业网点通过HTTPS访问存储,提升文件读取效率;

(6)MOS告警信息通过SNMP对接G证券告警管理平台,实现精细化监管。

在这里插入图片描述

图2. 杉岩解决方案架构

2017年6月,MOS正式上线,部署12台服务器、4台交换机及百余块硬盘,构建1PB存储集群。

业务数据逐步迁移,MOS支撑5亿文件毫秒级访问

经过半年多稳定运行,G证券逐步将一柜通柜台、投研平台等接入MOS。由于数据增长,原有空间不足,客户在2019年进行首次扩容。通过新建EC故障域将空间利用率从50%提升到67%,成本效益显著。

截至2020年3月,存储集群裸容量超过800TB,对象总数超过5.6亿,每天写入文件7万多个,时延低于百毫秒,性能表现让NAS难以企及。

MOS对接日志易系统,以智能存储支撑智能运维

为构建智能运维(AIOps)平台,将日志易系统迁至MOS。基于分布式架构保障高可用,降低硬件变更的影响;利用MOS特性赋能AIOps,如通过智能QoS实现资源优化;借力AI优化运维策略。

MOS集成智能数据处理引擎,充分释放数据价值

MOS独有的智能数据处理引擎,帮助优化质检算法,释放数据价值,实现了数据存储、处理、灾备、价值发现的一站式管理,如图3所示。

在这里插入图片描述

图3. 杉岩解决方案架构

如图4所示,客户借助可视化界面,清晰掌握集群状态,方便又省心。

在这里插入图片描述

图4.MOS图形化管理界面

MOS至今稳定运行2年10个月,未出现任何故障,赢得了客户赞许。

5、档案管理能力显著提升,帮助客户实现更大价值

MOS帮助G证券构建集中式数字化档案管理平台,带来明显改观。客户可在全国任一网点办理业务,所有营业部可共享使用数字化档案,在线查阅和借阅客户资料更方便。档案中心可对双录视频进行内容检查,如人脸是否清晰、有无公司标识,系统审核不通过再人工复审,效率高。

新方案的经济效益也十分明显。MOS每TB的价格相比高端NAS低50%左右,省去文档格式转化集群、水印集群所需的硬件设施,节约成本近10万元。

未来的架构演进方向,一是结合MOS的智能数据处理引擎,释放数据价值。比如:利用AI优化质检算法;通过格式转换工具,精简数据结构,提升数据质量;以AI赋能运维,降本提效。二是拥抱互联网金融,加速容器部署,提升微服务能力。

G证券档案管理平台的成功实践,验证了杉岩产品及方案的高品质,也为今后的行业实践打下坚实的基础。

这篇关于杉岩数据:智能化管理10亿文件,G证券是如何做到的?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/749690

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

关于数据埋点,你需要了解这些基本知识

产品汪每天都在和数据打交道,你知道数据来自哪里吗? 移动app端内的用户行为数据大多来自埋点,了解一些埋点知识,能和数据分析师、技术侃大山,参与到前期的数据采集,更重要是让最终的埋点数据能为我所用,否则可怜巴巴等上几个月是常有的事。   埋点类型 根据埋点方式,可以区分为: 手动埋点半自动埋点全自动埋点 秉承“任何事物都有两面性”的道理:自动程度高的,能解决通用统计,便于统一化管理,但个性化定

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

烟火目标检测数据集 7800张 烟火检测 带标注 voc yolo

一个包含7800张带标注图像的数据集,专门用于烟火目标检测,是一个非常有价值的资源,尤其对于那些致力于公共安全、事件管理和烟花表演监控等领域的人士而言。下面是对此数据集的一个详细介绍: 数据集名称:烟火目标检测数据集 数据集规模: 图片数量:7800张类别:主要包含烟火类目标,可能还包括其他相关类别,如烟火发射装置、背景等。格式:图像文件通常为JPEG或PNG格式;标注文件可能为X