对话交通银行:中国金融业数据仓库有哪些重要趋势?

2023-11-23 11:50

本文主要是介绍对话交通银行:中国金融业数据仓库有哪些重要趋势?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

数字经济时代,什么才是金融机构的核心竞争力?笔者访谈了交通银行软件开发中心总经理刘雷。刘雷指出:“数据和数据能力是金融机构发展的核心竞争力”。

当下,金融机构的数字化转型正迈入纵深阶段,使得两大核心诉求更加清晰:其一、通过数字化转型重塑核心竞争力,让营销、风控、管理等传统业务焕发生机,走向高效化;其二、利用数字化技术拓展新的业务领域,在商业模式上实现创新与突破。

无一例外,这两大核心诉求的基础都是数据。随着各大金融机构数据量持续爆炸性增长,新业务场景的井喷以及数据要素化的提速,也让金融行业数据分析平台核心--数据仓库逐步融入各种核心业务之中,其价值与作用愈发突出。

刘雷提到:“数据作为数字经济时代新的生产要素,要像土地、人力、资本、技术等其他要素那样,不断流动、交换和共享,进而推动经济社会发展。在这个过程中,一方面,要通过数据标准的制定,加强数据治理和数据管理能力,提高数据质量,提升数据生产服务能力;另一方面,利用多方安全计算、人工智能、大数据等技术建立跨平台、跨企业、跨领域的数据仓库体系,按照数据不出域、可触达的要求,实现数据的交换和共享。”

那么,中国金融业的数据仓库应用现状如何?中国金融机构在数据仓库上都遇到哪些新挑战?又会有哪些重要的新趋势?

近日,由金融信息化研究所联合交通银行在内的多家金融机构及华为云正式发布了《金融数据仓库发展报告(白皮书)》(以下简称:白皮书),从政策、全球、技术、历史五个维度综合分析我国金融数据库技术发展现状和问题,并提出了金融数据仓库七大关键技术和十大发展趋势,对于金融机构未来建设、升级优化数据仓库极具参考价值。

数据仓库应用现状如何

在众多行业中,金融行业是最早部署数据仓库的行业之一。

早在信息化时代,数据仓库在各大金融机构的业务中就发挥着关键作用;进入到数字化时代,数据驱动成为金融机构的转型目标,业务运营与创新均与数据息息相关。数据犹如金融机构的血液,流动到每个组织和业务之中,为其带来“养分”,数据仓库承载着数据的存储与分析,自然就成为金融机构数字化转型建设的刚需。

白皮书调研数据验证了这一现状:当前,银行、证券、保险等不同领域的金融机构普遍建设了数据仓库。其中,银行业建设数据仓库占比最高,除了区域性城商行尚有部分机构未建设之外,国有大行、股份制银行等均建设了数据仓库;而证券业和保险业建设数据仓库占比均接近90%。

具体来看,我国数据仓库产品在金融机构的占比正不断提升,尤其是在银行业的占比较高。白皮书的数据显示,国有大行基本都在使用我国数据仓库产品或采取自研数据仓库模式,占比高到83.33%;而股份制银行采用我国数据仓库产品的占比也高达66.67%。

另外一大现象是:金融机构的数据仓库数据规模差异较大。白皮书数据显示,拥有PB级规模数据仓库的金融机构占比达到15.96%,典型像国有大行和股份制银行等,近年来由于业务规模不断扩大,数据仓库的数据规模来也水涨船高;而数据量50TB以下的金融机构占比大约45.75%,像农商行、证券业、保险业等基本处于TB级别。

在投入方面,有86.75%的金融机构的数据仓库投入在所有数据库投入中的占比小于50%。从侧面反应出,很多金融机构的数据仓库建设未来依然有较大提升空间。

白皮书还对不同类型金融机构当前使用数据仓库痛点和使用诉求进行了调研。在痛点方面,国有大行因其海量数据,带来容量瓶颈问题;相对国有大行,其他金融机构数据治理体系还不完善,面临数据质量等系列问题。在使用诉求方面,不同类型金融机构也不尽相同,主要集中在T+0分析、数智融合、湖仓一体、存算分离以及数据共享等方面。

这些关键技术和趋势不容小觑

“未来的金融服务无处不在,就是不在银行网点。”--《Bank 4.0》一书对未来金融做出大胆预测。

真实情况恰如预测那样。如今,移动支付、电子货币、互联网保险、大数据征信、智能投顾、智能客服、云柜台等新金融业务正大量涌现,对于金融机构传统的网点、渠道、产品、流程产生了极大的冲击和改变,并且加速向金融业务中后端和全链条渗透,引发金融行业全业态变革。

交通银行软件开发中心总经理刘雷表示:“数据驱动如今是金融业重点关注方向。对于金融业而言,以数据为核心意味着:一、数据处理要快,实时计算的场景越来越多,大数据要求更高的算力;二、数据处理范围要广,除了金融机构内部结构化数据之外,需要整合更多复杂的数据来源,对于数据仓库等技术能力要求更高;三、数据需要共享,既打破金融机构各部门的数据壁垒,还避免数据重复加工;四、数据需要形成资产体系,让数据产生持续价值。”

新场景、新技术和新需求在驱动金融数据仓库加速变革。传统数据仓库软硬一体的封闭架构、高昂成本、实时处理能力不足等弱点不断凸显,不仅无法实现跨部门、跨系统、跨渠道、跨场景的数据共享与应用整合,让数据无法得到充分的挖掘与分析;更无力帮助金融机构构建起完善的数据资产体系。

“金融业数据仓库在经历了描述型数仓、探索型数仓、运营型数仓三个阶段之后,正在加速向智慧型数仓迈进,从仅支持批量报表服务,到支持数据探索、实时分析、数智融合,支撑业务长期演进和持续创新。”华为云EI服务产品部总经理尤鹏介绍道。

白皮书也指出,当前经过金融业的探索与实践,围绕分布式和云原生的架构主体,来构建数智融合的数据仓库成为大势所趋,具体包括七大关键技术:超大规模并行处理满足海量数据的算力、高可用及容灾技术实现数据永远在线、动态负载管理满足多样化负载统一管理、数据安全技术保障数据合规访问、融合分析技术打通结构化与非结构化数据分析边界、弹性扩展技术满足系统在线按需扩展和管控一体的智能运维释放运维压力。

例如,“人人用数”是当前很多金融行业重点践行的方向。以某大型股份制银行为例,其以“零售之王”著称于业内,超过2W名员工属于重度数据消费者,从全渠道获取、精准营销到客户精细化运营、风险控制,日常业务中时时刻刻都需要用到数据做决策。“人人用数”带来了各种海量并行操作,对于数据仓库的超大规模并行处理能力、弹性扩展能力和运维能力挑战极大。

事实上,白皮书还对全国百余家金融机构进行了充分调研,提出了金融行业数据仓库十大发展趋势,主要包括“融合”和“普惠”。“融合”主要有T+0分析、湖仓一体、数智融合、存算分离、高维分析、HTAP等;“普惠”则包括数据共享、数据网格(Data Mesh)、数据编织(Data Fabric)、现代数据栈(Modern Data Stack)等。

当前,金融机构数据量、数据类型和数据来源都远胜以往,并且数据分布在数据仓库或者数据湖之中,从而造成数据重复存储、数据管理与分析挑战巨大。因此,金融数据仓库很重要的一大趋势就是走向湖仓一体,湖仓之间互相配合、取长补短,帮助企业构建起统一元数据、数据管理和访问入口的数据平台,从而满足各种业务的用数需求。

“湖仓一体等技术目的是让数据和数据模型自由流转,真正让数据供给侧和使用侧的对接变得更加容易。”刘雷表示道。

又如,很多金融机构在智慧营销、智能风控、智能投研、OCR等业务场景中开始加大AI技术的应用,数据平台与AI平台的融合正在开启,形成能力互补。

刘雷认为,“数据仓库数据管理能力与AI平台流程会形成生命周期管理的结合。数据仓库将关系型的数据开放给AI,并作为AI流程中数据准备、特征工程等强数据处理负载的分析引擎;非结构化数据(如图像、视频、语音、文字)处理和模型训练由AI平台承载,训练生成的模型可直接部署在数据仓库中,由数据仓库来实现推理,并可以直接与数仓中关系型数据关联分析。”

再如,数据仓库也在加速走向“普惠”。“普惠”意味着使用门槛降低和广泛的使用人群,自然会带来灵活性与统一的难题。随着接入数据源越来越多和数据量越来越大,数据仓库等数据平台需要在统一元数据的基础上,采取更加灵活和敏捷的数据治理,推动了数据仓库向数据网格(Data Mesh)、数据编织(Data Fabric)等方向发展。

“金融行业业务场景本身也在走向普惠化、实时化和智慧化,数据规模每年保持了30%以上的增长的速度。因此,基于开放平台和云原生分布式架构的数据仓库,将是各大金融机构数据仓库演进的方向”尤鹏总结道。

白皮书对于金融数字化转型意义几何

《金融科技发展规划(2022—2025年)》明确提出要“激活金融数据要素潜能”、“加强数据能力建设”等内容。面向未来,构建强大的数据能力是所有中国金融机构一门必修课。

一直以来,中国金融机构在业务发展和科技能力上深受IBM、Oracle、Teradata为代表的国际顶级厂商所影响。近年来,在新场景、新需求和新技术等多重因素的交织下,产业变革加剧,很多中国金融机构热切期盼了解数据仓库未来建设方向、技术趋势以及产业现状。

众所周知,当前数据仓库的建设正在成为金融机构数字化转型的刚需,而与数据仓库相关的技术又处于爆发期,从数据治理、数据处理到数据分析、数据智能等技术纷繁众多,国内众多金融机构普遍存在一定程度的迷茫,对于产业现状和技术趋势了解不够,导致了产品选型时普遍遇到困难。

为此,白皮书从技术、历史等多个维度综合分析我国金融数据库技术发展,真正为国内金融机构结合自身情况构建面向未来的数据仓库提供了真知灼见。

其次,中国金融机构地域分布广泛、类型多样,导致不同金融机构在数据仓库、数据平台等方面建设情况千差万别,严重缺乏行业参考。例如,国有大行和股份制银行已经进行了多年的数据仓库建设,现在正加速向数智融合的智慧型数据仓库迈进,其很多实践经验和方法值得省联社、城商行了解与学习。

白皮书则通过国内上百家全行业金融机构的调研,提取了多家同业伙伴数据仓库建设情况和宝贵意见,通过典型案例形成行业参考,为不同类型的金融机构提供极具价值的参考。

第三,白皮书揭示了中国数据仓库产品的崛起,像华为云等公司的数据仓库产品在国有大行最为复杂、苛刻的场景中得到充分验证和考验,其实时分析、逻辑数仓、HTAP、湖仓一体和数智融合等一系列企业级关键特性也能够满足复杂金融场景的演进需求,为中国金融业的数据仓库建设和数字化转型带来了全新视角和思路。

总体来看,在新场景和新技术的双轮驱动下,数据仓库在金融业的应用正处于一个变革期。《金融数据仓库发展报告(白皮书)》很好地剖析了当前数据仓库在中国金融业的建设情况和未来发展趋势,对于中国金融业数字化转型大有裨益。面向未来,随着中国数字经济持续发展,中国金融业的数字化转型对于支持经济长远发展至关重要,数据仓库也必然会发挥更大的价值与作用。

这篇关于对话交通银行:中国金融业数据仓库有哪些重要趋势?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/417757

相关文章

跨国公司撤出在华研发中心的启示:中国IT产业的挑战与机遇

近日,IBM中国宣布撤出在华的两大研发中心,这一决定在IT行业引发了广泛的讨论和关注。跨国公司在华研发中心的撤出,不仅对众多IT从业者的职业发展带来了直接的冲击,也引发了人们对全球化背景下中国IT产业竞争力和未来发展方向的深思。面对这一突如其来的变化,我们应如何看待跨国公司的决策?中国IT人才又该如何应对?中国IT产业将何去何从?本文将围绕这些问题展开探讨。 跨国公司撤出的背景与

金融业开源技术 术语

金融业开源技术  术语 1  范围 本文件界定了金融业开源技术的常用术语。 本文件适用于金融业中涉及开源技术的相关标准及规范性文件制定和信息沟通等活动。

从戴尔公司中国大饭店DTF大会,看科技外企如何在中国市场发展

【科技明说 | 科技热点关注】 2024戴尔科技峰会在8月如期举行,虽然因事未能抵达现场参加,我只是观看了网上在线直播,也未能采访到DTF现场重要与会者,但是通过数十年对戴尔的跟踪与观察,我觉得2024戴尔科技峰会给业界传递了6大重要信号。不妨简单聊聊:从戴尔公司中国大饭店DTF大会,看科技外企如何在中国市场发展? 1)退出中国的谣言不攻自破。 之前有不良媒体宣扬戴尔将退出中国的谣言,随着2

未来工作趋势:零工小程序在共享经济中的作用

经济在不断发展的同时,科技也在飞速发展。零工经济作为一种新兴的工作模式,正在全球范围内迅速崛起。特别是在中国,随着数字经济的蓬勃发展和共享经济模式的深入推广,零工小程序在促进就业、提升资源利用效率方面显示出了巨大的潜力和价值。 一、零工经济的定义及现状 零工经济是指通过临时性、自由职业或项目制的工作形式,利用互联网平台快速匹配供需双方的新型经济模式。这种模式打破了传统全职工作的界限,为劳动

Cmake之3.0版本重要特性及用法实例(十三)

简介: CSDN博客专家、《Android系统多媒体进阶实战》一书作者 新书发布:《Android系统多媒体进阶实战》🚀 优质专栏: Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏: 多媒体系统工程师系列【原创干货持续更新中……】🚀 优质视频课程:AAOS车载系统+AOSP14系统攻城狮入门视频实战课 🚀 人生格言: 人生从来没有捷径,只有行动才是治疗恐惧

研究生生涯中一些比较重要的网址

Mali GPU相关: 1.http://malideveloper.arm.com/resources/sdks/opengl-es-sdk-for-linux/ 2.http://malideveloper.arm.com/resources/tools/arm-development-studio-5/ 3.https://www.khronos.org/opengles/sdk/do

平时工作学习重要注意的问题

总体原则:抓住重点,条理清晰,可回溯,过程都清楚。 1 要有问题跟踪表,有什么问题,怎么解决的,解决方案。 2 要有常用操作的手册,比如怎么连sqlplus,一些常用的信息,保存好,备查。

matlab一些基本重要的指令

重点内容 运行MATLAB的帮助demo,在Command Window 输入 “demo”,或在Launch Pad 选项卡“demos” 任何时候都可以: 清除Command Window内容:clc 清除Figure Window(图形窗口) clf 清除workspace 变量内容: clear 注意:M脚本文件和输入指令中的变量都在workspace中,为避免变量冲突,一般在

Post-Training有多重要?一文带你了解全部细节

1. 简介 随着LLM学界和工业界日新月异的发展,不仅预训练所用的算力和数据正在疯狂内卷,后训练(post-training)的对齐和微调方法也在不断更新。InstructGPT、WebGPT等较早发布的模型使用标准RLHF方法,其中的数据管理风格和规模似乎已经过时。近来,Meta、谷歌和英伟达等AI巨头纷纷发布开源模型,附带发布详尽的论文或报告,包括Llama 3.1、Nemotron 340

【中国国际航空-注册/登录安全分析报告】

前言 由于网站注册入口容易被黑客攻击,存在如下安全问题: 1. 暴力破解密码,造成用户信息泄露 2. 短信盗刷的安全问题,影响业务及导致用户投诉 3. 带来经济损失,尤其是后付费客户,风险巨大,造成亏损无底洞 所以大部分网站及App 都采取图形验证码或滑动验证码等交互解决方案, 但在机器学习能力提高的当下,连百度这样的大厂都遭受攻击导致点名批评, 图形验证及交互验证方式的安全性到底如