当前,商业银行发展的内外部环境发生了剧烈的变化,面临多重挑战。一方面,金融脱媒和利率市场化已是大势所趋,外部宏观环境的变化使得银行的业务发展愈加艰难;另一方面,以电子商务为代表的互联网企业已突破了支付领域,开始全面拓土至传统银行业务领域。在这种背景下,通过大数据的应用,准确定位市场机会和挖掘新的业务增长点,成为银行实现战略转型的有效途径。
商业银行大数据战略背景
银行业务领域和盈利空间不断受到挤压。随着资本市场不断完善和金融创新不断发展,国内银行收入来源以利息为主、利润增长依赖信贷扩张的传统发展模式正在面临严峻挑战,银行需要尽快进行经营模式转型,寻找市场机会和新的业务增长点。大数据的应用可以帮助银行更好实现业务扩展的准确定位,通过对客户结构化和非结构化数据的分析应用,准确预判业务的潜在需求人群,并根据不同客户群的特征制定差异化的业务拓展策略,从而提高客户粘合度和运营效率,为银行的经营转型提供有力支持。
电子商务企业的蓬勃发展改变了企业和个人的金融行为和习惯。电子商务企业的核心竞争优势是掌握了用户的核心信息资源,其金融服务建立在用户经营或消费等核心信息基础之上,因此具有渠道优势和较快的推广速度。一方面,电子商务企业通过对客户信息的分析开发专属产品,实现客户的精准化营销和差异化服务,建立与客户更紧密的粘性;在此基础上,电子商务已从单纯的支付中介逐步扩展交易撮合、支付代理、融资、保险等一系列金融中介服务,开始蚕食银行的经营优势。因此,银行也必须充分利用自己掌握的客户信息和数据资源,利用大数据技术加强在客户营销和市场拓展方面的竞争力。另一方面,随着电子商务的兴起,客户在电子商务平台上进行的经营和交易信息与银行割裂,加剧了银行信息不对称问题,客户信用风险表现形式更加多元化,信用风险管理难度加大,在这种情况下,银行需要推进大数据技术的应用,构建更加丰富的客户信息平台,关注客户各类信息之间的关联性,从而发现潜在的风险因素并预判风险变化趋势。
商业银行具备开展大数据研究与应用的先天条件。银行拥有广阔的大数据资源,亿级客户每日交易往来的数据积累形成了庞大的结构化数据资源,但现有技术手段和工具对这些数据的利用仍然有限。企业自身信息系统中产生的运营数据大都是标准化、结构化的,这些数据只占到了企业所能获取的数据中的15%。对于企业而言,85%的数据是广泛存在于外部系统、物联网、电子商务等媒介的结构和非结构化数据。这些数据的产生往往伴随着社交网络、移动计算、传感器等新兴渠道和技术的涌现和应用。现阶段,银行业务的载体与社交媒体、电子商务的融合越来越紧密,仅对原有15%的结构化数据进行分析已经不能满足发展的需求。因此,银行需要借助由大数据构建的企业经营全景视图来进行风险管理、产品营销、业务创新等活动,进而寻找最优的模式支持商业决策。
信用风险管理创新的必要性
随着国内经济向“新常态”的逐步转型、金融市场改革的持续深化、以及现代化信息技术的快速渗透,银行传统的信贷风险管控体系面临严峻挑战。一是经济增长换档回落以及经济结构深入调整带来资产质量下行压力;二是企业跨地域、集团化经营业态的发展,风险传导机制复杂,增加风险管理难度;三是银行信贷规模增长以及客户结构深刻变化,传统信贷业务模式下的信贷风险控制方法存在较高的优化需求,基于大数据新型信息化风险监控模式成为大势所趋。因此通过大数据技术实现跨平台、跨业务条线、跨区域的数据整合和风险信息挖掘,建立新型风险监控体系具有重要的战略意义。
经济处于下行周期,信贷风险管理难度增大。商业银行资产质量有周期波动的特点,并且与宏观经济周期具有较强正相关性。经济上行周期,信贷规模顺周期扩张形成“涨潮效应”,一旦经济进入下行周期,“落潮效应”显现,资产价格回落导致贷款质量恶化。目前,我国经济处于经济减速的下行周期,行业产能过剩现象凸显,小企业经营风险较高,银行风险管理难度较大。因此深化和完善风险监控体系,建立事前预警、事中控制、事后监督的监控流程是应对系统性风险的必要举措。
交叉风险日益加剧,需要建设信息共享平台实现风险联动控制。金融全球化不断推进的背景下,从行业来看,通过供应链关系,上下游行业之间风险传导的可能性加大。从公司来看,经营多元化、区域分散化趋势明显,风险关联关系复杂,风险联动控制困难。因此整合日益互联互通的数据平台,基于广泛的数据获取方式,完善大容量、多类型的数据存取功能,实现及时在银行间系统共享数据是新形势下风险管理的必要路径。
大数据技术的发展将改变银行信息获取、分析和运用的渠道和机制,为信息化风险监控创造技术条件。一方面,随着客户交易行为的积累,运营过程产生了海量数据,有效的数据清洗和数据挖掘技术的应用可从海量数据中识别信用风险管理过程中的关键信息,从而提高银行数据的利用效率。另一方面,银行业务的载体与社交媒体、电子商务的融合越来越紧密,大量的非结构化数据信息广泛存在于物联网、电子商务等媒介,整合客户线上线下行为产生的结构化和非结构化信息,打破数据边界,从而降低信息不对称风险,使银行形成对客户行为立体化的跟踪评估,以期构建更为深化的信用风险管理全景视图。
信用风险管理创新的技术方法
基于大数据和数据挖掘技术实现信用风险预警监测的技术手段主要分为描述和预测两类。具体包含五个方面,第一,概念描述,数据库中存放大量的细节数据,通过简单统计量描述,可以分析这类数据的特征、分布以及与对比数据列的区别,可实现与风险相关的指标的特征分析。第二,关联分析,用于发现大量数据之间的关联规则,在信用风险分析中,关联分析可用来挖掘客户行为与客户风险表现之间的关联规则。第三,分类和预测,根据历史数据建立分类或预测规则,将规则应用于对未来的预测中,常用模型为逻辑回归、决策树、神经网络、支持向量机等。第四,聚类分析,将数据对象分为相似组群的过程。在信用风险分析中可用于将特征相似的客户划分在一起,发现数据中潜在的类别特征。第五,孤立点分析,找出数据仓库中行为奇异的点,这类方法常用于欺诈行为的预测。
信用风险预警模型研发的路径可以概括为“建模目标确定——风险因子归纳——数据准备——模型构建——模型评价——模型应用——模型维护”,即确定预警目标及建模样本选择范围;归纳风险演变路径,总结风险特征;收集整合相关数据信息,进行数据清洗和变换;筛选具有明显风险特征的因子进入模型,进行模型估计和校验。基于上述过程构建相应风险预警模型,从而实现对贷款发生风险的可能性提前做出评估,实现对风险事前预警的风险监控。
信用风险管理创新的应用
个人消费贷款信用风险预警
为了对个人消费贷款未来可能出现的不良风险进行预警,可以基于决策树方法建立多因子数据挖掘模型,通过深入分析影响个人消费贷款的风险因素,预测和定位个人消费贷款的高风险客户群,并根据预警结果建立有针对性的、分层次的信用风险防控措施。
决策树学习是一种逼近离散值目标函数的方法,在这种方法中学习到的函数被表示为一棵决策树。这种学习算法是最流行的归纳推理算法之一,被成功地应用到信用风险预测等广阔领域。从几何意义上直观理解决策树的含义,可以将每个贷款样本看做是n维空间中的点,决策树模型的建立过程是决策树各个分支形成的过程,每个分支在一定规则下完成对n维空间的区域划分,决策树建立过程将n维空间划分成了若干小区域,不同的区域即是最终的划分结果,决策树将此划分采用树型结构图的形式展现出来,划分结果代表风险特征接近的一类客户群。决策树通常有两大类型,分别为分类决策树和回归决策树,分类决策树实现对目标变量的分类,回归决策树完成对目标变量取值的预测。利用决策树对数据建模之前,首先需要指定目标变量,在风险预警中,目标变量通常是客户是否发生不良违约事件。输入变量可以是连续型或字符型,描述贷款者的个人属性、贷款特征等多方面信息。
运用决策树对个人消费贷款实施信用风险预警建模,首先需要根据业务意义选取一系列指标作为建模因子选择范围,结合模型筛选,最终得到对客户未来不良具有预测能力的若干因子。通过随机抽样将样本数据以一定的比例分配给训练集和验证集,利用SAS软件实现模型估计。决策树根据筛选出的预测因子细分出叶结点,再根据到达这些结点的分割方式得到定位不同客户群的规则。模型结果显示风险客户较为集中的聚集在部分叶结点,其后通过对预警模型效果滚动验证并不断优化,待模型稳定后即可根据预测结果进行事前风险控制。
决策树建模结果显示,决策树根据个人属性、贷款特征等方面的因子细分出10类客户群,其中8类客户群风险较为集中。可以通过到达这8类客户群的因子分割方式得到定位风险客户群的规则。具体来看,其中风险客户集中度最高的前4类客户群中,不良贷款率明显高于全量客户均值,将这4类客户纳入高风险贷款的预警范围。之后,将满足样本条件的个人消费贷款作为预警目标,根据决策树建模结果,定期筛选出高风险的客户群,对预警模型效果滚动验证并不断优化,待模型稳定后得到风险贷款预警名单,即可根据预警名单进行事前风险控制。