41万亿元规模的消金行业,重构势在必行,AI算法会是突破口?

本文主要是介绍41万亿元规模的消金行业,重构势在必行,AI算法会是突破口?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

( 本文由 CreditX氪信 授权 虎嗅网 发表,作者 唐正阳。)

据BCG公布的数据显示,目前有1000多家金融科技创新企业获得超100亿美金的风投资金。与此同时,普惠金融持续爆发式增长,2015年中国消费信贷规模达到19万亿元,同比增长23.3%,预计2019年将达到41.1万亿元。

面对如此巨大的风口,整个消费金融业态正在技术、资本和市场的共同作用下发生数字化重构,不论是生活中我们每个人触手可及的借贷、支付、理财等金融服务,还是行业内BAT等互联网巨头布局金融的积极行动,都在昭示:我们正在迎来金融3.0时代,金融业务的变革势在必行。

金融3.0时代

颠覆背后,对比互联网金融与传统金融的差异,我们逐渐从以往依赖人工放贷或发信用卡等到现在实时的金融服务,不难发现本质是从人工数据收集处理方式到整个数据能力自动化的转变。这种转变不同于人工1.0时代到线上2.0时代的简单切换,偏向于在大数据上用规则或评分卡体系简单刻画数据与业务目标关系这样一种线上化的过程。

我们讲数据能力,核心在于将金融专家的深厚经验赋能机器,真正地让机器刻画纷繁数据与目标的复杂关系实现全自动化3.0时代,这对人工智能产生了真正的巨大需求。因此,如何搭建一整套从数据到人工智能算法到平台的数据架构体系,将直接决定未来商业竞争制高点,这也是所有金融业务变革的基础。

说易行难,现下关于神化或忧虑人工智能的观点都比较多,我们讲技术创新怎么才能定义为成功?一定是结合业务能产生核心价值的。过去谷歌、微软、亚马逊等巨头将人工智能用在搜索、推荐、广告上做了十几年的结合终获得巨大提升。

在金融场景上,人工智能真正能在业务上产生核心价值也必然面临一系列磨合的问题,把金融体系的深厚经验与机器刻画复杂数据关系的能力结合,实现金融业务的价值最大化,需要大量艰难的尝试。下面从工业实践的角度,简要分析当下人工智能重构金融数据架构体系的3个方面,以及为什么必须要用这些人工智能技术?

为什么必须要用全域知识图谱

首先谈底层数据架构体系的知识图谱,其本质是语义网络,一种基于图的数据结构,由节点(point)和边(edge)组成。 在金融知识图谱里,其实我们每一个申请人、手机号、设备、地址、IP等都是节点,而诸如申请人拥有设备、手机号呼叫手机号等有向联系就是图中的边,边的权重为关联的紧密程度。

通俗地讲,全域金融知识图谱就是把所有不同种类的信息连接在一起而得到的关系网络,为金融机构提供了从“关系”的角度去分析问题的能力。

可为什么说我们需要知识图谱?金融的核心在于风险,而风险控制的关键就是基于纷繁复杂的各种数据,通过数据金融化和数据价值挖掘,合理建模从而进行风险程度评估。这涉及几个点:

一是数据的表现能力,以往我们只能局限于一度关系分析,而图谱对实体间关系的强扩展能力可有效帮助我们处理局部或全网数据间的关系;

二是数据的管理能力,随着金融机构不同渠道和系统数据越来越多,整个底层数据体系的管理将愈发复杂,通过定义主流的业界规范来对数据进行转换和清洗,可将异质异构的数据统一管理;

三是扩展能力,我们知道大机构接入的数据越来越多,与以往大量数据表间的合并不同,知识图谱可按之前所述对新数据转换从而无限扩展整合。

有了知识图谱,事实上就可以实现针对金融风险的精准用户画像构建,我们既可以抽取丰富的局部关系特征和网络全局特征,同时也可以运用先进的无监督聚类算法辟如社区挖掘来识别风险团体,在此之上运用有监督算法的集成机器学习模型,相对传统规则模型,金融机构自身的群体反欺诈能力往往会有一个巨大的提升。如下图,从解决当下互金曝光较多的黑产、团贷等问题角度看,也是必须用知识图谱的一个理由。

为什么必须要用深度学习

目前深度学习的应用异常火热,尤其在图像识别领域,微软等巨头的机器错误率已低于人类,深度学习在模型层面和特征层面都有应用。但为什么说金融场景必须要用深度学习?

从整个金融底层数据结构来看,主要是结构化和非结构化两类。尤其是后者,据IDC的数据显示,未来金融行业的非结构化数据占比将达到80%。讲到底,谁能把非结构化数据用起来,谁就能跑赢数据能力竞争的关键一段。

传统的数据分析方式辟如在文本上,金融专家们可根据丰富的经验,计算相应的统计指标、或者写正则表达式等人工方式提取特征。但不可置否的是,随着线上风险的迅速演化,在非结构化数据上人工定义天生难以穷尽风险,比如无法捕捉新的黑产术语。

而深度学习是最适合处理图像、文本、时序等非结构化数据的手段,尤其在特征加工方面,如下图,通过将诸如文本、时序等数据转化为向量,用深度学习提取向量空间中的关系可自动生成抽象的特征表征,进一步我们就能计算语义相似性,并运用分类器网络实现非结构化数据与金融风险的深度挂钩。

当然,“深度学习”价值还是在于对金融专家经验体系的补充,在处理人工难以固化为特定风险知识或规则的基础上予以最大弥补,这不意味深度学习可以替代金融专家,长远来看,现在不能,以后也不能。

为什么必须要用复杂集成模型

谈到现在,金融场景可用的数据其实远远比我们传统认为的强征信数据要丰富的多,既有非结构化的文本、时序等特征,也有基于知识图谱的网络风险特征,此外在大型场景中的实践我们也都认识到移动互联网行为、社交、地理位置等几乎所有数据其实都可以是风险数据,且价值超出想象。

这带来一个问题,就是变量维度非常多,少则几千,多则上万,且非常稀疏、低饱和。怎么用好这些真正的大数据?已经远远超出了过去评分卡体系的能力范围。

这也是为什么必须要用复杂集成模型的初衷,集成模型从“voting”的思想去简单理解,就是针对不同类型的数据我们选用最合适的子模型来处理,然后每个子模型投票做出决策。相对单一模型有限的预测能力,“好而不同”的模型集成效果明显会卓越很多,此外无论从稳定度、容错、还是抗扰动能力来讲,集成模型也都在效果和稳定之间取得了极好的平衡。

这里简单提及一下模型框架体系,我们知道消费金融有现金贷、消费分期等诸多场景,集成模型这套框架体系的每一个单独领域子模型都可以快速迁移应用到新业务领域上,对机构在战略层面实现场景间的切换和业务冷启动阶段都可以发挥极其重要的作用。

金融数据架构体系的未来

当下,“数字驱动业务”已深入人心,整个金融业态的重构也是摆在金融机构和科技公司面前的机遇和挑战。可以说,现在的确到了必须依靠机器来解决业务问题的阶段。金融的人工智能并不万能,但在国人绝大多数无法得到合理金融服务的环境和需求下,确实能够引领普惠金融发展,产生巨大的核心价值。

毫无疑问,基于人工智能的金融数据架构平台正在重新定义业务形态和与客户交互的方式。未来,我们的金融生活终究会变成怎样?我们拭目以待。

这篇关于41万亿元规模的消金行业,重构势在必行,AI算法会是突破口?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/276894

相关文章

Ubuntu系统怎么安装Warp? 新一代AI 终端神器安装使用方法

《Ubuntu系统怎么安装Warp?新一代AI终端神器安装使用方法》Warp是一款使用Rust开发的现代化AI终端工具,该怎么再Ubuntu系统中安装使用呢?下面我们就来看看详细教程... Warp Terminal 是一款使用 Rust 开发的现代化「AI 终端」工具。最初它只支持 MACOS,但在 20

Python中的随机森林算法与实战

《Python中的随机森林算法与实战》本文详细介绍了随机森林算法,包括其原理、实现步骤、分类和回归案例,并讨论了其优点和缺点,通过面向对象编程实现了一个简单的随机森林模型,并应用于鸢尾花分类和波士顿房... 目录1、随机森林算法概述2、随机森林的原理3、实现步骤4、分类案例:使用随机森林预测鸢尾花品种4.1

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

康拓展开(hash算法中会用到)

康拓展开是一个全排列到一个自然数的双射(也就是某个全排列与某个自然数一一对应) 公式: X=a[n]*(n-1)!+a[n-1]*(n-2)!+...+a[i]*(i-1)!+...+a[1]*0! 其中,a[i]为整数,并且0<=a[i]<i,1<=i<=n。(a[i]在不同应用中的含义不同); 典型应用: 计算当前排列在所有由小到大全排列中的顺序,也就是说求当前排列是第

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G