陈磊-大数据风控:拍拍信的AI视角

2024-01-27 06:10

本文主要是介绍陈磊-大数据风控:拍拍信的AI视角,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 普惠金融的发展遇到移动化的浪潮,使得消费信贷迎来了高速攀升期,同时也给风控带来了巨大的挑战,即在额度区间广、借贷频次高、客群下沉情况下,如    何实现风险可控、差异化定价、快速审批。幸而大数据和AI技术使得这一切变为可能,拍拍信一直在做这方面的探索,旨在整合数据资源、充分发掘数据潜在  价值,帮助金融机构伙伴搭建和优化风控系统,本次陈磊将分享相关的实践经验和落地案例。

当前消费金融规模持续增长,风险控制的挑战也与日俱增。

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

陈磊老师现场分享

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

请参见一个风控系统的雏形框架,涵盖了用户贷前和贷后的流程。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

信息是为决策提供主要支撑。在信贷业务中,信息四要素是姓名、身份证、手机号、银行卡号。

比如在信息采集上,我们会用AI的技术来提取相关信息,比如OCR,用拍照的方式来提供身份证、银行卡号的信息。这样做的优点显而易见——提高用户体验,效率快,避免伪造的情况。

整个闭环模式中,我们会根据不同的客户发起不同的策略,对于优质客户会提高额度,同时我们也会避免不良资产导致坏账而采取措施。

风险流程就是一个数据的流程,包含数据的采集,消化、回收、落地。

离开数据,风控就是无水之源。

传统的风控数据就是征信类的数据,很显然,这是远远不够的。那么新型时代的发展也让我们有新的思考,有哪些数据可以为我们的风控作补充。

理想化的数据就是覆盖率高,又和风险高度相关的。

这里我们借用金字塔模式来介绍的可用数据:


640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

我们在数据大爆炸的年代,什么样的数据都可以使用。

但是怎么使用,确实一个挑战。

这些挑战来源于以下几个维度:

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

在传统银行的风控体系中,无论是采用机器学习,还是人工标记,都需要专家来看怎么去做,如何做才能发挥作用。

鉴于特征提取都是以人为主,这就难免会有局限性,很多高维度、宽广度的数据衍生出来新的特征就很难用经验进行捕捉。 

下图是google在使用的一个专家+机器的特征工程模型框架:

  • 左边是比较明显的广度特征,专家可以凭经验直接提取

  • 中间广度加深度模型,一些不易解读的数据需要加工重构才能得以解读

  • 右面是需要深层挖掘、层层解析后才会出来的特征

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

下面是一份团案信息图谱的案例:

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy

信息图谱在业务上的所反映的问题,在于最原始的出发点是什么, 什么形式关联,在关联上有什么途径。一层关联比较简单,怎样能够发现多层关联才更为关键。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

从聚合数据的输出与查询,可以看出一步关联与二次关联的数据联系。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

而更深层次的特征查询,能对关系网络形态位置,把非结构化的关系网络转化为一般模型可以能吸收并消化的特征向量,从而检测到异常客户。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

以上讲了很多特征提取。下面是阐述如何落地,从图中模型可以看出,主要流程是对不同的数据源做不同的数据提取,抽象到几个风险因子,进而提炼出综合风险指数,化繁为简。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

在风控体系中,我们追求准确性,同时也强调健壮性。

准确性是指特征的抽象与提取,那么健壮性就是指时间维度上的有效性、场景迁移的可扩展性。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

原文发布时间为:2017-10-24

本文作者:陈磊

本文来自云栖社区合作伙伴“中生代技术”,了解相关信息可以关注“中生代技术”微信公众号

这篇关于陈磊-大数据风控:拍拍信的AI视角的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/649285

相关文章

javaScript在表单提交时获取表单数据的示例代码

《javaScript在表单提交时获取表单数据的示例代码》本文介绍了五种在JavaScript中获取表单数据的方法:使用FormData对象、手动提取表单数据、使用querySelector获取单个字... 方法 1:使用 FormData 对象FormData 是一个方便的内置对象,用于获取表单中的键值

Rust中的BoxT之堆上的数据与递归类型详解

《Rust中的BoxT之堆上的数据与递归类型详解》本文介绍了Rust中的BoxT类型,包括其在堆与栈之间的内存分配,性能优势,以及如何利用BoxT来实现递归类型和处理大小未知类型,通过BoxT,Rus... 目录1. Box<T> 的基础知识1.1 堆与栈的分工1.2 性能优势2.1 递归类型的问题2.2

Python使用Pandas对比两列数据取最大值的五种方法

《Python使用Pandas对比两列数据取最大值的五种方法》本文主要介绍使用Pandas对比两列数据取最大值的五种方法,包括使用max方法、apply方法结合lambda函数、函数、clip方法、w... 目录引言一、使用max方法二、使用apply方法结合lambda函数三、使用np.maximum函数

Spring AI集成DeepSeek的详细步骤

《SpringAI集成DeepSeek的详细步骤》DeepSeek作为一款卓越的国产AI模型,越来越多的公司考虑在自己的应用中集成,对于Java应用来说,我们可以借助SpringAI集成DeepSe... 目录DeepSeek 介绍Spring AI 是什么?1、环境准备2、构建项目2.1、pom依赖2.2

Deepseek R1模型本地化部署+API接口调用详细教程(释放AI生产力)

《DeepseekR1模型本地化部署+API接口调用详细教程(释放AI生产力)》本文介绍了本地部署DeepSeekR1模型和通过API调用将其集成到VSCode中的过程,作者详细步骤展示了如何下载和... 目录前言一、deepseek R1模型与chatGPT o1系列模型对比二、本地部署步骤1.安装oll

Spring AI Alibaba接入大模型时的依赖问题小结

《SpringAIAlibaba接入大模型时的依赖问题小结》文章介绍了如何在pom.xml文件中配置SpringAIAlibaba依赖,并提供了一个示例pom.xml文件,同时,建议将Maven仓... 目录(一)pom.XML文件:(二)application.yml配置文件(一)pom.xml文件:首

Redis的数据过期策略和数据淘汰策略

《Redis的数据过期策略和数据淘汰策略》本文主要介绍了Redis的数据过期策略和数据淘汰策略,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 目录一、数据过期策略1、惰性删除2、定期删除二、数据淘汰策略1、数据淘汰策略概念2、8种数据淘汰策略

轻松上手MYSQL之JSON函数实现高效数据查询与操作

《轻松上手MYSQL之JSON函数实现高效数据查询与操作》:本文主要介绍轻松上手MYSQL之JSON函数实现高效数据查询与操作的相关资料,MySQL提供了多个JSON函数,用于处理和查询JSON数... 目录一、jsON_EXTRACT 提取指定数据二、JSON_UNQUOTE 取消双引号三、JSON_KE

Python给Excel写入数据的四种方法小结

《Python给Excel写入数据的四种方法小结》本文主要介绍了Python给Excel写入数据的四种方法小结,包含openpyxl库、xlsxwriter库、pandas库和win32com库,具有... 目录1. 使用 openpyxl 库2. 使用 xlsxwriter 库3. 使用 pandas 库

SpringBoot定制JSON响应数据的实现

《SpringBoot定制JSON响应数据的实现》本文主要介绍了SpringBoot定制JSON响应数据的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们... 目录前言一、如何使用@jsonView这个注解?二、应用场景三、实战案例注解方式编程方式总结 前言