【MLOps】第 9 章 : MLOps 实践:消费者信用风险管理

2023-10-21 18:40

本文主要是介绍【MLOps】第 9 章 : MLOps 实践:消费者信用风险管理,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  🔎大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流🔎

📝个人主页-Sonhhxg_柒的博客_CSDN博客 📃

🎁欢迎各位→点赞👍 + 收藏⭐️ + 留言📝​

📣系列专栏 - 机器学习【ML】 自然语言处理【NLP】  深度学习【DL】

​​

 🖍foreword

✔说明⇢本人讲解主要包括Python、机器学习(ML)、深度学习(DL)、自然语言处理(NLP)等内容。

如果你对这个系列感兴趣的话,可以关注订阅哟👋

文章目录

背景:业务用例

模型开发

模型偏差注意事项

准备生产

部署到生产

总结


在本文的最后几章中,我们探讨了 MLOps 在实践中可能是什么样子的三个例子。我们明确选择这三个示例,因为它们代表了根本不同的机器学习用例,并说明了 MLOps 方法可能如何不同以适应业务及其 ML 模型生命周期实践的需求。

背景:业务用例

当消费者要求贷款时,信贷机构必须决定是否给予贷款。根据具体情况,流程中的自动化程度可能会有所不同。然而,决策很可能是根据评估贷款按预期偿还或不偿还的概率的分数来决定的。

分数通常用于该过程的不同阶段:

  • 在预筛选阶段,通过少量特征计算出的分数可以让机构快速放弃一些申请。

  • 在承保阶段,根据所有所需信息计算出的分数为决策提供了更精确的基础。

  • 承保阶段之后,分数可用于评估与投资组合中的贷款相关的风险。

数十年来一直使用分析方法来计算这些概率。例如,美国从 1995 年开始使用 FICO 评分。鉴于它们对机构收入和客户生活的直接影响,这些预测模型一直受到严格审查。因此,流程、方法和技能已经正式化为高度规范的环境,以确保模型的可持续性能。

无论模型是基于专家制定的规则、经典统计模型还是最新的机器学习算法,它们都必须遵守类似的规定。因此,消费者信用风险管理可以被视为 MLOps 的先驱:与其他用例的平行以及最佳实践可以基于此用例进行分析。

在做出信贷决策时,通常可以获得有关客户的历史和当前情况的信息。客户持有多少信用?客户是否曾经未偿还过贷款(用信贷术语来说,客户是否属于拖欠贷款)?在某些国家/地区,称为信用局的组织会收集此信息,并直接或通过分数(如上述 FICO 分数)的形式将其提供给债权人。

待预测目标的定义更为复杂。客户未按预期还款是信用风险模型中的“坏”结果。理论上,应该等待完全还款来确定“好”结果,并等待损失冲销来确定“坏”结果。然而,获得这些最终数据可能需要很长时间,而等待它们会阻碍人们对不断变化的情况做出反应。因此,通常会根据各种指标进行权衡,在损失确定之前宣布“坏”结果。

模型开发

从历史上看,信用风险建模基于基于规则的混合(现代 ML 术语中的“手动特征工程”)和逻辑回归。专业知识对于创建良好的模型至关重要。建立适应性的客户细分以及研究每个变量的影响和变量之间的相互作用需要大量的时间和精力。结合先进的技术,如带偏移的两阶段模型、先进的一般线性模型一方面基于 Tweedie 分布或单调性约束,另一方面基于金融风险管理技术,这使得该领域成为精算师的游乐场。

像 XGBoost 这样的梯度增强算法降低了构建良好模型的成本。然而,黑盒效应使它们的验证变得更加复杂:无论输入如何,都很难感觉到此类模型会给出合理的结果。尽管如此,信用风险建模人员已经学会了使用和验证这些新型模型。他们开发了新的验证方法,例如,基于个人解释(例如,Shapley 值)来构建相信他们的模型,这是 MLOps 的一个重要组成部分,正如我们在本书中所探讨的那样。

模型偏差注意事项

建模者还必须考虑选择偏差,因为模型将不可避免地用于拒绝申请人。因此,获得贷款的人群不能代表申请人群。

通过不加注意地对先前模型版本选择的人群训练模型版本,数据科学家将使模型无法准确预测被拒绝的人群,因为它没有出现在训练数据集中,而这正是预期的该模型。这种效应称为樱桃采摘。因此,必须使用特殊方法,例如根据申请人群体重新加权或根据外部数据校准模型。

型号用于风险评估,而不仅仅是做出发放贷款的决定,必须产生概率,而不仅仅是是/否结果。通常,预测模型直接产生的概率并不准确。虽然数据科学家应用阈值来获得二元分类不是问题,但他们通常需要一种称为校准的单调转换恢复根据历史数据评估的“真实”概率。

该模型此用例的验证通常包括:

准备生产

鉴于信用风险模型的重大影响,其验证过程涉及与生命周期的建模部分相关的重要工作,它包括以下方面的完整文档:

  • 使用的数据

  • 模型和构建模型的假设

  • 验证方法和验证结果

  • 监测方法

监测方法在这种情况下有两个方面:数据和性能漂移。由于预测和获得基本事实之间的延迟很长(通常是贷款期限加上几个月以考虑延迟付款),仅监控模型性能是不够的:还必须仔细监控数据漂移。

例如,如果发生经济衰退或商业政策发生变化,申请人群很可能会发生变化,以至于在没有进一步验证的情况下无法保证模型的性能。数据漂移为通常执行按客户群划分,并采用通用统计指标来衡量之间的距离概率分布(如 Kolmogorov-Smirnov 或 Wasserstein 距离)以及特定于金融服务的指标,如人口稳定性指数和特征稳定性指数。还定期评估具有通用指标 (AUC) 或特定指标(Kolmogorov-Smirnov、Gini)的子群体的性能漂移。

模型文档通常由 MRM 团队以非常正式和独立的流程进行审查。这种独立审查是确保向模型开发团队提出正确问题的良好做法。在某些关键情况下,验证团队可能会根据文档从头开始重建模型。在某些情况下,第二次实施是使用替代技术来建立对模型的文档化理解的信心,并突出显示源自原始工具集的未发现错误。

复杂且耗时的模型验证过程会对整个 MLOps 生命周期产生影响。如此冗长的 QA 无法进行快速修复和快速模型迭代,并且会导致非常缓慢且经过深思熟虑的 MLOps 生命周期。

部署到生产

在一个典型的大的金融服务在组织中,生产环境不仅与设计环境分离,而且还可能基于不同的技术堆栈。关键操作的技术栈——比如交易验证,还有潜在的贷款验证——总是会缓慢发展。

从历史上看,生产环境主要支持逻辑回归等规则和线性模型。有些可以处理更复杂的模型,例如 PMML 或 JAR 文件。对于不太重要的用例,Docker部署或通过集成数据科学和机器学习平台进行部署是可能的。因此,模型的操作化可能涉及从单击按钮到基于 Microsoft Word 文档编写公式的操作。

已部署模型的活动日志记录对于监控此类高价值用例中的模型性能至关重要。根据监控的频率,反馈循环可能是自动化的,也可能不是自动化的。例如,如果任务每年只执行一次或两次,并且大部分时间都花在询问数据问题上,则可能不需要自动化。另一方面,如果每周进行一次评估,自动化可能是必不可少的,对于期限为几个月的短期贷款来说可能就是这种情况。

总结

几十年来,金融服务一直在开发预测模型验证和监控方案。他们已经能够不断适应新的建模技术,如梯度提升方法。鉴于它们的重要影响,围绕这些模型的生命周期管理的流程已经正式化,甚至纳入了许多法规。因此,它们可以成为其他领域 MLOps 最佳实践的来源,尽管需要进行调整,因为一方面的稳健性和成本效率、价值实现时间以及(重要的)另一方面的团队挫败感之间的权衡可能在其他业务中有所不同。

这篇关于【MLOps】第 9 章 : MLOps 实践:消费者信用风险管理的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/256224

相关文章

Docker集成CI/CD的项目实践

《Docker集成CI/CD的项目实践》本文主要介绍了Docker集成CI/CD的项目实践,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学... 目录一、引言1.1 什么是 CI/CD?1.2 docker 在 CI/CD 中的作用二、Docke

SpringBoot使用minio进行文件管理的流程步骤

《SpringBoot使用minio进行文件管理的流程步骤》MinIO是一个高性能的对象存储系统,兼容AmazonS3API,该软件设计用于处理非结构化数据,如图片、视频、日志文件以及备份数据等,本文... 目录一、拉取minio镜像二、创建配置文件和上传文件的目录三、启动容器四、浏览器登录 minio五、

IDEA中的Kafka管理神器详解

《IDEA中的Kafka管理神器详解》这款基于IDEA插件实现的Kafka管理工具,能够在本地IDE环境中直接运行,简化了设置流程,为开发者提供了更加紧密集成、高效且直观的Kafka操作体验... 目录免安装:IDEA中的Kafka管理神器!简介安装必要的插件创建 Kafka 连接第一步:创建连接第二步:选

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

软考系统规划与管理师考试证书含金量高吗?

2024年软考系统规划与管理师考试报名时间节点: 报名时间:2024年上半年软考将于3月中旬陆续开始报名 考试时间:上半年5月25日到28日,下半年11月9日到12日 分数线:所有科目成绩均须达到45分以上(包括45分)方可通过考试 成绩查询:可在“中国计算机技术职业资格网”上查询软考成绩 出成绩时间:预计在11月左右 证书领取时间:一般在考试成绩公布后3~4个月,各地领取时间有所不同

安全管理体系化的智慧油站开源了。

AI视频监控平台简介 AI视频监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒,省去繁琐重复的适配流程,实现芯片、算法、应用的全流程组合,从而大大减少企业级应用约95%的开发成本。用户只需在界面上进行简单的操作,就可以实现全视频的接入及布控。摄像头管理模块用于多种终端设备、智能设备的接入及管理。平台支持包括摄像头等终端感知设备接入,为整个平台提

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

从状态管理到性能优化:全面解析 Android Compose

文章目录 引言一、Android Compose基本概念1.1 什么是Android Compose?1.2 Compose的优势1.3 如何在项目中使用Compose 二、Compose中的状态管理2.1 状态管理的重要性2.2 Compose中的状态和数据流2.3 使用State和MutableState处理状态2.4 通过ViewModel进行状态管理 三、Compose中的列表和滚动

Prometheus与Grafana在DevOps中的应用与最佳实践

Prometheus 与 Grafana 在 DevOps 中的应用与最佳实践 随着 DevOps 文化和实践的普及,监控和可视化工具已成为 DevOps 工具链中不可或缺的部分。Prometheus 和 Grafana 是其中最受欢迎的开源监控解决方案之一,它们的结合能够为系统和应用程序提供全面的监控、告警和可视化展示。本篇文章将详细探讨 Prometheus 和 Grafana 在 DevO