金融贷款逾期模型 -- 029

2024-05-27 00:08
文章标签 模型 金融 逾期 贷款 029

本文主要是介绍金融贷款逾期模型 -- 029,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

内容目录

一、导入相关库二、数据读取三、数据清洗——删除无关、重复数据四、数据清洗——类型转换1、数据集划分2、缺失值处理3、异常值处理4、离散特征编码5、日期特征处理6、特征组合五、数据集划分六、模型构建七、模型评估八、模型调优九、分类模型和集成模型评分和ROC曲线

一、导入相关库

# -*- coding:utf-8 -*-
# 一、导入相关库
import pandas as pd
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.svm import SVC
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
import xgboost as xgb
import lightgbm as lgb
from sklearn.metrics import accuracy_score, precision_score, recall_score
from sklearn.metrics import roc_auc_score
import matplotlib.pyplot as pltimport warnings
import numpy as np
import matplotlib
import pandas as pd
warnings.filterwarnings("ignore")
matplotlib.rcParams['font.sans-serif']=['SimHei']   # 用黑体显示中文
matplotlib.rcParams['axes.unicode_minus']=False     # 正常显示负号
np.set_printoptions(precision=5,suppress=True)pd.set_option('display.max_columns', 10000)
#显示所有行
pd.set_option('display.max_rows', 10000)
pd.set_option('max_colwidth',10000)
pd.set_option('display.width', 10000)#不换行
print(X.shape)  #(4754, 84)  
   Unnamed: 0   custid                          trade_no bank_card_no  low_volume_percent  middle_volume_percent  take_amount_in_later_12_month_highest  trans_amount_increase_rate_lately  trans_activity_month  trans_activity_day  transd_mcc  trans_days_interval_filter  trans_days_interval  regional_mobility  student_feature  repayment_capability  is_high_user  number_of_trans_from_2011  first_transaction_time  historical_trans_amount  historical_trans_day  rank_trad_1_month  trans_amount_3_month  avg_consume_less_12_valid_month    abs  top_trans_count_last_1_month  avg_price_last_12_month  avg_price_top_last_12_valid_month reg_preference_for_trad  trans_top_time_last_1_month  trans_top_time_last_6_month  consume_top_time_last_1_month  consume_top_time_last_6_month  cross_consume_count_last_1_month  trans_fail_top_count_enum_last_1_month  trans_fail_top_count_enum_last_6_month  trans_fail_top_count_enum_last_12_month  consume_mini_time_last_1_month  max_cumulative_consume_later_1_month  max_consume_count_later_6_month  railway_consume_count_last_12_month  pawns_auctions_trusts_consume_last_1_month  pawns_auctions_trusts_consume_last_6_month  jewelry_consume_count_last_6_month  status source  first_transaction_day  trans_day_last_12_month id_name  apply_score  apply_credibility  query_org_count  query_finance_count  query_cash_count  query_sum_count latest_query_time  latest_one_month_apply  latest_three_month_apply  latest_six_month_apply  loans_score  loans_credibility_behavior  loans_count  loans_settle_count  loans_overdue_count  loans_org_count_behavior  consfin_org_count_behavior  loans_cash_count  latest_one_month_loan  latest_three_month_loan  latest_six_month_loan  history_suc_fee  history_fail_fee  latest_one_month_suc  latest_one_month_fail  loans_long_time loans_latest_time  loans_credit_limit  loans_credibility_limit  loans_org_count_current  loans_product_count  loans_max_limit  loans_avg_limit  consfin_credit_limit  consfin_credibility  consfin_org_count_current  consfin_product_count  consfin_max_limit  consfin_avg_limit  latest_query_day  loans_latest_day
0           5  2791858  20180507115231274000000023057383          卡号1                0.01                   0.99                                      0                               0.90                  0.55               0.313        17.0                        27.0                 26.0                3.0              NaN                 19890             0                       30.0              20130817.0                   149050                 151.0               0.40                 34030                              7.0   3920                          0.15                     1020                               0.55                    一线城市                          4.0                         19.0                            4.0                           19.0                               1.0                                     1.0                                     2.0                                      2.0                             5.0                                  2170                              6.0                                  0.0                                        1970                                       18040                                 0.0       1     xs                 1738.0                     85.0      蒋红        583.0               79.0              8.0                  2.0               6.0             10.0        2018-04-25                     2.0                       5.0                     8.0        552.0                        73.0         37.0                34.0                  2.0                      10.0                         1.0               9.0                    1.0                      1.0                   13.0             37.0               7.0                   1.0                    0.0            341.0        2018-04-19              2200.0                     72.0                      9.0                 10.0           2900.0           1688.0                1200.0                 75.0                        1.0                    2.0             1200.0             1200.0              12.0              18.0
1          10   534047  20180507121002192000000023073000          卡号1                0.02                   0.94                                   2000                               1.28                  1.00               0.458        19.0                        30.0                 14.0                4.0              1.0                 16970             0                       23.0              20160402.0                   302910                 224.0               0.35                 10590                              5.0   6950                          0.05                     1210                               0.50                    一线城市                         13.0                         30.0                           13.0                           30.0                               0.0                                     0.0                                     3.0                                      3.0                           330.0                                  2100                              9.0                                  0.0                                        1820                                       15680                                 0.0       0     xs                  779.0    

这篇关于金融贷款逾期模型 -- 029的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1005968

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

图神经网络模型介绍(1)

我们将图神经网络分为基于谱域的模型和基于空域的模型,并按照发展顺序详解每个类别中的重要模型。 1.1基于谱域的图神经网络         谱域上的图卷积在图学习迈向深度学习的发展历程中起到了关键的作用。本节主要介绍三个具有代表性的谱域图神经网络:谱图卷积网络、切比雪夫网络和图卷积网络。 (1)谱图卷积网络 卷积定理:函数卷积的傅里叶变换是函数傅里叶变换的乘积,即F{f*g}

秋招最新大模型算法面试,熬夜都要肝完它

💥大家在面试大模型LLM这个板块的时候,不知道面试完会不会复盘、总结,做笔记的习惯,这份大模型算法岗面试八股笔记也帮助不少人拿到过offer ✨对于面试大模型算法工程师会有一定的帮助,都附有完整答案,熬夜也要看完,祝大家一臂之力 这份《大模型算法工程师面试题》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

AI Toolkit + H100 GPU,一小时内微调最新热门文生图模型 FLUX

上个月,FLUX 席卷了互联网,这并非没有原因。他们声称优于 DALLE 3、Ideogram 和 Stable Diffusion 3 等模型,而这一点已被证明是有依据的。随着越来越多的流行图像生成工具(如 Stable Diffusion Web UI Forge 和 ComyUI)开始支持这些模型,FLUX 在 Stable Diffusion 领域的扩展将会持续下去。 自 FLU

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者

线性因子模型 - 独立分量分析(ICA)篇

序言 线性因子模型是数据分析与机器学习中的一类重要模型,它们通过引入潜变量( latent variables \text{latent variables} latent variables)来更好地表征数据。其中,独立分量分析( ICA \text{ICA} ICA)作为线性因子模型的一种,以其独特的视角和广泛的应用领域而备受关注。 ICA \text{ICA} ICA旨在将观察到的复杂信号