机器学习:银行信贷预测(简单学习)

2023-10-09 01:10

本文主要是介绍机器学习:银行信贷预测(简单学习),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

注意:本次案例使用的是pycharm编辑器

1、导入相关的包

# 导入相关的包
import pandas as pd
import numpy as np# 导入预处理的库
import sklearn.preprocessing as pre
# 训练集、测试集划分
from sklearn.model_selection import train_test_split# 逻辑回归
from sklearn.linear_model import LogisticRegression# 模型评估
from sklearn import metrics

2、读取数据

# 1、读取数据
data = pd.read_csv(open(r"风险识别.csv", encoding="gbk"))

首先,我们读取下数据,因为我们的数据名有中文,所以加上 open( )

此时如果打印查看数据 data ,在pycharm里会省略不少字段(显示不全)

所以加上以下字段才会显示全:

# 显示全部列
pd.set_option('display.max_columns', None)   # 显示完整的列
pd.set_option('display.expand_frame_repr', False)  # 设置不折叠数据
# 下面配置显示行
# pd.set_option('display.max_rows', None)  # 显示完整的行
# pd.set_option('display.max_colwidth', 100)

上面我注释了一些,因为如果数据太多,也就是行太多那就要加载好久来显示,除非你加上data.head()

这段完整代码:

# 1、读取数据
data = pd.read_csv(open(r"风险识别.csv", encoding="gbk"))pd.set_option('display.max_columns', None)   # 显示完整的列
pd.set_option('display.expand_frame_repr', False)  # 设置不折叠数据
# pd.set_option('display.max_rows', None)  # 显示完整的行
# pd.set_option('display.max_colwidth', 100)print(data.head())

在这里插入图片描述

异常值识别与处理:
如果发现异常值较多,也可能是分类的影响,因此不做处理

3、相关分析

corr = data.corr()
print(corr)

data.corr()表示了data中的两个变量之间的相关性,取值范围为[-1,1],取值接近-1,表示反相关,类似反比例函数,取值接近1,表正相关

在这里插入图片描述
由相关举证可以看出变量之间虽有相关,但也不是很强,因此可以进行逻辑回归。如果相关性强则进行特征筛选

4、分出目标列

# 3、分出目标列
X = data.drop("还款拖欠情况", axis=1)
Y = data["还款拖欠情况"]
print(X)

在这里插入图片描述

5、标准化

前面我们导入了标准化的包

# 4.标准化
std = pre.StandardScaler()
# 调用fit_transform提取并转换数据; 一步导出结果(训练和导出一步完成)
X_std = std.fit_transform(X)print(X_std)
print(X_std.shape)

在这里插入图片描述

6、划分训练集和测试集

# 5、划分训练集和测试集
X_train, X_test, Y_train, Y_test = train_test_split(X_std, Y, test_size=0.3, random_state=0)

7、训练模型

# 6、训练模型之 逻辑回归
lr = LogisticRegression(solver="sag")  # 实例化
lr.fit(X_train, Y_train)  # 训练数据

8、预测模型

# 7、预测模型
Y_pred = lr.predict(X_test)

9、模型评估

最前面我们导入了模型评估的包,这里就不演示了

# 8、模型评估
matrix = metrics.confusion_matrix(Y_test, Y_pred)  # 混淆矩阵
# 8、模型评估
matrix = metrics.confusion_matrix(Y_test, Y_pred)  # 混淆矩阵print(matrix)
print("准确率:{:.2%}".format(metrics.accuracy_score(Y_test, Y_pred)))# 即正确预测为正类的占全部预测为正类的的比例
print("精确率:{:.2%}".format(metrics.precision_score(Y_test, Y_pred)))
# 正确预测为正类的占全部实际为正类的的比例
print("召回率:{:.2%}".format(metrics.recall_score(Y_test, Y_pred)))print("F1值::{:.2%}".format(metrics.f1_score(Y_test, Y_pred, average='binary')))

这篇关于机器学习:银行信贷预测(简单学习)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/169271

相关文章

Mysql表的简单操作(基本技能)

《Mysql表的简单操作(基本技能)》在数据库中,表的操作主要包括表的创建、查看、修改、删除等,了解如何操作这些表是数据库管理和开发的基本技能,本文给大家介绍Mysql表的简单操作,感兴趣的朋友一起看... 目录3.1 创建表 3.2 查看表结构3.3 修改表3.4 实践案例:修改表在数据库中,表的操作主要

springboot简单集成Security配置的教程

《springboot简单集成Security配置的教程》:本文主要介绍springboot简单集成Security配置的教程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,... 目录集成Security安全框架引入依赖编写配置类WebSecurityConfig(自定义资源权限规则

如何使用Python实现一个简单的window任务管理器

《如何使用Python实现一个简单的window任务管理器》这篇文章主要为大家详细介绍了如何使用Python实现一个简单的window任务管理器,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起... 任务管理器效果图完整代码import tkinter as tkfrom tkinter i

C++中函数模板与类模板的简单使用及区别介绍

《C++中函数模板与类模板的简单使用及区别介绍》这篇文章介绍了C++中的模板机制,包括函数模板和类模板的概念、语法和实际应用,函数模板通过类型参数实现泛型操作,而类模板允许创建可处理多种数据类型的类,... 目录一、函数模板定义语法真实示例二、类模板三、关键区别四、注意事项 ‌在C++中,模板是实现泛型编程

使用EasyExcel实现简单的Excel表格解析操作

《使用EasyExcel实现简单的Excel表格解析操作》:本文主要介绍如何使用EasyExcel完成简单的表格解析操作,同时实现了大量数据情况下数据的分次批量入库,并记录每条数据入库的状态,感兴... 目录前言固定模板及表数据格式的解析实现Excel模板内容对应的实体类实现AnalysisEventLis

Java进阶学习之如何开启远程调式

《Java进阶学习之如何开启远程调式》Java开发中的远程调试是一项至关重要的技能,特别是在处理生产环境的问题或者协作开发时,:本文主要介绍Java进阶学习之如何开启远程调式的相关资料,需要的朋友... 目录概述Java远程调试的开启与底层原理开启Java远程调试底层原理JVM参数总结&nbsMbKKXJx

Java中数组转换为列表的两种实现方式(超简单)

《Java中数组转换为列表的两种实现方式(超简单)》本文介绍了在Java中将数组转换为列表的两种常见方法使用Arrays.asList和Java8的StreamAPI,Arrays.asList方法简... 目录1. 使用Java Collections框架(Arrays.asList)1.1 示例代码1.

Java8需要知道的4个函数式接口简单教程

《Java8需要知道的4个函数式接口简单教程》:本文主要介绍Java8中引入的函数式接口,包括Consumer、Supplier、Predicate和Function,以及它们的用法和特点,文中... 目录什么是函数是接口?Consumer接口定义核心特点注意事项常见用法1.基本用法2.结合andThen链

C++初始化数组的几种常见方法(简单易懂)

《C++初始化数组的几种常见方法(简单易懂)》本文介绍了C++中数组的初始化方法,包括一维数组和二维数组的初始化,以及用new动态初始化数组,在C++11及以上版本中,还提供了使用std::array... 目录1、初始化一维数组1.1、使用列表初始化(推荐方式)1.2、初始化部分列表1.3、使用std::

redis群集简单部署过程

《redis群集简单部署过程》文章介绍了Redis,一个高性能的键值存储系统,其支持多种数据结构和命令,它还讨论了Redis的服务器端架构、数据存储和获取、协议和命令、高可用性方案、缓存机制以及监控和... 目录Redis介绍1. 基本概念2. 服务器端3. 存储和获取数据4. 协议和命令5. 高可用性6.