UCI心脏病数据集二分类预测（LightGBM + 贝叶斯参数调优 + plotly模型评价可视化）

本文主要是介绍UCI心脏病数据集二分类预测（LightGBM + 贝叶斯参数调优 + plotly模型评价可视化），希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

一、导入数据

二、数据预处理探索性数据分析

三、特征工程

四、模型训练，参数调优

五、模型评价

一、导入数据

# 导入数据集
import pandas as pd
data = pd.read_csv(r"C:\Users\Terry\Desktop\heart.csv")
data

数据集有1025行，14列。每行表示一个病人。13列表示特征，1列表示标签(是否患心脏病）

%%html
<style>table {display: inline-block}
</style>

看一下字段名的含义：

二、数据预处理探索性数据分析

查看缺失值：没有缺失值

# 缺失值的检查
data.isna().sum()

import missingno as msno
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['Roboto'] 
msno.matrix(data, labels=True)

# 热力图绘制
def enhanced_corr_heatmap(data):"""绘制数据皮尔逊相关性系数的热力图（下三角显示）"""# 导包import numpy as npimport matplotlib.pyplot as pltimport seaborn as sns# matplotlib的图像大小和字体显示设置plt.figure(figsize=(10, 8)) # 可同比例放大plt.rcParams['font.sans-serif'] = ['Roboto'] # 美化字体plt.rcParams['axes.unicode_minus'] = False # 显示负数#保留下三角：data_corr = data.corr()mask = np.zeros_like(data_corr)for i in range(1,len(mask)):for j in range(0,i):mask[j][i] = True # 上三角就mask[i][j] = True# 绘图sns.heatmap(data_corr,annot=True, f

这篇关于UCI心脏病数据集二分类预测（LightGBM + 贝叶斯参数调优 + plotly模型评价可视化）的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！