本文主要是介绍UCI心脏病数据集二分类预测(LightGBM + 贝叶斯参数调优 + plotly模型评价可视化),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
目录
一、导入数据
二、数据预处理 探索性数据分析
三、特征工程
四、模型训练,参数调优
五、模型评价
一、导入数据
# 导入数据集
import pandas as pd
data = pd.read_csv(r"C:\Users\Terry\Desktop\heart.csv")
data
数据集有1025行,14列。每行表示一个病人。13列表示特征,1列表示标签(是否患心脏病)
%%html
<style>table {display: inline-block}
</style>
看一下字段名的含义:
二、数据预处理 探索性数据分析
查看缺失值:没有缺失值
# 缺失值的检查
data.isna().sum()
import missingno as msno
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['Roboto']
msno.matrix(data, labels=True)
# 热力图绘制
def enhanced_corr_heatmap(data):"""绘制数据皮尔逊相关性系数的热力图(下三角显示)"""# 导包import numpy as npimport matplotlib.pyplot as pltimport seaborn as sns# matplotlib的图像大小和字体显示设置plt.figure(figsize=(10, 8)) # 可同比例放大plt.rcParams['font.sans-serif'] = ['Roboto'] # 美化字体plt.rcParams['axes.unicode_minus'] = False # 显示负数#保留下三角:data_corr = data.corr()mask = np.zeros_like(data_corr)for i in range(1,len(mask)):for j in range(0,i):mask[j][i] = True # 上三角就mask[i][j] = True# 绘图sns.heatmap(data_corr,annot=True, f
这篇关于UCI心脏病数据集二分类预测(LightGBM + 贝叶斯参数调优 + plotly模型评价可视化)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!