坦坦专题

【Scikit-Learn】决策树预测坦坦尼克号幸存者

数据集下载地址为:www.kaggle.com/c/titanic. 本文通过泰坦尼克号数据集及使用决策树模型来熟悉sklearn相关类的使用,并给出以下例子: 1. 首先将数据集进行数据清洗,然后训练决策树模型并可视化该决策树。 2. 分析不同深度、不同阈值对决策树的影响。 3. 使用GridSearchCV类来选择决策树的最佳参数 1. 数据预处理 这里最值得学习的是,乘客登船的港