本文主要是介绍项目:泰坦尼克号数据集项目,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
概述
我们都熟悉泰坦尼克号,这艘不沉的船,它于 1912 年进行了第一次也是最后一次航行。尽管泰坦尼克号是为了不沉没而设计的,但没有足够的救生艇供每个人使用。最终导致2224名乘客和机组人员中的1502人死亡。
泰坦尼克号数据集 根据泰坦尼克号乘客整理的数据集,例如他们的年龄、阶级、性别等来预测他们是否会幸存。虽然生存有一定的运气成分,但似乎某些群体比其他群体更有可能生存。
我们正在建设什么?
在本文中,我们构建一个预测模型根据随机乘客的年龄、性别、机舱、票价等等。首先我们将数据可视化,然后根据我们的需求调整参数值。
先决条件
以下是一些先决条件 -
- Python 知识
- 了解 Pandas、Numpy 等实用程序库
- Seaborn、Matplotlib 等可视化库的基础知识
- SciKit Learn 的可实施知识
- 了解数据转换、分箱、特征工程、模型训练、模型评估和模型测试等概念
这篇关于项目:泰坦尼克号数据集项目的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!