获救专题

Titanic沉船数据集之获救乘客预测

项目目标： Titanic数据集是我们进入到机器学习领域中的第一个数据集，同我们学习编程的第一句程序语言（‘hello,world’）是一样的。通过对该数据集进行机器学习建模，掌握Numpy,Pandas,Matplotlib,Sklearn等常用数据分析库的使用，并掌握机器学习的完成流程数据预处理 - 建立基础模型 - 模型评估 - 调参 - 固定模型参数。背景介绍：泰坦尼克沉船是震惊

教女朋友学数据挖掘——泰坦尼克号获救预测

学习笔记一、数据挖掘任务流程 1.1 数据读取统计数据，并进行展示统计数据各项指标明确数据规模和要完成任务 1.2 特征理解分析单特征分析，逐个变量分析其对结果的影响多变量统计分析，综合考虑多种情况影响统计绘图得出结论 1.3 数据清洗与预处理对缺失值进行填充特征标准化/归一化筛选有价值的特征分析特征之间的相关性 1.4 建立模型特征数据与标签准备数据集切分帅

python实战之泰坦尼克号获救问题

数据来源： Kaggle数据集 → 共有1309名乘客数据，其中891是已知存活情况（train.csv），剩下418则是需要进行分析预测的（test.csv）字段意义： PassengerId: 乘客编号 Survived :存活情况（存活：1 ; 死亡：0） Pclass : 客舱等级 Name : 乘客姓名 Sex : 性别 Age : 年龄 SibSp : 同乘的兄弟姐妹/配偶数 Pa

数据分析案例实战：泰坦尼克船员获救

学习唐宇迪《python数据分析与机器学习实战》视频一、数据分析可以看到有些数据是字符串形式，有些是数值形式，有数据缺失。 survived：1代表存活，0代表死亡，目标tag。 Pclass：船舱，较重要。 sex：性别，较重要。 age：年龄，有缺失值，较重要。 SibSp：兄弟姐妹。Parch：父母孩子。 Ticket：票。 Fare：船票价格，特征可能与船舱特征重复，也较重要

泰坦尼克号船员获救学习记录

基于已有的信息预测当遇难时，是否可以获救第一步，提取出最有价值的信息 survived→0表示遇难，1表示幸存 Pclass→舱室类型 Name→遇难者姓名 Sex→性别 Age→年龄 SibSp→有多少亲人一起来坐船 Parch→身边有多少老人和孩子 Ticket→票的编号 Fare→票价 Cabin→舱号 Eabarked→在不同的站区上的车第二步，制作出分类器完成预测是否可以获救