【学习总结】GirlsInAI ML-diary 总
原博github链接-day21
初识 Numpy, Matplotlib, Seanborn [柱状图、折线图、箱图]
一、Titanic练习赛介绍
Titanic练习赛主要就是预测乘客是否存活,训练集中有乘客的若干特征与存活情况,乘客特征是年龄,性别等信息。使用训练集训练出一个模型,然后利用该模型去预测测试集中乘客的存活情况。
二、特征分析与选择
训练集中乘客的特征有:PassengerId,Pclass,Name,Sex,Age,SibSp,Parch,Ticket,Fare,Cabin和Embarked。下面对其中几个特征(变量)进行数据分析和可视化分析。
0-import包并读取数据
1-
2-
3-
4-
5-
6-
7-
8-