我试图通过从两个变量中提取特定信息来从kaggle的Titanic数据集中制作一个要素变量,但我不知道该如何编码。我想将“ Sex”变量和“ Parch”变量结合在一起。我想要的是,如果乘客是带孩子或父母的女性,则应在名为“妇女和儿童”的新变量中将其编码为1。如果他们是没有孩子/父母的妇女,或者是有孩子或没有孩子的男性,则应将其编码为0。

我的理论是,有孩子的妇女比没有孩子的妇女或有孩子或没有孩子的男人更有可能生存。

最佳答案

通过使用panda或scikit学习python库,以及使用python语言,可以组合特征变量。

关于machine-learning - kaggle泰坦尼克号子集妇女和 child ,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/35870125/

10-12 22:16