我有一个 Pandas 数据框,如下所示:

id    cat1    cat2    cat3    num1    num2
1     0       WN      29      2003    98
2     1       TX      12      755     76
3     0       WY      11      845     32
4     1       IL      19      935     46
我想找出 cat1 和列 cat3num1num2 之间的相关性
或在 cat1num1num2 之间
或在 cat2cat1, cat3, num1, num2 之间
当我使用 df.corr() 时,它​​会给出数据框中所有列之间的相关性,但我想查看上面详述的这些选择性列之间的相关性。
我如何在 Python Pandas 中做到这一点?
一千提前感谢您的回答。

最佳答案

我尝试了以下方法并且有效:

features1=list(['cat1','cat2','cat3'])
features2=list(['Cat1', 'Cat2','num1','num2'])

df[features1].corr()
df[features2].corr()

当您的数据集中有大量变量时,根据需要选择列的好方法。

关于python - 在Python中如何做多列多于2个变量的相关性?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/42128462/

10-11 07:49