我有一个 Pandas 数据框,如下所示:
id cat1 cat2 cat3 num1 num2
1 0 WN 29 2003 98
2 1 TX 12 755 76
3 0 WY 11 845 32
4 1 IL 19 935 46
我想找出 cat1
和列 cat3
、 num1
和 num2
之间的相关性或在
cat1
和 num1
和 num2
之间或在
cat2
和 cat1, cat3, num1, num2
之间当我使用
df.corr()
时,它会给出数据框中所有列之间的相关性,但我想查看上面详述的这些选择性列之间的相关性。我如何在 Python Pandas 中做到这一点?
一千提前感谢您的回答。
最佳答案
我尝试了以下方法并且有效:
features1=list(['cat1','cat2','cat3'])
features2=list(['Cat1', 'Cat2','num1','num2'])
df[features1].corr()
df[features2].corr()
当您的数据集中有大量变量时,根据需要选择列的好方法。
关于python - 在Python中如何做多列多于2个变量的相关性?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/42128462/