我正在使用 loadtxt 从 csv 加载数据,其中所有值都是浮点数,但缺少编码为字符“?”的数据除外。

我正在尝试创建一个掩码数组,以便我可以在加载的数据上使用 np.ma 函数,其中丢失的数据将被忽略以求平均值等。我已经阅读了 masked_array 的文档,这可能令人难以置信微不足道,但我似乎无法弄清楚如何屏蔽数组?出于 np.ma 数学函数的目的而被忽略。

最佳答案

您可以简单地使用 np.genfromtxt() 读取文件并屏蔽生成的 nan 值。例如:

输入:

11, 12, 13, ?, ?, 16
21, 22, ?, 24, ?, 26

代码:
a = np.genfromtxt('test.txt', delimiter=',', missing_values='?', usemask=True)

a.sum(axis=1).data
#array([ 52.,  93.])

a.mean()
#18.125

关于python - 带有缺失值的 Numpy 掩码输入数据,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/23534745/

10-12 16:38
查看更多