简单问题:

In [1]:
df = DataFrame({'value':[4,4,4],'unit':['D','W','Y']})
df

Out[1]:
     unit   value
0    D      4
1    W      4
2    Y      4

我可以这样创建时间增量(当然):
In [2]:
timedelta64(4, 'D')

Out[2]:
numpy.timedelta64(4,'D')

但我无法遍历DataFrame列以获得带有timedelta的结果序列:
def f(x):
    return timedelta64(x['value'], x['unit'])

df.apply(f, axis=1)

相反,我得到:
TypeError: don't know how to convert scalar number to float

编辑:
这也不起作用,并返回相同的错误:
df['arg'] = zip(df.value, df.unit)
df.arg.apply(lambda x: timedelta64(x[0], x[1]))

最佳答案

所以你的代码对我有效。

df = pd.DataFrame({'value':[4,4,4],'unit':['D','W','Y']})
df.apply(f, axis=1)
0     4 days
1    4 weeks
2    4 years
dtype: object

以下是我的版本:
numpy.__version__
'1.8.0'
pandas.__version__
'0.13.0rc1-32-g81053f9'

我确实注意到一个可能与您的问题有关的bug。您可以检查一下是否有numpy 1.7,如果有,可以升级到1.8,看看是否可以解决问题。祝你好运:)
https://github.com/pydata/pandas/issues/5689

关于python - 使用2个 Pandas 列作为np.timedelta的参数,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/21035837/

10-12 22:26