我有一个numpy的数组:

>>> type(dat)
Out[41]: numpy.ndarray

>>> dat.shape
Out[46]: (127L,)

>>> dat[0:3]
Out[42]: array([datetime.date(2010, 6, 11), datetime.date(2010, 6, 19), datetime.date(2010, 6, 30)], dtype=object)


我想获得此数组中每个日期的工作日,如下所示:

>>> dat[0].weekday()
Out[43]: 4


我尝试使用以下方法,但无济于事:

import pandas as pd
import numpy as np
import datetime as dt

np.apply_along_axis(weekday,0,dat)
NameError: name 'weekday' is not defined

np.apply_along_axis(dt.weekday,0,dat)
AttributeError: 'module' object has no attribute 'weekday'

np.apply_along_axis(pd.weekday,1,dat)
AttributeError: 'module' object has no attribute 'weekday'

np.apply_along_axis(lambda x: x.weekday(),0,dat)
AttributeError: 'numpy.ndarray' object has no attribute 'weekday'

np.apply_along_axis(lambda x: x.dt.weekday,0,dat)
AttributeError: 'numpy.ndarray' object has no attribute 'dt'


我在这里缺少什么吗?

最佳答案

np.apply_along_axis对于一维数组没有多大意义。在2d或更高的数组中,它将函数应用于该数组中的1d切片。关于该功能:


  此函数应接受一维数组。适用于一维
          沿指定轴的arr切片。


nameerror甚至在运行apply之前就已生成。您没有定义weekday函数:

np.apply_along_axis(weekday,0,dat)
NameError: name 'weekday' is not defined


weekday是日期的方法,而不是dt模块中的函数:

np.apply_along_axis(dt.weekday,0,dat)
AttributeError: 'module' object has no attribute 'weekday'


熊猫也没有定义:

np.apply_along_axis(pd.weekday,1,dat)
AttributeError: 'module' object has no attribute 'weekday'


这看起来更好,但是apply_along_axis将数组(1d)传递给lambdaweekday不是数组方法。

np.apply_along_axis(lambda x: x.weekday(),0,dat)
AttributeError: 'numpy.ndarray' object has no attribute 'weekday'


而且数组也没有dt属性。

np.apply_along_axis(lambda x: x.dt.weekday,0,dat)
AttributeError: 'numpy.ndarray' object has no attribute 'dt'


因此,让我们忘记apply_along_axis



定义一个样本,首先作为列表,然后作为对象数组:

In [231]: alist = [datetime.date(2010, 6, 11), datetime.date(2010, 6, 19), datetime.date(2010, 6, 30)]
In [232]: data = np.array(alist)
In [233]: data
Out[233]:
array([datetime.date(2010, 6, 11), datetime.date(2010, 6, 19),
       datetime.date(2010, 6, 30)], dtype=object)


为了方便起见,使用weekday的lambda版本:

In [234]: L = lambda x: x.weekday()


可以通过几种方式来迭代地应用它:

In [235]: [L(x) for x in alist]
Out[235]: [4, 5, 2]
In [236]: [L(x) for x in data]
Out[236]: [4, 5, 2]
In [237]: np.vectorize(L)(data)
Out[237]: array([4, 5, 2])
In [238]: np.frompyfunc(L,1,1)(data)
Out[238]: array([4, 5, 2], dtype=object)


我只是在3000个项目清单上进行了时间测试。列表理解最快(正如我从过去的测试中所预期的那样),但是时间差异并不大。消费者花费的最大时间只是运行x.weekday() 3000次。

关于python - numpy沿轴应用不适用于工作日,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/48512090/

10-12 18:30