我正在尝试为Go中的gonum密集向量实现自己的绝对函数。我想知道是否有比平方和平方根更好的方法来获取数组的绝对值?

我的主要问题是我必须在这些向量上实现自己的元素明智的牛顿平方根函数,并且实现速度和准确性之间要取得平衡。如果我可以避免使用平方根函数,那我会很高兴的。

最佳答案

NumPy源代码可能很难导航,因为它具有用于许多数据类型的众多功能。您可以在文件 scalarmath.c.src 中找到绝对值函数的C级源代码。该文件实际上是具有功能定义的模板,此功能定义随后由构建系统针对几种数据类型进行复制。请注意,每个函数都是为数组的每个元素运行的“内核”(遍历数组的操作在其他地方完成)。这些函数始终称为<name of the type>_ctype_absolute,其中<name of the type>是其适用的数据类型,通常是模板化的。让我们来看看它们。

/**begin repeat
 * #name = ubyte, ushort, uint, ulong, ulonglong#
 */

#define @name@_ctype_absolute @name@_ctype_positive

/**end repeat**/

这是无符号类型的。在这种情况下,绝对值与 np.positive 相同,后者仅复制该值而不执行任何操作(如果您拥有a数组并且执行+a,则会得到此值)。

/**begin repeat
 * #name = byte, short, int, long, longlong#
 * #type = npy_byte, npy_short, npy_int, npy_long, npy_longlong#
 */
static void
@name@_ctype_absolute(@type@ a, @type@ *out)
{
    *out = (a < 0 ? -a : a);
}
/**end repeat**/

这是有符号整数。非常简单。

/**begin repeat
 * #name = float, double, longdouble#
 * #type = npy_float, npy_double, npy_longdouble#
 * #c = f,,l#
 */
static void
@name@_ctype_absolute(@type@ a, @type@ *out)
{
    *out = npy_fabs@c@(a);
}
/**end repeat**/

这用于浮点值。这里使用了npy_fabsfnpy_fabsnpy_fabsl函数。它们在 npy_math.h 中声明,但通过 npy_math_internal.h.src 中的模板化C代码定义,本质上调用了C/C99 counterparts(除非C99不可用,否则in which case fabsf and fabsl are emulated with fabs )。您可能会认为前面的代码对于浮点类型也应该适用,但是实际上它们更复杂,因为它们具有NaN,无穷大或有符号零之类的东西,因此最好使用处理所有内容的标准C函数。可靠地。

static void
half_ctype_absolute(npy_half a, npy_half *out)
{
    *out = a&0x7fffu;
}

实际上,这不是模板化的,它是half-precision floating-point values的绝对值函数。事实证明,您可以通过按位操作(将第一位设置为0)来更改符号,因为半精度比其他浮点类型更简单(如果限制更多)(对于那些浮点类型,通常是相同的,但是有特殊情况) )。

/**begin repeat
 * #name = cfloat, cdouble, clongdouble#
 * #type = npy_cfloat, npy_cdouble, npy_clongdouble#
 * #rtype = npy_float, npy_double, npy_longdouble#
 * #c = f,,l#
 */
static void
@name@_ctype_absolute(@type@ a, @rtype@ *out)
{
    *out = npy_cabs@c@(a);
}
/**end repeat**/

最后一个是针对复杂类型的。它们使用npy_cabsfnpycabsnpy_cabsl函数,它们再次在 npy_math.h 中声明,但在这种情况下,使用 npy_math_complex.c.src C99 functions中实现了模板(除非该模板不可用,在这种情况下为emulated with np.hypot )。

10-08 04:32