我在GCC112上,这是一台运行Linux的低端Power8计算机。 Power8的in-core crypto提供AES,SHA和其他一些有用的功能。我正在尝试使用getauxval确定运行时功能的可用性。用例是为“最小”能力的机器发行的发行版,我们需要在运行时交换一个更快的功能。
hwcaps.h的转储如下所示,但缺少Power8,AES,SHA和其他文件的特定位。但是,我相信Power8是ISA 2.07,而ISA 2.07具有PPC_FEATURE2_ARCH_2_07位。

我不清楚的是,Power8内核加密是可选的,例如ARMv8下的ARM加密。我找不到明确说明要求的文档,并且我没有OpenPower的成员资格来访问ISA文档。 (另一种可能性是,它已声明,但我在文档中错过了它)。

是否可以使用getauxval在运行时环境中查询功能?如果不是,那么我们如何确定运行时的功能可用性? CPU探测是唯一可用的替代方法吗?

也许更笼统地说,我们如何确定Power6,Power7和Power8运行时环境?
auxv.h通常为空。头文件包括hwcaps.h

$ cat /usr/include/bits/hwcap.h
...

/* The bit numbers must match those in the kernel's asm/cputable.h.  */

/* Feature definitions in AT_HWCAP.  */
#define PPC_FEATURE_32              0x80000000 /* 32-bit mode. */
#define PPC_FEATURE_64              0x40000000 /* 64-bit mode. */
#define PPC_FEATURE_601_INSTR       0x20000000 /* 601 chip, Old POWER ISA.  */
#define PPC_FEATURE_HAS_ALTIVEC     0x10000000 /* SIMD/Vector Unit.  */
#define PPC_FEATURE_HAS_FPU         0x08000000 /* Floating Point Unit.  */
#define PPC_FEATURE_HAS_MMU         0x04000000 /* Memory Management Unit.  */
#define PPC_FEATURE_HAS_4xxMAC      0x02000000 /* 4xx Multiply Accumulator.  */
#define PPC_FEATURE_UNIFIED_CACHE   0x01000000 /* Unified I/D cache.  */
#define PPC_FEATURE_HAS_SPE         0x00800000 /* Signal Processing ext.  */
#define PPC_FEATURE_HAS_EFP_SINGLE  0x00400000 /* SPE Float.  */
#define PPC_FEATURE_HAS_EFP_DOUBLE  0x00200000 /* SPE Double.  */
#define PPC_FEATURE_NO_TB           0x00100000 /* 601/403gx have no timebase */
#define PPC_FEATURE_POWER4          0x00080000 /* POWER4 ISA 2.00 */
#define PPC_FEATURE_POWER5          0x00040000 /* POWER5 ISA 2.02 */
#define PPC_FEATURE_POWER5_PLUS     0x00020000 /* POWER5+ ISA 2.03 */
#define PPC_FEATURE_CELL_BE         0x00010000 /* CELL Broadband Engine */
#define PPC_FEATURE_BOOKE           0x00008000 /* ISA Category Embedded */
#define PPC_FEATURE_SMT             0x00004000 /* Simultaneous
                                                  Multi-Threading */
#define PPC_FEATURE_ICACHE_SNOOP    0x00002000
#define PPC_FEATURE_ARCH_2_05       0x00001000 /* ISA 2.05 */
#define PPC_FEATURE_PA6T            0x00000800 /* PA Semi 6T Core */
#define PPC_FEATURE_HAS_DFP         0x00000400 /* Decimal FP Unit */
#define PPC_FEATURE_POWER6_EXT      0x00000200 /* P6 + mffgpr/mftgpr */
#define PPC_FEATURE_ARCH_2_06       0x00000100 /* ISA 2.06 */
#define PPC_FEATURE_HAS_VSX         0x00000080 /* P7 Vector Extension.  */
#define PPC_FEATURE_PSERIES_PERFMON_COMPAT  0x00000040
#define PPC_FEATURE_TRUE_LE         0x00000002
#define PPC_FEATURE_PPC_LE          0x00000001

/* Feature definitions in AT_HWCAP2.  */
#define PPC_FEATURE2_ARCH_2_07     0x80000000 /* ISA 2.07 */
#define PPC_FEATURE2_HAS_HTM       0x40000000 /* Hardware Transactional
                                                 Memory */
#define PPC_FEATURE2_HAS_DSCR      0x20000000 /* Data Stream Control
                                                 Register */
#define PPC_FEATURE2_HAS_EBB       0x10000000 /* Event Base Branching */
#define PPC_FEATURE2_HAS_ISEL      0x08000000 /* Integer Select */
#define PPC_FEATURE2_HAS_TAR       0x04000000 /* Target Address Register */

最佳答案

我想说getauxval()将是最好的方法; HWCAPHWCAP2值正是用于确定硬件功能的。您的列表中缺少PPC_FEATURE2_VEC_CRYPTO,它指示 vector 加密指令的存在,这听起来像您所需要的。

附带说明:您可能不想检测处理器实现,但要检测处理器功能。具体来说,请检查单个功能,而不要尝试检查提供该功能的过程。 (例如,直接检测VEC_CRYPTO,而不是尝试检查POWER8,并假设这意味着加密功能)。

稍微详细一点,Linux的cputable条目指定HWCAP/HWCAP2值。以POWER8为例:

#define COMMON_USER2_POWER8 (PPC_FEATURE2_ARCH_2_07 | \
                 PPC_FEATURE2_HTM_COMP | \
                 PPC_FEATURE2_HTM_NOSC_COMP | \
                 PPC_FEATURE2_DSCR | \
                 PPC_FEATURE2_ISEL | PPC_FEATURE2_TAR | \
                 PPC_FEATURE2_VEC_CRYPTO)

这来自内核中的 arch/powerpc/include/asm/cputable.h (它还提供可以在aux vector 中设置的实际hwcap位)。

最后,我相当确定您不需要成为OpenPOWER基金会成员即可下载ISA(最新版本为3.0B)-您只需要在网站上注册一个帐户即可。

10-08 03:44