我在GCC112上,这是一台运行Linux的低端Power8计算机。 Power8的in-core crypto提供AES,SHA和其他一些有用的功能。我正在尝试使用getauxval
确定运行时功能的可用性。用例是为“最小”能力的机器发行的发行版,我们需要在运行时交换一个更快的功能。hwcaps.h
的转储如下所示,但缺少Power8,AES,SHA和其他文件的特定位。但是,我相信Power8是ISA 2.07,而ISA 2.07具有PPC_FEATURE2_ARCH_2_07
位。
我不清楚的是,Power8内核加密是可选的,例如ARMv8下的ARM加密。我找不到明确说明要求的文档,并且我没有OpenPower的成员资格来访问ISA文档。 (另一种可能性是,它已声明,但我在文档中错过了它)。
是否可以使用getauxval
在运行时环境中查询功能?如果不是,那么我们如何确定运行时的功能可用性? CPU探测是唯一可用的替代方法吗?
也许更笼统地说,我们如何确定Power6,Power7和Power8运行时环境?auxv.h
通常为空。头文件包括hwcaps.h
。
$ cat /usr/include/bits/hwcap.h
...
/* The bit numbers must match those in the kernel's asm/cputable.h. */
/* Feature definitions in AT_HWCAP. */
#define PPC_FEATURE_32 0x80000000 /* 32-bit mode. */
#define PPC_FEATURE_64 0x40000000 /* 64-bit mode. */
#define PPC_FEATURE_601_INSTR 0x20000000 /* 601 chip, Old POWER ISA. */
#define PPC_FEATURE_HAS_ALTIVEC 0x10000000 /* SIMD/Vector Unit. */
#define PPC_FEATURE_HAS_FPU 0x08000000 /* Floating Point Unit. */
#define PPC_FEATURE_HAS_MMU 0x04000000 /* Memory Management Unit. */
#define PPC_FEATURE_HAS_4xxMAC 0x02000000 /* 4xx Multiply Accumulator. */
#define PPC_FEATURE_UNIFIED_CACHE 0x01000000 /* Unified I/D cache. */
#define PPC_FEATURE_HAS_SPE 0x00800000 /* Signal Processing ext. */
#define PPC_FEATURE_HAS_EFP_SINGLE 0x00400000 /* SPE Float. */
#define PPC_FEATURE_HAS_EFP_DOUBLE 0x00200000 /* SPE Double. */
#define PPC_FEATURE_NO_TB 0x00100000 /* 601/403gx have no timebase */
#define PPC_FEATURE_POWER4 0x00080000 /* POWER4 ISA 2.00 */
#define PPC_FEATURE_POWER5 0x00040000 /* POWER5 ISA 2.02 */
#define PPC_FEATURE_POWER5_PLUS 0x00020000 /* POWER5+ ISA 2.03 */
#define PPC_FEATURE_CELL_BE 0x00010000 /* CELL Broadband Engine */
#define PPC_FEATURE_BOOKE 0x00008000 /* ISA Category Embedded */
#define PPC_FEATURE_SMT 0x00004000 /* Simultaneous
Multi-Threading */
#define PPC_FEATURE_ICACHE_SNOOP 0x00002000
#define PPC_FEATURE_ARCH_2_05 0x00001000 /* ISA 2.05 */
#define PPC_FEATURE_PA6T 0x00000800 /* PA Semi 6T Core */
#define PPC_FEATURE_HAS_DFP 0x00000400 /* Decimal FP Unit */
#define PPC_FEATURE_POWER6_EXT 0x00000200 /* P6 + mffgpr/mftgpr */
#define PPC_FEATURE_ARCH_2_06 0x00000100 /* ISA 2.06 */
#define PPC_FEATURE_HAS_VSX 0x00000080 /* P7 Vector Extension. */
#define PPC_FEATURE_PSERIES_PERFMON_COMPAT 0x00000040
#define PPC_FEATURE_TRUE_LE 0x00000002
#define PPC_FEATURE_PPC_LE 0x00000001
/* Feature definitions in AT_HWCAP2. */
#define PPC_FEATURE2_ARCH_2_07 0x80000000 /* ISA 2.07 */
#define PPC_FEATURE2_HAS_HTM 0x40000000 /* Hardware Transactional
Memory */
#define PPC_FEATURE2_HAS_DSCR 0x20000000 /* Data Stream Control
Register */
#define PPC_FEATURE2_HAS_EBB 0x10000000 /* Event Base Branching */
#define PPC_FEATURE2_HAS_ISEL 0x08000000 /* Integer Select */
#define PPC_FEATURE2_HAS_TAR 0x04000000 /* Target Address Register */
最佳答案
我想说getauxval()
将是最好的方法; HWCAP
和HWCAP2
值正是用于确定硬件功能的。您的列表中缺少PPC_FEATURE2_VEC_CRYPTO
,它指示 vector 加密指令的存在,这听起来像您所需要的。
附带说明:您可能不想检测处理器实现,但要检测处理器功能。具体来说,请检查单个功能,而不要尝试检查提供该功能的过程。 (例如,直接检测VEC_CRYPTO
,而不是尝试检查POWER8,并假设这意味着加密功能)。
稍微详细一点,Linux的cputable条目指定HWCAP
/HWCAP2
值。以POWER8为例:
#define COMMON_USER2_POWER8 (PPC_FEATURE2_ARCH_2_07 | \
PPC_FEATURE2_HTM_COMP | \
PPC_FEATURE2_HTM_NOSC_COMP | \
PPC_FEATURE2_DSCR | \
PPC_FEATURE2_ISEL | PPC_FEATURE2_TAR | \
PPC_FEATURE2_VEC_CRYPTO)
这来自内核中的
arch/powerpc/include/asm/cputable.h
(它还提供可以在aux vector 中设置的实际hwcap位)。最后,我相当确定您不需要成为OpenPOWER基金会成员即可下载ISA(最新版本为3.0B)-您只需要在网站上注册一个帐户即可。