一个程序,我写包含10个全球函数指针。然后,我决定将它们放在一个结构中,以查看这是否会更改调用两个函数后生成的机器代码。令我惊讶的是,使用结构的代码版本比没有结构的代码版本包含更多的两条移动指令(反汇编的所有其他行都相同)。这是某种奇怪的优化,或者根本没有编译器不知道如何消除结构成员调用的开销?我正在使用Clang 3.8作为编译器,并且正在针对x86进行编译。
结构版本:
#include GLES2/gl2.h
struct GLES2FunctionPointers {
const PFNGLCLEARCOLORPROC glClearColor;
const PFNGLCREATEPROGRAMPROC glCreateProgram;
};
struct GLES2FunctionPointers GLES2 = {
.glCreateProgram =
(PFNGLCREATEPROGRAMPROC)eglGetProcAddress("glCreateProgram"),
.glCreateShader =
(PFNGLCREATESHADERPROC)eglGetProcAddress("glCreateProgram"),
};
GL_APICALL GLuint GL_APIENTRY glCreateShader(GLenum type) {
return GLES2.glCreateShader(type);
}
GL_APICALL void GL_APIENTRY glShaderSource(GLuint shader, GLsizei count, const
GLchar *const*string, const GLint *length) {
GLES2.glShaderSource(shader, count, string, length);
}
没有结构的版本:
const PFNGLCREATESHADERPROC glCreateShaderPointer = (PFNGLCREATESHADERPROC)eglGetProcAddress("glCreateShader");
GL_APICALL GLuint GL_APIENTRY glCreateShader(GLenum type) {
return glCreateShaderPointer(type);
}
const PFNGLSHADERSOURCEPROC glShaderSourcePointer =
(PFNGLSHADERSOURCEPROC)eglGetProcAddress("glCreateProgram");
GL_APICALL void GL_APIENTRY glShaderSource(GLuint shader, GLsizei count,
const GLchar *const*string, const GLint *length) {
glShaderSourcePointer(shader, count, string, length);
}
这是正在反汇编的函数:
int prepareShader(GLuint shaderType, const char * shaderCode) {
GLuint shader = glCreateShader(shaderType);
int len = strlen(shaderCode);
glShaderSource(shader, 1, &shaderCode, &len);
return shader;
}
这是在主函数调用:
int vertexShader = prepareShader(GL_VERTEX_SHADER, VERTEX_SHADER);
//VERTEX_SHADER is a string in my code
最佳答案
结构本身没有开销。 const
结构应针对直接调用进行优化:
https://godbolt.org/g/gBNnp3
如果该结构不是const,则需要先加载指针值。如果需要填充,则符号的目标代码输出也可能略有不同(如果我尝试使用十个函数,则call1
最后会得到xchg %ax %ax
== nop
)。