我想编写一个程序,为我计算图片(实际上是空间光调制器(SLM)的全息图)。这应该实时发生。图片应在GPU上计算,然后从那里直接显示在屏幕上(800x600像素)。我想使用cuda和OpenGL。我自己编写了一个小程序,这只是一个在屏幕上显示棋盘的示例。它不起作用,因为我不知道如何将图片从cuda传递到OpenGL。特别是我不知道什么是图像识别。我该如何声明。如何将计算的图片分配给它?
这是我的代码:
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include <stdio.h>
#include <GL\glew.h>
#include <GL\freeglut.h>
#include "cuda_gl_interop.h"
/* Create checkerboard texture */
#define checkImageWidth 1024
#define checkImageHeight 1024
#define SIZE_X 1024
#define SIZE_Y 1024
static GLubyte checkImage[ 1024 ][ 1024 ][ 1 ];
/*static GLubyte checkImage[1024][1024][1];*/
static GLuint texName;
// Texture reference for 2D float texture
float tex[ 1024 ][ 1024 ];
float dA[ 1024 * 1024 ];
// 2D float texture
texture<float, cudaTextureType2D, cudaReadModeElementType> texRef;
float *d_A;
size_t dsize = 1024 * 1024 * sizeof( float );
struct mystruct
{
int x;
int y;
};
void makeCheckImage( void )
{
int i, j, c;
for( i = 0; i < 600; i++ )
{
for( j = 0; j < 800; j++ )
{
c = ( ( ( ( i % 2 ) == 0 ) ) ^ ( j % 2 == 0 ) ) * 255;
checkImage[ i ][ j ][ 0 ] = (GLubyte)c;
}
}
}
__global__ void cudaMakeCheckImage( float *c )
{
int col = threadIdx.x + blockIdx.x * blockDim.x;
int row = threadIdx.y + blockIdx.y * blockDim.y;
int index = col + row * 1024;
if( col < 1024 && row < 1024 )
{
c[ index ] = ( ( ( ( col % 2 ) == 0 ) ) ^ ( row % 2 == 0 ) ) * 255;
}
}
void init( void )
{
glClearColor( 0.0, 0.0, 0.0, 0.0 );
glShadeModel( GL_FLAT );
glEnable( GL_DEPTH_TEST );
cudaMakeCheckImage << <1024, 1024 >> > ( d_A );
glPixelStorei( GL_UNPACK_ALIGNMENT, 1 );
//makeCheckImage();
glGenTextures( 1, &texName );
glBindTexture( GL_TEXTURE_2D, texName );
// set basic parameters
glTexParameteri( GL_TEXTURE_2D, GL_TEXTURE_WRAP_S, GL_NEAREST );
glTexParameteri( GL_TEXTURE_2D, GL_TEXTURE_WRAP_T, GL_NEAREST );
glTexParameteri( GL_TEXTURE_2D, GL_TEXTURE_MAG_FILTER, GL_NEAREST );
glTexParameteri( GL_TEXTURE_2D, GL_TEXTURE_MIN_FILTER, GL_NEAREST );
// Create texture data
glTexImage2D( GL_TEXTURE_2D, 0, GL_RGB, checkImageWidth, checkImageHeight, 0, GL_LUMINANCE, GL_UNSIGNED_BYTE, checkImage );
// Unbind the texture
glBindTexture( GL_TEXTURE_2D, 0 );
cudaMalloc( &d_A, dsize );
cudaGraphicsResource* Res;
// Allocate CUDA array in device memory
cudaChannelFormatDesc channelDesc = cudaCreateChannelDesc( 32, 0, 0, 0, cudaChannelFormatKindFloat );
cudaArray* CuArr;
cudaMallocArray( &CuArr, &channelDesc, 1024, 1024 );
cudaError_t eError = cudaGraphicsGLRegisterImage( &Res, texName, GL_TEXTURE_2D, cudaGraphicsMapFlagsWriteDiscard );
cudaGraphicsMapResources( 1, &Res, 0 );
cudaMemcpy2DToArray( CuArr, 0, 0, d_A, 1024, 1024, 1024, cudaMemcpyDeviceToDevice );
cudaGraphicsSubResourceGetMappedArray( &CuArr, Res, 0, 0 );
cudaGraphicsUnmapResources( 1, &Res, 0 );
}
void display( void )
{
glClear( GL_COLOR_BUFFER_BIT | GL_DEPTH_BUFFER_BIT );
glEnable( GL_TEXTURE_2D );
glTexEnvf( GL_TEXTURE_ENV, GL_TEXTURE_ENV_MODE, GL_DECAL );
glBindTexture( GL_TEXTURE_2D, texName ); /* binds texname wit active textureunit */
glBegin( GL_QUADS );
glTexCoord2f( 1.0 * 800 / 1024, 1.0 * 600 / 1024 ); glVertex2f( 1.0, 1.0 );
glTexCoord2f( 1.0 * 800 / 1024, 0.0 ); glVertex2f( 1.0, -1.0 );
glTexCoord2f( 0.0, 0.0 ); glVertex2f( -1.0, -1.0 );
glTexCoord2f( 0.0, 1.0 * 600 / 1024 ); glVertex2f( -1.0, 1.0 );
glEnd();
glFlush();
glBindTexture( GL_TEXTURE_2D, 0 ); /* unbinds texname with active textureunit ?? */
glDisable( GL_TEXTURE_2D );
}
void keyboard( unsigned char key, int x, int y )
{
switch( key )
{
case 27:
exit( 0 );
break;
default:
break;
}
}
int main( int argc, char** argv )
{
glutInit( &argc, argv );
glutInitDisplayMode( GLUT_SINGLE | GLUT_RGB | GLUT_DEPTH | GLUT_BORDERLESS | GLUT_CAPTIONLESS );
glutInitWindowSize( 800, 600 );
glutInitWindowPosition( 100, 100 );
glutCreateWindow( argv[ 0 ] );
cudaSetDevice( 0 );
cudaGLSetGLDevice( 0 );
init();
glutDisplayFunc( display );
glutKeyboardFunc( keyboard );
glutMainLoop();
return 0;
}
这是正确的方法吗?还是我必须使用帧缓冲区。我其实不想。我想让它尽可能简单。我必须进行哪些更改才能使其正常工作?
最佳答案
我认为您可以查看DRM / DRI或Linux平面帧缓冲区。您可以参考DirectFB项目http://www.webos-internals.org/wiki/Directfb。为此,您将需要fbDev0模块,并可能需要使用该模块重新编译内核。我假设您正在使用linux。
因此,您要在此处尝试绕过整个API层,而直接尝试操纵帧缓冲区。 DRM是内核中的模块,用于管理对GPU资源的访问,因此您可以使用它。
在Windows上,您可以编写直接写入frambuffer的微型筛选器驱动程序,也可以使用http://www.blackhat.com/presentations/win-usa-04/bh-win-04-butler.pdf之类的东西。这是直接内核对象操纵。
关于c++ - 用cuda计算图片并直接用OpenGL显示,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/52369196/