从异构计算讲起
异构计算是一种利用多种不同类型的计算资源来协同解决计算问题的方法。它的核心思想是将不同特性和能力的计算设备(例如CPU、GPU、FPGA等)组合在一起,以充分发挥它们在不同类型的工作负载和任务中的优势。
传统的计算模型通常依赖于单一类型的处理器,如中央处理器(CPU)。然而,CPU在处理一些并行、高计算密集度的任务时可能效率较低。与此相反,图形处理器(GPU)通常对并行计算和图形处理具有出色的性能。现代计算资源种类繁多,每种资源都具有独特的优势和特性。通过将这些异构计算资源组合在一起,可以实现更高效、更灵活的计算。
在异构计算中,任务可以根据其特性和需求进行分类,并分配给最适合执行该任务的计算资源。例如,一些串行的、控制流程较强的任务可以由CPU执行,而一些需要大规模并行处理的任务可以由GPU执行。通过合理分配和利用计算资源,可以实现更高的计算性能和效率。
异构计算也可以用于优化能源效率。由于不同类型的计算设备在功耗和性能方面的差异,可以根据任务的要求将计算负载分配到最节能的设备上,以提高能源利用效率。
在实践中,异构计算需要合适的编程模型和工具来管理和调度不同类型的计算资源。例如,OpenCL和CUDA是广泛使用的异构计算编程框架,它们提供了丰富的API和工具来实现跨不同设备和计算资源的并行计算。
总而言之,异构计算利用不同类型的计算资源的特点和优势,通过合理分配和协同使用这些资源,实现更高的计算性能、能源效率和灵活性。它在许多领域,如科学计算、机器学习、图形渲染等都得到了广泛的应用。
opencl安装的相关说明
在使用OpenCL时,您有两种选择:
使用默认的OpenCL运行时和驱动程序:许多操作系统都内置了默认的OpenCL运行时和驱动程序,您可以直接使用这些默认的运行时和驱动程序来编译和运行OpenCL应用程序。在这种情况下,您不需要额外的SDK。
安装特定硬件厂商提供的OpenCL SDK:如果您的系统不提供默认的OpenCL运行时和驱动程序,或者您希望使用特定硬件厂商提供的最新版本运行时和驱动程序,那么可以安装相应厂商提供的OpenCL SDK。这些SDK通常包含供开发人员使用的库、头文件、示例代码和调试工具。
无论您选择使用哪种方式,都可以使用相应的OpenCL库和头文件来编写和编译OpenCL应用程序。当您编译和链接OpenCL应用程序时,编译器会在系统中查找OpenCL运行时和驱动程序,并将其与应用程序进行连接。
OpenCL是一个开放的跨平台标准,旨在提供一种统一的编程模型,以便将并行计算任务在各种不同的计算设备上进行执行,包括CPU、GPU、DSP、FPGA等。
OpenCL的设计使得开发人员可以编写一次代码,并在支持OpenCL的不同平台上运行,而不需要对每个平台编写特定的代码。这种可移植性使得OpenCL成为许多异构系统、超级计算机和嵌入式系统中的首选并行编程模型。
虽然特定硬件厂商提供的OpenCL SDK可能包含额外的工具和优化,但OpenCL的核心标准和函数接口是跨平台的,并且可以在没有特定SDK的情况下进行开发和编译。因此,您可以在不同平台上使用相同的OpenCL代码,只需使用适当的OpenCL运行时和驱动程序即可。
查看linux系统cpu及gpu型号方法
查看cpu:
lscpu
查看gpu:
先安装相关软件包:
sudo apt-get install pciutils
再列出详细的显卡信息:
lspci | grep -i vga
安装opencl
查看是否已安装opencl:
clinfo
如没有:
sudo apt-get install intel-opencl-icd
如失败,手动安装:
根据intel cpu的相关型号:
https://www.intel.com/content/www/us/en/developer/tools/opencl-sdk/choose-download.html?wapkw=Intel%C2%AE%20SDK%20for%20OpenCL%E2%84%A2%20Applications
安装依赖:
sudo apt-get install cpio
安装:
sudo tar xvf /work/intel_sdk_for_opencl_applications_2020.3.494.tar.gz
sudo /work/intel_sdk_for_opencl_applications_2020.3.494/install.sh
按照指令安装完成。
通过下列命令,可看到安装效果:
find / -name libOpenCL.so
helloword程序运行
对应cmakelist:
cmake_minimum_required(VERSION 3.5)
project(fangdou)
FIND_PACKAGE(OpenMP REQUIRED)
if(OPENMP_FOUND)
message("OPENMP FOUND")
set(CMAKE_C_FLAGS "${CMAKE_C_FLAGS} ${OpenMP_C_FLAGS}")
set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} ${OpenMP_CXX_FLAGS}")
set(CMAKE_EXE_LINKER_FLAGS "${CMAKE_EXE_LINKER_FLAGS} ${OpenMP_EXE_LINKER_FLAGS}")
endif()
include_directories(${BW_SUB_LIB_ROOT_DIR}/include
/opt/intel/system_studio_2020/opencl/SDK/include
)
SET(OpenCV_DIR /usr/local/lib/cmake/opencv4/)
FIND_PACKAGE(OpenCV REQUIRED)
file(GLOB_RECURSE cpp_srcs ${CMAKE_SOURCE_DIR}/src/*.cpp ${CMAKE_SOURCE_DIR}/src/*.cc ${CMAKE_SOURCE_DIR}/src/*.h)
link_directories(
/usr/myffmpg/lib/
/usr/lib/x86_64-linux-gnu/
)
add_executable(${PROJECT_NAME} ${cpp_srcs})
target_link_libraries(${PROJECT_NAME} PRIVATE ${OpenCV_LIBS} avcodec avformat avutil swscale avfilter OpenCL)
对应的cpp文件:
#include <stdio.h>
#include <stdlib.h>
#include <CL/cl.h>
#define MAX_PLATFORMS 10
#define MAX_DEVICES 10
int main() {
cl_platform_id platforms[MAX_PLATFORMS];
cl_device_id devices[MAX_DEVICES];
cl_uint num_platforms, num_devices;
cl_context context;
cl_command_queue command_queue;
cl_program program;
cl_kernel kernel;
cl_int ret;
// 获取平台数量
ret = clGetPlatformIDs(MAX_PLATFORMS, platforms, &num_platforms);
if (ret != CL_SUCCESS) {
printf("Failed to get platform IDs\n");
return -1;
}
printf("Number of platforms: %u\n", num_platforms);
// 遍历打印平台信息
for (cl_uint i = 0; i < num_platforms; i++) {
char platform_name[128];
char platform_vendor[128];
ret = clGetPlatformInfo(platforms[i], CL_PLATFORM_NAME, sizeof(platform_name), platform_name, NULL);
if (ret != CL_SUCCESS) {
printf("Failed to get platform name for platform %u\n", i);
}
ret = clGetPlatformInfo(platforms[i], CL_PLATFORM_VENDOR, sizeof(platform_vendor), platform_vendor, NULL);
if (ret != CL_SUCCESS) {
printf("Failed to get platform vendor for platform %u\n", i);
}
printf("Platform %u:\n", i);
printf(" Name: %s\n", platform_name);
printf(" Vendor: %s\n", platform_vendor);
printf("\n");
}
// 获取设备数量
ret = clGetDeviceIDs(platforms[0], CL_DEVICE_TYPE_CPU, MAX_DEVICES, devices, &num_devices);
if (ret != CL_SUCCESS) {
printf("Failed to get device IDs\n");
return -1;
}
// 创建OpenCL上下文
context = clCreateContext(NULL, num_devices, devices, NULL, NULL, &ret);
if (ret != CL_SUCCESS) {
printf("Failed to create context\n");
return -1;
}
// 创建命令队列
command_queue = clCreateCommandQueue(context, devices[0], 0, &ret);
if (ret != CL_SUCCESS) {
printf("Failed to create command queue\n");
return -1;
}
// 定义和构建OpenCL内核
const char *kernel_source = "__kernel void hello_world() {\n"
" printf(\"Hello, World!\\n\");\n"
"}\n";
program = clCreateProgramWithSource(context, 1, &kernel_source, NULL, &ret);
if (ret != CL_SUCCESS) {
printf("Failed to create program\n");
return -1;
}
ret = clBuildProgram(program, num_devices, devices, NULL, NULL, NULL);
if (ret != CL_SUCCESS) {
printf("Failed to build program\n");
return -1;
}
// 创建OpenCL内核对象
kernel = clCreateKernel(program, "hello_world", &ret);
if (ret != CL_SUCCESS) {
printf("Failed to create kernel\n");
return -1;
}
// 执行内核函数
ret = clEnqueueTask(command_queue, kernel, 0, NULL, NULL);
if (ret != CL_SUCCESS) {
printf("Failed to enqueue task\n");
return -1;
}
// 等待执行完成
ret = clFinish(command_queue);
if (ret != CL_SUCCESS) {
printf("Failed to finish execution\n");
return -1;
}
printf("Kernel executed successfully\n");
// 清理资源
ret = clReleaseKernel(kernel);
ret = clReleaseProgram(program);
ret = clReleaseCommandQueue(command_queue);
ret = clReleaseContext(context);
return 0;
}
打印内容如下:
Number of platforms: 1
Platform 0:
Name: Intel(R) CPU Runtime for OpenCL(TM) Applications
Vendor: Intel(R) Corporation
Hello, World!
Kernel executed successfully