1 我们知道MATLAB支持并行运行一般有四种模式:
第一种模式:本机调用多核CPU性能并行运算
第二种模式:本机调用GPU性能并行运算
第三种模式:多计算机组成集群,调用集群CPU性能并行运算
第四种模式:运用MATLAB提供的云计算服务。
2 在第一种并行运算模式中:
标准模式为:
第一步:打开并行池parpool
第二步:parfor等相关PCT,并行计算工具箱中函数
第三步:关闭并行池
3 第一步:打开并行池的方式:
1)p = parpool('local',2); % 在知道有几个本地核的情况下,选择调用几个核进行并行运算。
2)parpool; % 这是直接打开并行池的方式。
备注:建议采用第一种,方便关闭和更改参数。
第二步:parfor函数的问题:
1)很多简单的低纬度运算,建议只需要用普通函数和关键字即可,用parfor函数进行运算并不能提升性能。
2)MATLAB利用多核心的计算能力来加速计算时非常有必要的,因为目前所有的电脑最少都双核心了。
3)循环并行使用parfor循环代替for循环,但是很多时候parfor很不好用,当parfor循环体内的代码比较多时,非常不容易满足循环条件而失败。因此我们首先要分析代码,另一种方式用profiler打开代码分析器来分析代码那一部分耗时较大,进行代码分析。
3)通用格式:
parfor ss = 1:100
XXX
......
......
end
4)通用并行计算模板:其基本思路就是将循环体内代码打包为函数!
parfor ss=1:100
func(ss,...,...);
end
函数如下所示:
function func(ss,...,...)
xxx
.....
.....
end
备注:该函数不应该有返回值,当parfor循环体内计算结果需要返回主函数时(绝大多数情况是这样的),那么将结果在循环体内保存为文件,文件名与循环变量ss有关。当parfor的并行运行完之后,将保存的临时文件读取进来即可,保存和读取计算结果相比于大型的计算耗时来讲应该小很多,从而体现出并行的优势。所提供的该方法可以用于任何一维、二维或者多维循环的加速计算,采用这种方法,规避了学习parofr规则的所有难点,非常具有通用性。
第三步:删除并行池参数关闭
delete(p)
举个例子:比如有这么一段并行计算代码,其中绿色标注的位置为循环体。
p = parpool('local',2);
tic
n = 200;
A = 500;
a = zeros(n);
parfor i = 1:n
a(i) = max(abs(eig(rand(A))));
end
toc
delete(p)
当然这个循环体内可以有不同的计算队列,我们把这个队列封装成为一个函数,如下:
function [a] = sample(A)
a = max(abs(eig(rand(A))));
end
然后再用parpool调用,如下:
p = parpool('local',2);
clear;
tic
n = 200;
A = 500;
a = zeros(n);
parfor i = 1:n
b = sample(A);
a(i) = b;
end
clear b;
toc
delete(p);
时间已过 28.838599 秒。
对比原先的代码:
tic
n = 200;
A = 500;
a = zeros(n);
for i = 1:n
a(i) = max(abs(eig(rand(A))));
end
toc
时间已过 42.570194 秒。
4 MATLAB并行计算的提升有限和MATLAB语言的效率有关,并且和处理的数据量和计算复杂度有关。