我必须在 matlab 中用非常大的矩阵进行计算。我已经确保在可能的情况下使用矩阵运算等。现在尝试微调。
所以让 A、B、C 和 D 是矩阵:
C=A*B;
D=cos(C);
以下内容会更快(如果我错了,请纠正我)似乎微不足道:
D=cos(A*B)
我的问题是,如果有更多预定义对象的调用,这样做会更快:
D=f1(A*B) + f2(A*B) + …;
而不是预定义 C=A*B (这将节省我假设的大量计算)。我有很多这种表达式,所以一些一般性的见解会很有用(至少要知道它取决于什么样的参数,即矩阵大小)。
最佳答案
从经验中我知道改变:
y = f1(A*B) + f2(A*B)...
至
C = A*B;
y = f1(C) + f2(C)...
当您有优化代码的场景时,速度会更快 - 其中对中间变量“C”的操作如上所述多次完成。
当操作仅完成一次时,它不太可能产生性能改进或降级,因为我认为该操作是在将变量传递给函数之前由 Matlab 内联完成的。
为了帮助证明这一点,您可以查看下面的基准函数,该函数测试对变量 A 和 B 的单个和多个操作 (3)。
底部的图显示了结果,与上面的点一致
function benchmark
% test array
testArray = 100:100:5000; % 5000 will take quite a while - to test start with smaller (e.g. 500)
% preallocate
sep=zeros(numel(testArray),1);
inline=sep;
sepcombined = sep;
inlinecombined = sep;
fcnSep1 = @() sepfcn;
fcnInline1 = @() inlinefcn;
fcnSep2 = @() sepfcn2;
fcnInline2 = @() inlinefcn2;
% set up array counter
count = 1;
% run throuh all tests
for i=testArray
% create A&B
A = zeros(i,i)+2;
B = A+1;
% run single actions
sep(count) = timeit (fcnSep1);
inline(count) = timeit (fcnInline1);
% combined actions
sepcombined(count) = timeit (fcnSep2);
inlinecombined(count) = timeit (fcnInline2);
% increment the counter
count = count + 1;
% monitor progress
disp ( i );
end
% use nested functions for the actions
function sepfcn
C = A*B;
sum(C);
end
function inlinefcn
sum(A*B);
end
function sepfcn2
C = A*B;
sum(C)+max(C)+min(C);
end
function inlinefcn2
sum(A*B)+max(A*B)+min(A*B);
end
%% plot the results
figure;
subplot ( 2, 1, 1 );
plot ( testArray, sep, 'r-', testArray, inline,'b-' );
legend ( 'sep', 'inline' )
title ( 'single action' );
ylabel ( 'time (s)' )
xlabel ( 'matrix size' )
subplot ( 2, 1, 2 );
plot ( testArray, sepcombined, 'r-', testArray, inlinecombined,'b-' );
legend ( 'sep', 'inline' )
title ( 'multiple actions' );
xlabel ( 'matrix size' )
ylabel ( 'time (s)' )
end
关于Matlab:什么更快?是否预先定义有用的对象?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/34191486/