我在 matlab 中处理非常大的数据,并用于将这些数据存储在矩阵中。我曾经按行存储我的数据,但由于 Matlab 按列存储数据,我知道重塑我的矩阵以便按列索引可以使处理速度更快。这是我的意思的一个例子:

一般参数

nbr_channels = 20;
nbr_samples_per_channel = 3200000;
fake_data = randn(1, nbr_samples_per_channel);
ROI = 1200000 : 2800000;

按行分配数据
data = nan(nbr_channels, nbr_samples_per_channel);
tic;
for j = 1 : nbr_channels
    data(j, 1:nbr_samples_per_channel) = fake_data;
end;
toc;

% Elapsed time is 1.476525 seconds.

从行矩阵返回数据
tic;
for j = 1 : nbr_channels
    bla = data(j, ROI);
end;
toc;

% Elapsed time is 0.572162 seconds.

返回行矩阵中的所有数据
tic;
for j = 1 : nbr_channels
    bla = data(j, :);
end;
toc;

% Elapsed time is 0.589489 seconds.

按列 分配数据
data = nan(nbr_samples_per_channel, nbr_channels);
tic;
for j = 1 : nbr_channels
    data(1:nbr_samples_per_channel, j) = fake_data;
end;
toc;

% Elapsed time is 0.299682 seconds.

从列矩阵返回数据
tic;
for j = 1 : nbr_channels
    bla = data(ROI, j);
end;
toc;

% Elapsed time is 0.260824 seconds.

返回列矩阵中的所有数据
tic;
f    or j = 1 : nbr_channels
    bla = data(:, j);
end;
toc;

% Elapsed time is 0.092983 seconds.

摘要第 1 部分:

正如我们所见,按列访问数据将处理时间至少减少了两倍!

但我不明白为什么细胞更有效!看看这个例子:

按单元格分配数据
data = cell(1, nbr_samples_per_channel);
tic;
for j = 1 : nbr_channels
    data{j} = fake_data;
end;
toc;

% Elapsed time is 0.000013 seconds.

从元胞数组返回数据
tic;
for j = 1 : nbr_channels
    bla = data{j}(ROI);
end;
toc;

% Elapsed time is 0.260294 seconds.

从元胞数组中返回所有数据
tic;
for j = 1 : nbr_channels
    bla = data{j};
end;
toc;

% Elapsed time is 0.000022 seconds.

%%

摘要第 2 部分:

这比我在第 1 部分中显示的要快几个数量级。

问题 1

为什么访问存储在单元格中的数据的时间比存储在矩阵中的时间短?

问题 2

使用矩阵通常比使用单元更容易,因为使用矩阵可以做到
my_matrix(100:20000, 1:3)
但是对于细胞,我不能这样做(据我所知)。关于如何同时从多个单元格返回特定元素的任何替代方法?

最佳答案

你看到不同的时间,因为你没有做同样的事情。要比较您的两个案例:

按单元格分配数据

  • 您正在创建一个元胞数组行向量,并将长双向量填充到每个元胞中
  • 每次循环迭代都会将向量 1 次分配到元胞数组中的单个槽中
  • 有 'nbr_samples_per_channel' 正在完成的分配数量。

  • 按列 分配数据
  • 您正在遍历矩阵的列,并为每列中的每个元素分配一个向量
  • 每次循环迭代,无论您使用的是什么简写冒号 : 符号,都会解析为许多赋值。 data(1:nbr_samples_per_channel, j) 表示 'nbr_samples_per_channel' 分配 PER 迭代。
  • 总体而言,您正在执行 'nbr_samples_per_channel' * 'nbr_channels' 总分配。

  • 为了说明我的观点,只需重新编写没有冒号运算符的循环即可将所有赋值可视化。
    for j = 1 : nbr_channels
    
        n = length(fake_data)
    
        data(1,     j) = fake_data(1);
        data(2,     j) = fake_data(1);
    
        ... etc ...
    
        data(n - 1, j) = fake_data(n-1);
        data(n,     j) = fake_data(n);
    
    end
    

    因此,总而言之,您正在比较两种不同的事物,因此您不能说一个真的比另一个快,因为它们并不等效。

    如果你只是循环一个双数组和一个元胞数组,并进行常规赋值......
    %% Setup samples and pre-allocate
    numberOfSamples = 100000;
    
    doubleData = nan(numberOfSamples, 1);
    cellData = cell(numberOfSamples, 1);
    
    randomValues = rand(numberOfSamples, 1);
    
    %% Assign N number of values to a double array
    tic;
    for idx = 1 : numberOfSamples
        data(numberOfSamples) = randomValues(idx);
    end
    doubleTime = toc;
    
    %% Assign N number of values to a cell array
    tic;
    for idx = 1 : numberOfSamples
        cellData{numberOfSamples} = randomValues(idx);
    end
    cellTime = toc;
    
    disp(sprintf('Double Array: %f seconds', doubleTime));
    disp(sprintf('Cell   Array: %f seconds', cellTime));
    

    你最终得到:
    Double Array: 0.006073 seconds
    Cell   Array: 0.032966 seconds
    

    对于你的第二个问题,这是你想要做的吗?
    >> bigCell = {1 2 3 4; 5 6 7 8; 9 10 11 12; 13 14 15 16}
    
    bigCell =
    
        [ 1]    [ 2]    [ 3]    [ 4]
        [ 5]    [ 6]    [ 7]    [ 8]
        [ 9]    [10]    [11]    [12]
        [13]    [14]    [15]    [16]
    
    >> subCell = bigCell(1:2, 3:4)
    
    subCell =
    
        [3]    [4]
        [7]    [8]
    

    请注意,子单元仍然是一个单元。通过使用 ( ) 而不是 { } 来访问单元格,您可以将其保留为单元格。

    关于performance - 为什么访问存储在单元格中的数据的时间比存储在矩阵中的时间短?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/8066077/

    10-12 16:39
    查看更多