你能帮我写一段代码,将生成器产量分成 100 个块,并将它们保存到更漂亮的数据库中。

$batchSize = 100;

$batch = [];
$i = 0;

/**
 * @yield array $item
 */
foreach(itemsGenerator() as $item) {
    $batch[] = $item;
    $i++;

    if ($i === $batchSize) {
        Db::table('items')->save($batch);

        $batch = [];
        $i = 0;
    }

    $cnt++;
}

if ($batch) {
     Db::table('items')->save($batch);
}

我不想在 itemsGenerator 中放入分块的逻辑

最佳答案

您可以将块逻辑放入单独的可重用函数中。

解决方案 1:每个块都是一个生成器。

https://3v4l.org/3eSQm

function chunk(\Generator $generator, $n) {
    for ($i = 0; $generator->valid() && $i < $n; $generator->next(), ++$i) {
        yield $generator->current();
    }
}

function foo() {
  for ($i = 0; $i < 11; ++$i) {
    yield $i;
  }
}

for ($gen = foo(); $gen->valid();) {
    $chunk = [];
    foreach (chunk($gen, 3) as $value) {
        $chunk[] = $value;
    }
    print json_encode($chunk) . "\n";
}

解决方案 2:每个块都是一个数组。

https://3v4l.org/aSfeR
function generator_chunks(\Generator $generator, $max_chunk_size) {
  $chunk = [];
  foreach ($generator as $item) {
    $chunk[] = $item;
    // @todo A local variable might be faster than count(), but adds clutter to the code. So using count() for this example code.
    if (count($chunk) >= $max_chunk_size) {
      yield $chunk;
      $chunk = [];
    }
  }
  if ([] !== $chunk) {
      // Remaining chunk with fewer items.
      yield $chunk;
  }
}

function generator() {
    for ($i = 0; $i < 11; ++$i) {
        yield $i;
    }
}

foreach (generator_chunks(generator(), 3) as $chunk) {
    print json_encode($chunk) . "\n";
}

现在,一个块的所有内容都将作为数组同时存在于内存中,但不是整个序列。

可能有一些方法可以让每个块像生成器一样运行。但这是另一天的不同故事。

关于php - 将生成器分成块的最佳方法,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/33730942/

10-14 01:29