你能帮我写一段代码,将生成器产量分成 100 个块,并将它们保存到更漂亮的数据库中。
$batchSize = 100;
$batch = [];
$i = 0;
/**
* @yield array $item
*/
foreach(itemsGenerator() as $item) {
$batch[] = $item;
$i++;
if ($i === $batchSize) {
Db::table('items')->save($batch);
$batch = [];
$i = 0;
}
$cnt++;
}
if ($batch) {
Db::table('items')->save($batch);
}
我不想在
itemsGenerator
中放入分块的逻辑 最佳答案
您可以将块逻辑放入单独的可重用函数中。
解决方案 1:每个块都是一个生成器。
https://3v4l.org/3eSQm
function chunk(\Generator $generator, $n) {
for ($i = 0; $generator->valid() && $i < $n; $generator->next(), ++$i) {
yield $generator->current();
}
}
function foo() {
for ($i = 0; $i < 11; ++$i) {
yield $i;
}
}
for ($gen = foo(); $gen->valid();) {
$chunk = [];
foreach (chunk($gen, 3) as $value) {
$chunk[] = $value;
}
print json_encode($chunk) . "\n";
}
解决方案 2:每个块都是一个数组。
https://3v4l.org/aSfeR
function generator_chunks(\Generator $generator, $max_chunk_size) {
$chunk = [];
foreach ($generator as $item) {
$chunk[] = $item;
// @todo A local variable might be faster than count(), but adds clutter to the code. So using count() for this example code.
if (count($chunk) >= $max_chunk_size) {
yield $chunk;
$chunk = [];
}
}
if ([] !== $chunk) {
// Remaining chunk with fewer items.
yield $chunk;
}
}
function generator() {
for ($i = 0; $i < 11; ++$i) {
yield $i;
}
}
foreach (generator_chunks(generator(), 3) as $chunk) {
print json_encode($chunk) . "\n";
}
现在,一个块的所有内容都将作为数组同时存在于内存中,但不是整个序列。
可能有一些方法可以让每个块像生成器一样运行。但这是另一天的不同故事。
关于php - 将生成器分成块的最佳方法,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/33730942/