我试图理解为什么saveAll具有比Spring Data存储库中的保存更好的性能。我正在使用CrudRepository,可以看到here

为了进行测试,我创建了10k个实体并将其添加到列表中,这些实体只有一个id和一个随机字符串(对于基准测试,我将该字符串保持恒定)。遍历我的列表并在每个元素上调用.save,花了40秒。在2秒钟内完成对同一整个列表的调用.saveAll。甚至用30k元素调用.saveAll都花了4秒。在执行每个测试之前,我确保截断表。即使将.saveAll调用分批处理到50个子列表中,也要花费10秒和30k。

带有整个列表的简单.saveAll似乎是最快的。

我尝试浏览Spring Data源代码,但是this是我发现的唯一有价值的东西。在这里,看来.saveAll只是简单地遍历整个Iterable并像我一样在每个cc上调用.save。那怎么快呢?它在内部进行一些事务批处理吗?

最佳答案

我不得不猜测,如果没有您的代码,我相信这与在save情况下为保存的每个对象创建新事务相对于在saveAll情况下打开一个事务的开销有关。

请注意savesaveAll的定义,它们均用@Transactional注释。如果您的项目配置正确(由于将实体保存到数据库而导致的情况似乎如此),则意味着只要调用这些方法之一就将创建事务。如果您在循环中调用save,这意味着每次调用save都会创建一个新的事务,但是对于saveAll来说,只有一个调用,因此无论实体数量是多少,都会创建一个事务保存。

我假设测试本身不是在事务内运行,如果要在事务内运行,则所有保存调用都将在该事务内运行,因为默认事务传播为Propagation.REQUIRED,这意味着如果存在如果事务已经打开,则将在其中运行调用。如果您打算使用弹簧数据,我强烈建议您阅读有关transaction management in Spring的信息。

10-06 12:51