本文介绍了COMPUTE()在Dask中做什么?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我是新接触DASK的,我不了解COMPUTE()方法在DASK中到底做什么?它是在调用对象的地方打印对象的方法吗?我已经阅读了其网站上的文档,但不确定是否理解了术语"具体的价值"和"懒惰的任务"。

我所说的"它是在调用对象的地方打印对象的方法吗?"就是,当我创建一个Dask对象并在Spyder控制台中调用它时,它会导致dask.array<arange, shape=(11,), dtype=int32, chunksize=(5,)>,而当我对它调用计算()方法时,它会打印该对象。

x对象是通过以下代码创建的:

x = da.arange(11, chunks=5)

推荐答案

有关此主题的简单介绍,请参阅https://towardsdatascience.com/why-every-data-scientist-should-use-dask-81b2b850e15b(查找使用DASK进行并行处理一章)。

第一步是准备计算图

computation_graph = sum_list([square(i) for i in items])
上述说明仅创建了如何执行计算,但尚未开始实际计算。

下面是下一条指令:

print("Result", computation_graph.compute())

开始计算的,因为它在打印内说明,我们还演示了计算是如何运行的。

因此使用Dask通常需要4个步骤:

  • 获取(读取)源数据。
  • 准备应计算的配方。
  • 开始计算(仅执行计算)。
  • "消费"计算结果(完成后)。

这篇关于COMPUTE()在Dask中做什么?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

11-01 18:49