问题描述
我有一本这样的字典:
d = {'Caps': 'cap_list', 'Term': 'unique_tokens', 'LocalFreq': 'local_freq_list','CorpusFreq': 'corpus_freq_list'}
我想要从中创建一个dask数据框。我该怎么做?通常,在Pandas中,可以通过以下方式轻松将其导入到Pandas df:
I want to create a dask dataframe from it. How do I do it? Normally, in Pandas, is can be easily imported to a Pandas df by:
df = pd.DataFrame({'Caps': cap_list, 'Term': unique_tokens, 'LocalFreq': local_freq_list,
'CorpusFreq': corpus_freq_list})
我应该先装入一个袋子,然后再从袋子转换为ddf吗?
Should I first load into a bag and then convert from bag to ddf?
推荐答案
如果您的数据适合记忆,然后鼓励您使用Pandas代替Dask Dataframe。
If your data fits in memory then I encourage you to use Pandas instead of Dask Dataframe.
如果出于某些原因您仍想使用Dask数据框,则可以将其转换为Pandas数据框,然后使用 dask.dataframe.from_pandas
函数。
If for some reason you still want to use Dask dataframe then I would convert things to a Pandas dataframe and then use the dask.dataframe.from_pandas
function.
import dask.dataframe as dd
import pandas as pd
df = pd.DataFrame(...)
ddf = dd.from_pandas(df, npartitions=20)
但是在很多情况下,这比仅使用熊猫慢一些。
But there are many cases where this will be slower than just using Pandas well.
这篇关于从字典创建一个dask数据框的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!