本文介绍了 pandas get_group导致内存错误的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我创建了一个分组数据框,如下所示:

I have a grouped dataframe created like so:

my_gb = pandas.read_csv(filepath_or_buffer=my_file_path,
                        delimiter='\t').groupby(['col1', 'col2', 'col3', 'col4'])

然后我呼叫get_group:

my_row = my_gb.get_group((val1, val2, val3, val4))

并获得一个MemoryError.

IIUC,这只会返回一行视图(在我的数据集中)-这怎么会导致内存错误?

IIUC, this only returns a view of one row (in my dataset) - how can this cause a memory error?

推荐答案

无法正常工作,所以我自己进行了分组:

Couldn't get this to work so I did the grouping myself:

data = pandas.read_csv(filepath_or_buffer=my_file_path, delimiter='\t')
grouped = {}
for key, value in data.iterrows():
    grouped[(value['col1'], value['col2'], value['col3'], value['col4'])] = value

这篇关于 pandas get_group导致内存错误的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

08-21 03:49