我正在尝试遍历Python Pandas数据框的行。在数据帧的每一行中,我试图通过其列名引用行中的每个值。

这是我所拥有的:

import numpy as np
import pandas as pd

df = pd.DataFrame(np.random.rand(10,4),columns=list('ABCD'))
print df
          A         B         C         D
0  0.351741  0.186022  0.238705  0.081457
1  0.950817  0.665594  0.671151  0.730102
2  0.727996  0.442725  0.658816  0.003515
3  0.155604  0.567044  0.943466  0.666576
4  0.056922  0.751562  0.135624  0.597252
5  0.577770  0.995546  0.984923  0.123392
6  0.121061  0.490894  0.134702  0.358296
7  0.895856  0.617628  0.722529  0.794110
8  0.611006  0.328815  0.395859  0.507364
9  0.616169  0.527488  0.186614  0.278792

我使用this approach进行迭代,但这仅提供了部分解决方案-,在每次迭代中选择一行后,如何通过列名称访问行元素?

这是我正在尝试做的事情:
for row in df.iterrows():
    print row.loc[0,'A']
    print row.A
    print row.index()

我的理解是,该行是Pandas series。但是我无法索引该系列。

在遍历行的同时可以使用列名吗?

最佳答案

我也喜欢itertuples()

for row in df.itertuples():
    print(row.A)
    print(row.Index)

由于row是一个命名的元组,因此,如果您要访问每行上的值,则应为更快

速度运行:
df = pd.DataFrame([x for x in range(1000*1000)], columns=['A'])
st=time.time()
for index, row in df.iterrows():
    row.A
print(time.time()-st)
45.05799984931946

st=time.time()
for row in df.itertuples():
    row.A
print(time.time() - st)
0.48400020599365234

关于python - Python Pandas遍历行并访问列名,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43619896/

10-12 17:04
查看更多