我已经将一个简单的查询日志导入到Python中的pandas数据框中(请参见图片),并且想知道最有效的方法是提取所有包含“关键字”列中包含任何给定关键字的行。

我可以遍历数据框-但是感觉使用数组/掩码可能会有更快的方法。

任何帮助,不胜感激。

最佳答案

您可以使用str.contains,例如:

In [1]: df = pd.DataFrame([['abc', 1], ['cde', 2], ['efg', 3]])

In [2]: df
Out[2]:
     0  1
0  abc  1
1  cde  2
2  efg  3

In [3]: df[0].str.contains('c')
Out[3]:
0     True
1     True
2    False
Name: 0, dtype: bool

In [4]: df[df[0].str.contains('c')]
Out[4]:
     0  1
0  abc  1
1  cde  2

关于python - 在Python中提取Pandas数据框的行,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/16710999/

10-16 12:57
查看更多