我有这种格式的熊猫数据框
0 or LIST requests
1 us-west-2
2 1.125e-05
3 0
4 3.032e-05
5 0
6 7.28e-06
7 or LIST requests
8 3.1e-07
9 0
10 0
11 1.067e-05
12 0.00011983
13 0.1075269
14 or LIST requests
15 us-west-2
16 0
17 2.88e-06
18 ap-northeast-2
19 5.52e-06
20 6.15e-06
21 3.84e-06
22 or LIST requests
我想用熊猫中的0替换所有非数字单元格。我在尝试这样的事情,但没什么用,
training_data['usagequantity'].replace({'^([A-Za-z]|[0-9]|_)+$': 0}, regex=True)
任何提示我如何做到这一点:
最佳答案
安装程序
import pandas as pd
from StringIO import StringIO
text = """0 or LIST requests
1 us-west-2
2 1.125e-05
3 0
4 3.032e-05
5 0
6 7.28e-06
7 or LIST requests
8 3.1e-07
9 0
10 0
11 1.067e-05
12 0.00011983
13 0.1075269
14 or LIST requests
15 us-west-2
16 0
17 2.88e-06
18 ap-northeast-2
19 5.52e-06
20 6.15e-06
21 3.84e-06
22 or LIST requests"""
df = pd.read_csv(StringIO(text), sep='\s{2,}', engine='python', index_col=[0], header=None)
使用
pd.to_numeric
pd.to_numeric(df.iloc[:, 0], errors='coerce').fillna(0)
把这个列分配到你喜欢的地方。