我有一个熊猫数据框:
df
id Description
1 2694 A&W #5530 MONTREAL QC
2 ahi DOLLARAMA # 45 MONTREAL QC
3 PC - PAYMENT FROM - *****11*22
我想格式化此数据帧,以使列
df["Description"]
不具有#
,-
,*
或numbers
,例如:id Description
1 A&W MONTREAL QC
2 ahi DOLLARAMA MONTREAL QC
3 PC PAYMENT FROM
我尝试使用python模块重新。但是我弄错了。
谢谢
最佳答案
尝试使用正则表达式,如下所示:
df.Description = df.Description.str.replace(r'[\d#\-\*]', '')
这给
0 A&W MONTREAL QC
1 ahi DOLLARAMA MONTREAL QC
2 PC PAYMENT FROM
Name: foo, dtype: object