我有一个熊猫数据框:

df

id  Description
1   2694 A&W #5530 MONTREAL QC
2   ahi DOLLARAMA # 45 MONTREAL QC
3   PC - PAYMENT FROM - *****11*22


我想格式化此数据帧,以使列df["Description"]不具有#-*numbers,例如:

id  Description

1   A&W MONTREAL QC
2   ahi DOLLARAMA MONTREAL QC
3   PC PAYMENT FROM


我尝试使用python模块重新。但是我弄错了。

谢谢

最佳答案

尝试使用正则表达式,如下所示:

df.Description = df.Description.str.replace(r'[\d#\-\*]', '')


这给

0               A&W  MONTREAL QC
1    ahi DOLLARAMA   MONTREAL QC
2             PC  PAYMENT FROM
Name: foo, dtype: object

09-25 21:17