我有一个带有如下字符串的pandas dataframe列:
Column A
text moretext 251 St. Louis Apt.54
123 Orange Drive
sometext somemoretext 171 Poplar street
textnew 11th street
77 yorkshire avenue
我想删除数值之前的文本,即我希望输出是这样的:
Column A
251 St. Louis Apt.54
123 Orange Drive
171 Poplar street
11th street
77 yorkshire avenue
最佳答案
让我们使用正则表达式和extract
:
df['Column A'] = df['Column A'].str.extract(r'(\d+.+$)')
输出:
0 251 St. Louis Apt.54
1 123 Orange Drive
2 171 Poplar street
3 11th street
4 77 yorkshire avenue
Name: Column A, dtype: object
正则表达式状态使一组字符以任意长度的数字开头,并一直持续到行尾。
关于python - 如何删除 Pandas 数据框列中数值之前的字符串?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/49762063/