我有以下数据框:
str_value
0 Mock%20the%20Week
1 law
2 euro%202016
有许多这样的特殊字符,如
%20%
,%2520
,等等。我如何将它们全部删除。我尝试了以下操作,但数据帧很大,我不确定有多少不同的字符。dfSearch['str_value'] = dfSearch['str_value'].str.replace('%2520', ' ')
dfSearch['str_value'] = dfSearch['str_value'].str.replace('%20', ' ')
最佳答案
您可以使用urllib
库并使用系列的map
方法应用它。
示例-
In [23]: import urllib
In [24]: dfSearch["str_value"].map(lambda x:urllib.unquote(x).decode('utf8'))
Out[24]:
0 Mock the Week
1 law
2 euro 2016