我在读取 xls 文件时获得的数据框有一些问题。
这种数据帧上的每个数据都具有“unicode”类型,我对此无能为力。我想将其更改为 str 值。另外,如果可能,我想知道这个事实的原因。我听说过一些关于“外部数据”的事情,我知道列和索引也在这些名称之前显示了 unicode 的“u”。我对编码几乎一无所知,如果有人另外解释一下,我将非常感激。
我正在使用 Python 2,我试图用函数作为一列一列地解决它
.astype(str)
.astype(basestring)
.apply(str)
和
.str.decode('iso-8859-1').str.encode('utf-8')
(我在这里阅读了最后一个,我只是在我的代码中写了它来尝试另一件事)。我也试过
unicodedata.normalize('NFKD', df_bolsa[l]).encode('ascii','ignore')
但最后一个不能与系列一起使用。
我希望有人能够帮助我澄清这个问题。
非常感谢您提前!
最佳答案
您可以使用以下代码。
for column in df:
df[column] = df_peru[column].str.encode('utf-8')
关于python - 将数据帧的 unicode 数据转换为字符串,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/42421967/