python - 如何在 python 中解码这个字符串？ | Student

Student

c++ - 在调试期间，我的程序跳至最近的while语句而不会中断或继续[C++]

c++ - Unix套接字返回ECONNRESET，并且服务器甚至没有获得接受以停止阻塞

c - 返回字符串的长度

java - 使用NetBeans在Selenium上进行跨浏览器测试

c# - C#适当的数据结构，用于存储csv文件中的值。具体情况

javascript - 如何获取(内置)麦克风的硬件信息？

ios - 异步更新表单元格图像

c# - 正则表达式可以匹配除C#中引号之外的所有字符串

vbscript - VBScript中的if语句是否会遍历Err.Number

java - 处理/java-如何检查数组中的值是否不变

Android - 读取 "device attribute"失败，错误为 "invalid length"

MySQL从加载文件中的另一个表中选择

android - 应用程序可以使用的最大RAM数量是多少？

C++声明一个函数而不是调用一个复杂的构造函数

c++ - CMake在Debian上找不到boost_program_options

python - 如何在 python 中解码这个字符串？

扫码查看

我下载了一个 Facebook 消息数据集，它的格式如下:

f\u00c3\u00b8rste student

它应该是 første student 但我似乎无法正确解码它。

我试过了:

str = 'f\u00c3\u00b8rste student'
print(str)
# 'fÃ¸rste student'

str = 'f\u00c3\u00b8rste student'
print(str.encode('utf-8'))
# b'f\xc3\x83\xc2\xb8rste student'

但它没有用。

最佳答案

要撤消已发生的任何编码错误，您首先需要通过在 ISO-8859-1 (Latin-1) 中编码，然后在解码为 UTF-8 之后将字符转换为具有相同序数的字节:

>>> 'f\u00c3\u00b8rste student'.encode('iso-8859-1').decode('utf-8')
'første student'

关于python - 如何在 python 中解码这个字符串？，我们在Stack Overflow上找到一个类似的问题：https://stackoverflow.com/questions/53602446/

10-11 22:48