基本上,我在一行中有两个字节串,如下所示:
b'\xe0\xa6\xb8\xe0\xa6\x96 - \xe0\xa6\xb6\xe0\xa6\x96\n'
这是我使用
urllib
从联机文件中导入的unicode字符串,我想比较各个字节字符串,以便替换错误的字符串。但是,我找不到任何方法来解析字符串,以便在两个不同的变量中得到\xe0\xa6\xb8\xe0\xa6\x96
和\xe0\xa6\xb6\xe0\xa6\x96
。我尝试将其转换为像
str(b'\xe0\xa6\xb8\xe0\xa6\x96')
这样的原始字符串,并且索引实际上起作用,但是在那种情况下,我一开始无法还原回原始字节串。可能吗?任何帮助将是巨大的!
最佳答案
我建议尝试这样的事情...
arr = b'\xe0\xa6\xb8\xe0\xa6\x96 - \xe0\xa6\xb6\xe0\xa6\x96\n'
splt = arr.decode().split(' - ')
b_arr1 = splt[0].encode()
b_arr2 = splt[1].encode()
我在python 3终端中试用了它,并且效果很好。