针对py2,py3不需要这样。
#coding=utf8
import sys
reload(sys)
sys.setdefaultencoding('utf8') strx2='你好\u4e2d\u56fd,傻瓜\u65e5\u672c'
print strx2
print repr(strx2)
finds=re.findall(r'\\u[a-z0-9A-Z]{4}',strx2)
print repr(finds)
for f in finds:
strx2=re.sub(r'\\%s'%f,f.decode('unicode_escape'),strx2)
print strx2
初始的网页中的charset是utf8,但页面中的js却是\u,ru如果不单独提取js进行编码解码,而是一整个网页来显示中文,可以这么做。

有人说让strx2=u'你好\u4e2d\u56fd,傻瓜\u65e5\u672c',打印strx2就能正常显示了。

但这个strx2是从别的地方获取,不能就是论事的在他前面加1个u。
这是我的方法,不知道大家有什么更好的方法没有。

04-24 23:40