如果对你有帮助,就点个赞吧~
前言
从网站获取的数据, 会存在`\u`型的unicode被变成了`\\u`, 导致数据显示不是中文的情况,
仅对此种问题处理做个记录
一、单个字符串类型
通过先encode再decode的方式解决
str.encode(“utf-8”).decode(“unicode_escape”)
>>> "\u4f60\u597d\u4e16\u754c"
'你好世界'
>>> "\\u4f60\\u597d\\u4e16\\u754c"
'\\u4f60\\u597d\\u4e16\\u754c'
>>> "\\u4f60\\u597d\\u4e16\\u754c".encode("utf-8").decode("unicode_escape")
'你好世界'
二、json中的字符类型
通过json的loads方法来解决
json.loads(‘{“title”: “\\u4f60\\u597d\\u4e16\\u754c”}’)
>>> import json
>>> a = {"title": "\u4f60\u597d\u4e16\u754c"}
>>> a
{'title': '你好世界'}
>>> b = json.dumps(a)
>>> b
'{"title": "\\u4f60\\u597d\\u4e16\\u754c"}'
>>> json.loads(b)
{'title': '你好世界'}
版权声明:本文为fiendkey原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。