\u开头的unicode中的\u被转义\\u的问题处理

  • Post author:
  • Post category:其他



如果对你有帮助,就点个赞吧~




前言


从网站获取的数据, 会存在`\u`型的unicode被变成了`\\u`, 导致数据显示不是中文的情况,


仅对此种问题处理做个记录



一、单个字符串类型

通过先encode再decode的方式解决

str.encode(“utf-8”).decode(“unicode_escape”)

>>> "\u4f60\u597d\u4e16\u754c"
'你好世界'
>>> "\\u4f60\\u597d\\u4e16\\u754c"
'\\u4f60\\u597d\\u4e16\\u754c'
>>> "\\u4f60\\u597d\\u4e16\\u754c".encode("utf-8").decode("unicode_escape")
'你好世界'



二、json中的字符类型

通过json的loads方法来解决

json.loads(‘{“title”: “\\u4f60\\u597d\\u4e16\\u754c”}’)



>>> import json
>>> a = {"title": "\u4f60\u597d\u4e16\u754c"}
>>> a
{'title': '你好世界'}
>>> b = json.dumps(a)
>>> b
'{"title": "\\u4f60\\u597d\\u4e16\\u754c"}'
>>> json.loads(b)
{'title': '你好世界'}



版权声明:本文为fiendkey原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。