2021-2-22 爬取中文出现乱码

  • Post author:
  • Post category:其他

通过搜索

参考这篇博客https://blog.csdn.net/weixin_41586246/article/details/79643871

编码问题

起因:解析出来的网页中文部分都是乱码(运用的模块requests, BeautifulSoup)

原因:requests出现编码问题(可能)

解决办法:html = requests.get(url, headers = header).text

改为html = requests.get(url, headers = header).content


版权声明:本文为ning469原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。