open打开txt文档报错UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x80 in position 205: illegal multib

  • Post author:
  • Post category:其他


在python3读取txt文件时,遇到上面问题是因为:

txt文件存的是utf8编码,打开文件的时候没有指定编码,文件虽然是utf8编码,但是在计算机里面存储的还是unicode编码数据,即计算机是将文件的内容按照utf8编码成unicode后存到了硬盘上,而现在执行f.read()的时候,因为没有指定编码,f.read()可能是发现文件中有中文,所以按照gbk来试图将unicode解码,但是因为文件本身是utf8的,所以解码失败。

修改方法1:

FILE_OBJECT= open(‘aaa.txt’,‘r’, encoding=‘UTF-8’)

修改方法2:

FILE_OBJECT= open(‘aaa.txt’,‘rb’)1

建议使用第一种,定义数据读取的编码,第二种会以二进制的方法读取数据,会给后面带来麻烦。