Python获取并存储文本文档中指定字符串后的所有数字

  • Post author:
  • Post category:python


很可能会报这个错:

UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xbf in position 2: illegal multibyte sequence

报错的意思,是当内部编码转化成 gbk编码(默认)时出错,改为utf-8就好了:with open(path,“r”,

encoding=“utf-8”

) 。并用notepad打开文本文档修改编码格式为utf-8

def Solution(path):
    with open(path,"r",encoding="utf-8") as f: #用notepad打开文本文档修改编码格式为utf-8
        data=f.read()
        #print(data)
        import re
        reg=re.compile(r"(?<=指定字符串)\d+")
        match=reg.findall(data) 		#match相当于是个数组变量
        i=0
        total=0
        MAX=-1
        while i< len(match):
            total+=(int)(match[i])
            MAX=max(MAX,(int)(match[i]))
            i += 1
        AVG=total/len(match)
        print('MAX=',end=" ")
        print(MAX)							#最大值
        print('AVG=',end=" ")
        print(AVG)							#均值
if __name__ == '__main__':
	Solution(文本文档所在位置 注意:'\'要改成'\\')



版权声明:本文为GwuYiFan原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。