直接上代码:
import re
def find_chinese(file):
pattern = re.compile(r'[^\u4e00-\u9fa5]')
chinese = re.sub(pattern, '', file)
print(chinese)
def find_unchinese(file):
pattern = re.compile(r'[\u4e00-\u9fa5]')
unchinese = re.sub(pattern,"",file)
print(unchinese)
if __name__ == "__main__":
line = "2019年1月3日 - python去除空格和换行符的方法 一、去除空格 strip().strip() # ...用replace('\',''),后边的串替换掉前边的posted @ 2016-07-18 08:53 ..."
print("原文:")
print(line)
print("保留中文:")
find_chinese(line)
print("保留非中文:")
find_unchinese(line)
原文:
2019年1月3日 - python去除空格和换行符的方法 一、去除空格 strip().strip() # ...用replace('',''),后边的串替换掉前边的posted @ 2016-07-18 08:53 ...
保留中文:
年月日去除空格和换行符的方法一去除空格用后边的串替换掉前边的
保留非中文:
201913 - python 、 strip().strip() # ...replace('',''),posted @ 2016-07-18 08:53 ...
版权声明:本文为bailixuance原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。