c# url encode编码转换_encode 和decode——带你探索编码与解码的世界

  • Post author:
  • Post category:其他


本文作者:孙晓玲

文字编辑:余术玲

技术总编:张   邯

重磅!!!爬虫俱乐部将于

2019年10月2日至10月5日

在湖北武汉举行

Python编程技术培训

,本次培训采用理论与案例相结合的方式,旨在帮助零基础学员轻松入门Python,由浅入深学习和掌握Python编程技术,尤其是爬虫技 术和文本分析技术。

该培训目前在火热招生中

,点击《爬虫俱乐部2019十一Python编程技术培训报名啦!》或点击文末阅读原文,了解培训详细信息,抓紧时间报名吧! 在 7 月 31 日的推文中,已经为大家简单介绍了 Unicode 编码的由来,并且介绍了 Python 中查看单个字符编码的一对互逆函数 ord(

c

) 和 chr(

i

) 。今天将继续为大家介绍 Python 中有关

中文编码

的小知识并介绍有关

编码



解码

的两种数据处理方法

encode



decode



一、常见的中文编码

GB2312 编码是在 ASCII 编码基础上扩展来的,在 1980 年由中国国家标准总局发布,其中最主要的变化就是引入了简体中文的编码,一共容纳了包括简体中文在内的 6000 多个字符。 仅仅是简体中文肯定是不够用的, 1995 年, GBK 编码在 GB2312 编码的基础上进行扩充,加入了繁体中文和一些符号的编码,扩充后容纳了 20000 多个字符。 56 个民族 56 枝花,中华儿女 56 个民族不同民族之间的语言符号也有一定的差异,为了编码大团圆, 2000 年, GBK 再一次被扩充,就产生了 GB18030 编码, GB18030 编码不仅容纳简体中文和繁体中文,还纳入少数民族汉字,一共 70000 多个汉字和字符, GB18030 是在 GB2312 和 GBK 的基础上扩充的,比 GB2312 和 GBK 更广阔。



二、.encode()方法和.