常用编码说明-ASCII&ISO

  • Post author:
  • Post category:其他


一、什么是编码

编码是信息从一种形式或格式转换为另一种形式的过程,也称为计算机编程语言的代码。用预先规定的方法将文字、数字或其它对象编成数码。简单来说,计算机中只能够识别0和1,而人类需要将文件信息映射成0和1,以便计算机能够识别,这一过程称之为编码;反之,称之为解码。

二、编码的分类

编码体系众多,有不同组织规定的编码体系,有不同地区根据各地区的实际情况形成了的编码体系,甚至在一些特殊的应用场景也建立了自己的编码体系。目前,世面上常见的编码主要分为:ASCII、ISO/IEC 8859、Unicode、MIME 编码及其他地区的编码。

2.1 ASCII

2.1.1 ASCII介绍

信息在计算机上是用二进制表示的,这种表示法让人理解起来很困难。因此计算机上都配有输入和输出设备,这些设备的主要目的就是以一种人类可阅读的形式将信息在这些设备上显示,供人类阅读理解。为保证人类和设备,设备和计算机之间能进行正确的信息交换,人们编制了统一的信息交换代码,这就是ASCII((American Standard Code for Information Interchange): 美国信息交换标准代码)码表。ASCII码表是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。

2.1.2 ASCII结构说明

ASCII码包含标准ASCII码表和扩展ASCII码表。

标准ASCII码使用指定的7位二进制数组合表示,每一个二进制位都是0或者1两种状态,一个字节7位,那么就可以组合成128种不同的状态。扩展ASCII码表使用指定的8位二进制数组合表示,因此可以表示256位不同的字符,从00000000到11111111。具体结构如下:

0~31及127(共33个)是控制字符或通信专用字符(其余为可显示字符)。

32~126(共95个)是字符(32是空格),其中48~57为0到9十个阿拉伯数字。

65~90为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等。

在这里插入图片描述

2.2 ISO/IEC 8859

2.2.1 ISO/IEC 8859介绍

目前ASCII码表共收录了空格及94个“可印刷字符”,足够给英语使用。但其他使用Latin语言的地区都有收录一定数量的附加符号字母,同时,为了解决其他语言编码问题, 国际标准化组织(ISO)及国际电工委员会(IEC)联合制定的一系列8位字符集的标准,称之为ISO/IEC 8859。ISO/IEC 8859目前共定义了15个字符集,每个字符集在0xA0-0xFF范围内根据不同的字符集放入不同的字符。

2.2.2 ISO/IEC 8859结构说明

ISO/IEC 8859-1(Latin-1)是单字节编码,向下兼容ASCII,其编码范围是0x00-0xFF,0x00-0x7F之间完全和ASCII一致,0x80-0x9F之间是控制字符,0xA0-0xFF之间是文字符号。其主要表示的是西欧语言。

ISO/IEC 8859-2 (Latin-2) – 中欧语言。

ISO/IEC 8859-3 (Latin-3) – 南欧语言。世界语也可用此字符集显示。

ISO/IEC 8859-4 (Latin-4) – 北欧语言。

ISO/IEC 8859-5 (Cyrillic) – 斯拉夫语言。

ISO/IEC 8859-6 (Arabic) – 阿拉伯语。

ISO/IEC 8859-7 (Greek) – 希腊语。

ISO/IEC 8859-8 (Hebrew) – 希伯来语(视觉顺序)。

ISO 8859-8-I – 希伯来语(逻辑顺序)。

ISO/IEC 8859-9 (Latin-5 或 Turkish) – 它把Latin-1的冰岛语字母换走,加入土耳其语字母。

ISO/IEC 8859-10 (Latin-6 或 Nordic) – 北日耳曼语支,用来代替Latin-4。

ISO/IEC 8859-11 (Thai) – 泰语,从泰国的 TIS620 标准字集演化而来。

ISO/IEC 8859-13 (Latin-7 或 Baltic Rim) – 波罗的语族。

ISO/IEC 8859-14 (Latin-8 或 Celtic) – 凯尔特语族。

ISO/IEC 8859-15 (Latin-9) – 西欧语言,加入Latin-1欠缺的芬兰语字母和大写法语重音字母,欧元(?符号)。

ISO/IEC 8859-16 (Latin-10) – 东南欧语言。主要供罗马尼亚语使用,并加入欧元符号。

在这里插入图片描述



版权声明:本文为weixin_43914798原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。