硬盘是用来存储数据的,为了使用和管理方便,这些数据以文件的形式存储在硬盘上。任何操作系统都有自己的文件管理系统,不同的文件系统又有各自不同的逻辑组织方式。例如:常见的文件系统有FAT,NTFS,EXT,UFS,HFS+等等。作者后面的文章会一一讲到,下面就来学习一下基于Windows的FAT32文件系统。
FAT32文件系统由DBR及其保留扇区,FAT1,FAT2 和 DATA 四个部分组成,其机构如下图:
这些结构是在分区被格式化时创建出来的,含义解释如下:
DBR及其保留扇区
:DBR的含义是DOS引导记录,也称为操作系统引导记录,在DBR之后往往会有一些保留扇区。
FAT1
:FAT的含义是文件分配表,FAT32一般有两份FAT,FAT1是第一份,也是主FAT。
FAT2
:FAT2是FAT32的第二份文件分配表,也是FAT1的备份。
DATA
:DATA也就是数据区,是FAT32文件系统的主要区域,其中包含目录区域。
一、分析FAT32文件系统的DBR
FAT32文件系统的DBR有5部分组成,分别为跳转指令,OEM代号,BPB,引导程序和结束标志。如下图是一个完整的FAT32文件系统的DBR。
(这里我使用的是格式化为FAT32的4G SD卡为例)
跳转指令:本身占2字节它将程序执行流程跳转到引导程序处。
OEM代号:这部分占8字节,其内容由创建该文件系统的OEM厂商具体安排。
BPB:FAT32的BPB从DBR的第12个字节开始,占用79字节,记录了有关该文件系统的重要信息,各参数解释如下表:
FAT32文件系统在DBR的保留扇区中安排了一个文件系统信息扇区,用以记录数据区中空闲簇的数量及下一个空闲簇的簇号,该扇区一般在分区的1号扇区,也就是紧跟着DBR后的一个扇区,其内如下:
各参数解释如下:
引导程序代码:FAT32的DBR引导程序占用420字节,对于没有安装操作系统的分区来说这段程序是没有用处的。
结束标志:DBR的结束标志与MBR,EBR的结束标志相同,为“55 AA”。
二、分析FAT32文件系统的FAT表
FAT1的内容如下:
由于分区格式化之后没有写入太多的数据,所以FAT项很少。
FAT表结构及作用
1、FAT32文件一般有两份FAT,他们由格式化程序在对分区进行格式化时创建,FAT1是主,FAT2是备份。
2、FAT1跟在DBR之后,其具体地址由DBR的BPB参数中指定,FAT2跟在FAT1的后面。
3、FAT表由FAT表项构成,我们把FAT表项简称FAT项,每个FAT项占用4字节。
4、每个FAT项都有一个固定的编号,这个编号从0开始。
5、FAT表项的前两个FAT项为文件系统保留使用,0号FAT为介质类型,1号FAT为文件系统错误标志。
6、分区的数据区中每个簇都会映射到FAT表中的唯一一个FAT项,因为0号FAT和1号FAT被系统占用,用户的数据从2号FAT开始记录。
7、如果某个文件占用很多个簇,则第一个FAT项记录下一个FAT项的编号(既簇号),如果这个文件结束了,则用“0F FF FF FF”表示。
8、分区格式化后,用户文件以簇为单位存放在数据区中,一个文件至少占用一个簇。
9、FAT的主要作用是标明分区存储的介质以及簇的使用情况。
定位FAT绝对位置的方法如下:
1、首先从MBR的分区表中得知分区的起始扇区,偏移到此扇区。
2、从DBR的BPB中得知DBR的保留扇区数,FAT表的个数,FAT表的大小。
3、因此FAT1=分区起始扇区+DBR保留扇区,FAT2=分区起始扇区+DBR保留扇区+FAT1。
三、分析FAT32文件系统的数据区
数据区的位置在FAT2的后面,具体定位方式如下;
1、通过MBR中的分区表信息得知分区的起始位置。
2、通过分区中DBR得知DBR的保留扇区数以及FAT表的大小,FAT表的个数。
3、通过上面的信息就可以找到数据区的起始位置,根目录=数据区的起始扇区+(簇大小*2)。
数据区的类容主要由三部分组成:根目录,子目录和文件内容。在数据区中是以“簇”为单位进行存储的,2号簇被分配给根目录使用。
根目录的定位方式为:根目录=分区起始扇区+DBR保留扇区+(FAT表*2)+(簇大小*2)
FAT32文件系统中,分区根目录下的文件和目录都放在根目录区中,子目录中的文件和目录都放在子目录区中,并且没每32个字节为一个目录项,每个目录项纪录着一个目录或文件(也可能是多个目录项记录一个文件或目录),如上图所示就是一个目录项。
在FAT32文件系统中,目录项可以分为四类:卷标目录项、“.”和“..”目录项、短文件名目录项、长文件名目录项。
卷标目录项:卷标就是分区的名字,可以在格式化分区时创建,也可以随意修改,长度为11字节。
“.”和“..”目录项:“.”表示当前目录,“..”表示上一层目录。这两个目录项多存在子目录中。
短文件名目录项:所谓短文件名既文件名的“8.3”格式,此格式支持主文件名不能超过8字节,扩展名不能超过3字节。短文件名目录始终存放在一个目录项中。
短文件名的各参数解释如下:
其中关于时间的表达方式如下:
关于日期的表达方式如下:
长文件名目录项:由于短文件名“8.3”的格式远远不能满足现实中的需求,所以就出现了长文件名,长文件名其实就是将文件名进行分段,分成若干个短文件名进行存储。
长文件名在进行分段存储的时候,遵循一下三个处理原则:
1、系统取长文件名的前6个字符加上“~1”形成短文件名,其扩展名不变;
2、如果已存在这个名字的文件,则符号“~”后的数字自动增加;
3、如果文件名内存在windows非法的字符,则以下划线“_”代替;
4、长文件名目录项采用倒叙的方式进行记录,如上图。
如下:是长文件名目录的各参数的解释
FAT32文件系统总结
上述的内容已经简单的介绍了FAT32文件系统,下面根据定位某个文件来详细的了解FAT32文件系统是如何存储数据的。
1、根据磁盘0号扇区MBR的分区表得知分区的起始位置,既DBR;
2、根据DBR中BPB记录的信息,得知DBR保留扇区数,FAT的大小,FAT的个数;
3、根据上述信息可以算出数据的起始位置,数据区=分区起始扇区+DBR保留扇区+(FAT表*2);
4、计算根目录所在的绝对位置,根目录=数据区的起始扇区+(簇大小*2);
5、根据根目录中的目录项信息得知,根目录下的文件以及子目录等所对应的簇;
6、根据文件的簇号就可以找到文件内容的绝对扇区;
7、如果一个文件占用多个簇,则需要根据FAT表项得知下一个数据簇的簇号。
7、如果根目录下的目录项是子目录的话,则根据子目录中的文件目录项得知文件内容的簇号;
8、如果子目录中还有子目录的话,则根据这种方法一直找下去即可。
至此FAT32文件系统就简绍完毕了,希望对那些喜欢数据底层的朋友们有所帮助。