Linux网络:数据链路层 | 以太网帧 | MAC地址 | MTU | ARP协议 | DNS | ICMP协议 | NAT技术

  • Post author:
  • Post category:linux


全文约 5388 字,预计阅读时长: 15分钟




“数据链路层” 和 “网络层”

  • 网络层:提供数据转发依据。让我们找到目标主机。
  • 数据链路层:负责MAC位址 。MAC地址用于在网络中唯一标示一个网卡,一台设备若有一或多个网卡,则每个网卡都需要并会有一个唯一的MAC地址。

    • Mac解决相邻主机的通信问题,将数据帧交付给它的下一跳设备,相邻的主机一定属于同一个网段。



认识以太网

“以太网” 不是一种具体的网络,而是一种技术标准;既包含了数据链路层的内容,也包含了一些物理层的内容。例如:规定了网络拓扑结构,访问控制方式, 传输速率等;

  • 例如以太网中的网线必须使用双绞线;传输速率有10M, 100M, 1000M等;
  • 以太网是当前应用最广泛的局域网技术; 和以太网并列的还有令牌环网, 无线LAN等。

    • Linux之所以能移植到手机,是将内核的以太网协议模组换成无线电相关的。



以太网帧格式

在这里插入图片描述


  • 源地址和目的地址

    是指网卡的硬件地址(也叫MAC地址),长度是48位,是在网卡出厂时固化的。

  • 帧协议类型字段

    有三种值,分别对应IP、ARP、RARP;
  • 帧末尾是CRC校验码。校验数据有没有出错。

    • TCP数据段、IP数据包、MAC数据帧;有各自的校验码,层层过滤。某一层出错了,就不许在往上传了。

MAC帧如何解包分用

固定长度的定长报头。2字节的帧协议类型字段。




认识MAC地址

MAC英语:Media Access Control Address,直译为媒体存取控制位址,也称为局域网地址(LANAddress),MAC位址,以太网地址(Ethernet Address)或物理地址(Physical Address)。

  • MAC地址用来识别数据链路层中相连的节点。
  • 长度为48位, 及6个字节, 一般用16进制数字加上冒号的形式来表示(例如: 08:00:27:03:fb:19)
  • 在网卡出厂时就确定了, 不能修改。 mac地址通常是唯一的。虚拟机中的mac地址不是真实的mac地址, 可能会冲突; 也有些网卡支持用户配置mac地址。

MAC地址和IP地址

  • IP地址描述的是路途总体的 起点 和 终点;
  • MAC地址描述的是路途上的每一个区间的起点和终点。

局域网中存在数据碰撞,每台主机会进行碰撞检测,实行碰撞避免算法。一台主机发送的数据,每台主机都收到了,检测到不是给自己便选择丢弃。对网卡设置,启用混杂模式和抓包工具,可以实现对特定主机的mac帧不丢弃,进行监听。

局域网可以看作是一个临界资源,每台主机的碰撞检测则是主机间的“互斥”功能;同时又碰撞避免算法,实现了主机间的“同步”功能。交换机划分碰撞域,提交网络传输效率。

在这里插入图片描述




认识MTU

MTU相当于发快递时对包裹尺寸的限制. 这个限制是不同的数据链路对应的物理层,产生的限制。

  • 以太网帧中的数据长度规定最小46字节,最大1500字节,ARP数据包的长度不够46字节,要在后面补填充位。

    • 最大值1500称为以太网的最大传输单元(MTU),不同的网络类型有不同的MTU。
  • 如果一个数据包从以太网路由到拨号链路上,数据包长度大于拨号链路的MTU了,则需要对数据包进行分片(fragmentation);不同的数据链路层标准的MTU是不同的。



MTU对IP、UDP、TCP协议的影响

MTU对IP的影响: 由于数据链路层MTU的限制,对于较大的IP数据包要进行分包。

  • 将较大的IP包分成多个小包, 并给每个小包打上标签;
  • 每个小包IP协议头的 16位标识(id)都是相同的;
  • 每个小包的IP协议头的3位标志字段中, 第2位置为0,表示允许分片;第3位来表示结束标记:当前是否是最后一个小包,是的话置为1, 否则置为0。
  • 到达对端时再将这些小包, 会按顺序重组, 拼装到一起返回给传输层;
  • 一旦这些小包中任意一个小包丢失,接收端的重组就会失败。但是IP层不会负责重新传输数据。

MTU对UDP协议的影响

  • 一旦UDP携带的数据超过1472(1500 – 20(IP首部) – 8(UDP首部)), 那么就会在网络层分成多个IP数据报。
  • 这多个IP数据报有任意一个丢失,都会引起接收端网络层重组失败。 那么这就意味着:如果UDP数据报在网络层被分片, 整个数据被丢失的概率就大大增加了。

MTU对于TCP协议的影响

  • TCP的一个数据报也不能无限大,还是受制于MTU。

    TCP的单个数据报的最大消息长度, 称为MSS(Max Segment Size)

    ;
  • TCP在建立连接的过程中, 通信双方会进行MSS协商。
  • 最理想的情况下, MSS 的值正好是在IP不会被分片处理的最大长度:这个长度仍然是受制于数据链路层的 MTU。
  • 双方在发送 SYN 的时候会在 TCP头部 写入自己能支持的 MSS值。
  • 然后双方得知对方的 MSS值 之后, 选择较小的作为 最终MSS.
  • MSS的值 就是在 TCP首部 的40字节变长选项中(kind=2);
  • 使用

    ifconfig

    命令, 即可查看 ip地址, mac地址, 和 MTU。



ARP协议

ARP协议建立了主机 IP地址 和 MAC地址 的映射关系。ARP协议位于MAC帧的上层,归属于数据链路层。

  • 在网络通讯时,源主机的应用程序知道 目的主机的IP地址 和 端口号,却不知道 目的主机的硬件地址。
  • 数据包首先是被网卡接收到再去处理上层协议的,如果接收到的数据包的硬件地址与本机不符,则直接丢弃。 因此在通讯前必须获得目的主机的硬件地址。

ARP协议的工作流程

  • 源主机发出 ARP请求,询问 “IP地址是192.168.0.1的主机的硬件地址是多少”, 并将这个请求广播到本地网段(以太网帧首部的硬件地址填 FF:FF:FF:FF:FF:FF 表示广播);
  • 局域网中的所有主机都要受理广播。目的主机接收到广播的ARP请求,发现其中的IP地址与本机相符,则发送一个 ARP应答数据包 给源主机,将自己的 硬件地址填写在应答包中;
  • 每台主机都维护一个ARP缓存表,可以用

    arp -a

    命令查看。缓存表中的表项有过期时间 (一般为20分钟),如果20分钟内没有再次使用某个表项,则该表项失效,下次还要发 ARP请求 来获得目的主机的硬件地址。



ARP数据报的格式

  • 注意到源MAC地址、目的MAC地址 在以太网首部 和 ARP请求中各出现一次。对于链路层为以太网的情况是多余的,但如果链路层是其它类型的网络则有可能是必要的。

  • 硬件类型

    指链路层网络类型,1为 以太网;

  • 协议类型

    指要转换的地址类型, 0x0800 为 IP地址;

  • 硬件地址长度

    对于 以太网地址 为6字节。

  • 协议地址长度

    对于 IP地址 为4字节。

  • op字段

    为1 表示 ARP请求,op字段 为2 表示 ARP应答。

MAC帧到达目的主机所在的网段时,路由器发送ARP广播;每台主机的 MAC帧层收到,检测是什么类型的向上交付,ARP协议检测目标IP地址不是自己的,则丢弃数据帧。是自己的,则发送ARP应答数据帧。

  • 最开始刚从源主机出发时,它是怎么知道下一跳的路由器的Mac地址呢?

    • 可知,该主机的IP地址是由接入的、最近的、路由器DHCP分配的;该主机在组网时就有了相关路由器的IP 和MAC信息。
  • 那么路由器怎么知道下一个路由器的MAC地址呢?

    • 可以按照上述逻辑重推,而且当路由器发现目的IP地址和自己不属于同一网段,查询路由表转发至下一个路由器。
    • 不同的路由器接入的网络拓扑不一样,会有多条道路通往目的主机。而数据帧在此过程中,是由一个网段奔赴至下一个网段。宏观上来看,符合MAC帧的局域网通信原理。
    • 现象:刚开始下载比较慢,后来趋于稳定。其实路由器开始时在进行路径的选择检测。



DNS(Domain Name System)简介

DNS是一整套从域名映射到IP的系统。

TCP/IP中使用 IP地址和 端口号 来确定网络上的一台主机的一个程序。 但是IP地址不方便记忆,于是人们发明了一种叫 主机名 的东西,是一个字符串, 并且使用 hosts文件 来描述 主机名 和 IP地址的关系。

  • 最初, 通过互连网信息中心(SRI-NIC)来管理这个 hosts文件的。

    • 如果一个新计算机要接入网络,或者某个计算机IP变更, 都需要到信息中心申请变更 hosts文件。
    • 其他计算机也需要定期下载更新新版本的hosts文件才能正确上网。

这样就太麻烦了, 于是产生了DNS系统。

  • 一个组织的系统管理机构,维护系统内的每个主机的 IP和主机名 的对应关系.。
  • 如果新计算机接入网络,将这个信息注册到数据库中。
  • 用户输入域名的时候, 会自动查询DNS服务器, 由DNS服务器检索数据库, 得到对应的 IP地址。

    • 浏览器内部内置了一些域名解析的服务器地址。

至今, 我们的计算机上仍然保留了 hosts文件。在域名解析的过程中仍然会优先查找 hosts文件 的内容。Linux下:

cat /etc/hosts

;Windows下:

C:Windows、System32、drivers、etc




域名简介

主域名是用来识别 主机名称和主机所属的组织机构的 一种分层结构的名称。

  • 域名使用 . 连接

    • com:一级域名。 表示这是一个企业域名。 同级的还有 “net”(网络提供商), “org”(非盈利组织) 等。
    • baidu: 二级域名, 公司名。
    • www: 只是一种习惯用法。之前人们在使用域名时,往往命名成类似于 ftp.xxx.xxx/ www.xxx.xxx 这样的格式,来表示主机支持的协议。

使用 dig 工具分析 DNS 过程

yum install bind-utils  //安装 dig 工具
dig www.baidu.com
  1. 开头位置是 dig 指令的版本号;第二部分是服务器返回的详情, 重要的是 status 参数: NOERROR 表示查询成功。
  2. QUESTION SECTION 表示要查询的域名是什么;ANSWER SECTION 表示查询结果是什么。这个结果先将 www.baidu.com 查询成了 www.a.shifen.com, 再将 www.a.shifen.com 查询成了两个 ip 地址。
  3. 最下面是一些结果统计, 包含查询时间和 DNS 服务器的地址等。



ICMP协议

  • ICMP协议是一个 网络层协议 。
  • 一个新搭建好的网络, 往往需要先进行一个简单的测试,来验证网络是否畅通; 但是IP协议并不提供可靠传输。如果丢包了, IP协议并不能通知传输层是否丢包以及丢包的原因。

ICMP功能

  • ICMP主要功能包括:

    • 确认 IP包 是否成功到达目标地址。
    • 通知在发送过程中 IP包 被丢弃的原因.
    • ICMP也是基于 IP协议 工作的。但是它并不是传输层的功能, 因此人们仍然把它归结为网络层协议;
    • ICMP只能搭配 IPv4 使用. 如果是IPv6的情况下, 需要是用ICMPv6。

ICMP的报文格式

在这里插入图片描述

  • ICMP大概分为两类报文:一类是通知出错原因;一类是用于诊断查询。



ping命令

  • 注意:此处 ping 的是域名,而不是 url! 一个域名可以通过DNS解析成IP地址。
  • ping命令不光能验证网络的连通性, 同时也会统计 响应时间 和 TTL(IP包中的 Time To Live,生存周期)。
  • ping命令会先发送一个 ICMP Echo Request给对端;对端接收到之后, 会返回一个ICMP Echo Reply。
  • ping命令基于ICMP, 是在网络层。 而端口号。 是传输层的内容。在ICMP中根本就不关注端口号这样的信息。


traceroute

命令:也是基于ICMP协议实现,能够打印出可执行程序主机,一直到目标主机之前经历多少路由器。




NAT技术背景

NAT技术当前解决IP地址不够用的主要手段,是路由器的一个重要功能。

  • NAT能够将私有IP对外通信时转为全局IP。 也就是就是一种将私有IP和全局IP相互转化的技术方法。很多学校, 家庭, 公司内部采用每个终端设置私有IP,而在路由器或必要的服务器上设置全局IP。
  • 全局IP要求唯一, 但是私有IP不需要; 在不同的局域网中出现相同的私有IP是完全不影响的。

NAT IP转换过程

在这里插入图片描述

  • NAT路由器将源地址从10.0.0.10替换成全局的IP 202.244.174.37;NAT路由器收到外部的数据时, 又会把目标IP从202.244.174.37替换回10.0.0.10;
  • 在NAT路由器内部, 有一张自动生成的, 用于地址转换的表;当 10.0.0.10 第一次向 163.221.120.9 发送数据时就会生成表中的映射关系。



NAPT

那么问题来了, 如果局域网内, 有多个主机都访问同一个外网服务器, 那么对于服务器返回的数据中, 目的IP都是相同的. 那么NAT路由器如何判定将这个数据包转发给哪个局域网的主机? 这时候NAPT来解决这个问题了. 使用 IP+port 来建立这个关联关系。

在这里插入图片描述

  • 这种关联关系(互为K值)也是由NAT路由器自动维护的。例如在TCP的情况下。 建立连接时, 就会生成这个表项; 在断开连接后, 就会删除这个表项。NAT在建立映射条目时,可能替换IP地址,可能能替换端口号。

NAT技术的缺陷:

  • 由于NAT依赖这个转换表, 所以有诸多限制:

    • 无法从NAT外部向内部服务器建立连接;(NAT内网穿透)
    • 装换表的生成和销毁都需要额外开销;
    • 通信过程中一旦NAT设备异常, 即使存在热备, 所有的TCP连接也都会断开。

NAT和代理服务器

  • 从底层实现上讲, NAT是工作在网络层, 直接对IP地址进行替换. 代理服务器往往工作在应用层.
  • 从部署位置上看, NAT一般集成在防火墙, 路由器等硬件设备上;代理服务器则是一个软件程序, 需要部署在服务器上。



版权声明:本文为WTFamer原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。