文章目录
全文约 5388 字,预计阅读时长: 15分钟
“数据链路层” 和 “网络层”
- 网络层:提供数据转发依据。让我们找到目标主机。
-
数据链路层:负责MAC位址 。MAC地址用于在网络中唯一标示一个网卡,一台设备若有一或多个网卡,则每个网卡都需要并会有一个唯一的MAC地址。
- Mac解决相邻主机的通信问题,将数据帧交付给它的下一跳设备,相邻的主机一定属于同一个网段。
认识以太网
“以太网” 不是一种具体的网络,而是一种技术标准;既包含了数据链路层的内容,也包含了一些物理层的内容。例如:规定了网络拓扑结构,访问控制方式, 传输速率等;
- 例如以太网中的网线必须使用双绞线;传输速率有10M, 100M, 1000M等;
-
以太网是当前应用最广泛的局域网技术; 和以太网并列的还有令牌环网, 无线LAN等。
- Linux之所以能移植到手机,是将内核的以太网协议模组换成无线电相关的。
以太网帧格式
-
源地址和目的地址
是指网卡的硬件地址(也叫MAC地址),长度是48位,是在网卡出厂时固化的。 -
帧协议类型字段
有三种值,分别对应IP、ARP、RARP; -
帧末尾是CRC校验码。校验数据有没有出错。
- TCP数据段、IP数据包、MAC数据帧;有各自的校验码,层层过滤。某一层出错了,就不许在往上传了。
MAC帧如何解包分用
固定长度的定长报头。2字节的帧协议类型字段。
认识MAC地址
MAC英语:Media Access Control Address,直译为媒体存取控制位址,也称为局域网地址(LANAddress),MAC位址,以太网地址(Ethernet Address)或物理地址(Physical Address)。
- MAC地址用来识别数据链路层中相连的节点。
- 长度为48位, 及6个字节, 一般用16进制数字加上冒号的形式来表示(例如: 08:00:27:03:fb:19)
- 在网卡出厂时就确定了, 不能修改。 mac地址通常是唯一的。虚拟机中的mac地址不是真实的mac地址, 可能会冲突; 也有些网卡支持用户配置mac地址。
MAC地址和IP地址
- IP地址描述的是路途总体的 起点 和 终点;
- MAC地址描述的是路途上的每一个区间的起点和终点。
局域网中存在数据碰撞,每台主机会进行碰撞检测,实行碰撞避免算法。一台主机发送的数据,每台主机都收到了,检测到不是给自己便选择丢弃。对网卡设置,启用混杂模式和抓包工具,可以实现对特定主机的mac帧不丢弃,进行监听。
局域网可以看作是一个临界资源,每台主机的碰撞检测则是主机间的“互斥”功能;同时又碰撞避免算法,实现了主机间的“同步”功能。交换机划分碰撞域,提交网络传输效率。
认识MTU
MTU相当于发快递时对包裹尺寸的限制. 这个限制是不同的数据链路对应的物理层,产生的限制。
-
以太网帧中的数据长度规定最小46字节,最大1500字节,ARP数据包的长度不够46字节,要在后面补填充位。
- 最大值1500称为以太网的最大传输单元(MTU),不同的网络类型有不同的MTU。
- 如果一个数据包从以太网路由到拨号链路上,数据包长度大于拨号链路的MTU了,则需要对数据包进行分片(fragmentation);不同的数据链路层标准的MTU是不同的。
MTU对IP、UDP、TCP协议的影响
MTU对IP的影响: 由于数据链路层MTU的限制,对于较大的IP数据包要进行分包。
- 将较大的IP包分成多个小包, 并给每个小包打上标签;
- 每个小包IP协议头的 16位标识(id)都是相同的;
- 每个小包的IP协议头的3位标志字段中, 第2位置为0,表示允许分片;第3位来表示结束标记:当前是否是最后一个小包,是的话置为1, 否则置为0。
- 到达对端时再将这些小包, 会按顺序重组, 拼装到一起返回给传输层;
- 一旦这些小包中任意一个小包丢失,接收端的重组就会失败。但是IP层不会负责重新传输数据。
MTU对UDP协议的影响
- 一旦UDP携带的数据超过1472(1500 – 20(IP首部) – 8(UDP首部)), 那么就会在网络层分成多个IP数据报。
- 这多个IP数据报有任意一个丢失,都会引起接收端网络层重组失败。 那么这就意味着:如果UDP数据报在网络层被分片, 整个数据被丢失的概率就大大增加了。
MTU对于TCP协议的影响
-
TCP的一个数据报也不能无限大,还是受制于MTU。
TCP的单个数据报的最大消息长度, 称为MSS(Max Segment Size)
; - TCP在建立连接的过程中, 通信双方会进行MSS协商。
- 最理想的情况下, MSS 的值正好是在IP不会被分片处理的最大长度:这个长度仍然是受制于数据链路层的 MTU。
- 双方在发送 SYN 的时候会在 TCP头部 写入自己能支持的 MSS值。
- 然后双方得知对方的 MSS值 之后, 选择较小的作为 最终MSS.
- MSS的值 就是在 TCP首部 的40字节变长选项中(kind=2);
-
使用
ifconfig
命令, 即可查看 ip地址, mac地址, 和 MTU。
ARP协议
ARP协议建立了主机 IP地址 和 MAC地址 的映射关系。ARP协议位于MAC帧的上层,归属于数据链路层。
- 在网络通讯时,源主机的应用程序知道 目的主机的IP地址 和 端口号,却不知道 目的主机的硬件地址。
- 数据包首先是被网卡接收到再去处理上层协议的,如果接收到的数据包的硬件地址与本机不符,则直接丢弃。 因此在通讯前必须获得目的主机的硬件地址。
ARP协议的工作流程
- 源主机发出 ARP请求,询问 “IP地址是192.168.0.1的主机的硬件地址是多少”, 并将这个请求广播到本地网段(以太网帧首部的硬件地址填 FF:FF:FF:FF:FF:FF 表示广播);
- 局域网中的所有主机都要受理广播。目的主机接收到广播的ARP请求,发现其中的IP地址与本机相符,则发送一个 ARP应答数据包 给源主机,将自己的 硬件地址填写在应答包中;
-
每台主机都维护一个ARP缓存表,可以用
arp -a
命令查看。缓存表中的表项有过期时间 (一般为20分钟),如果20分钟内没有再次使用某个表项,则该表项失效,下次还要发 ARP请求 来获得目的主机的硬件地址。
ARP数据报的格式
- 注意到源MAC地址、目的MAC地址 在以太网首部 和 ARP请求中各出现一次。对于链路层为以太网的情况是多余的,但如果链路层是其它类型的网络则有可能是必要的。
-
硬件类型
指链路层网络类型,1为 以太网; -
协议类型
指要转换的地址类型, 0x0800 为 IP地址; -
硬件地址长度
对于 以太网地址 为6字节。 -
协议地址长度
对于 IP地址 为4字节。 -
op字段
为1 表示 ARP请求,op字段 为2 表示 ARP应答。
MAC帧到达目的主机所在的网段时,路由器发送ARP广播;每台主机的 MAC帧层收到,检测是什么类型的向上交付,ARP协议检测目标IP地址不是自己的,则丢弃数据帧。是自己的,则发送ARP应答数据帧。
-
最开始刚从源主机出发时,它是怎么知道下一跳的路由器的Mac地址呢?
- 可知,该主机的IP地址是由接入的、最近的、路由器DHCP分配的;该主机在组网时就有了相关路由器的IP 和MAC信息。
-
那么路由器怎么知道下一个路由器的MAC地址呢?
- 可以按照上述逻辑重推,而且当路由器发现目的IP地址和自己不属于同一网段,查询路由表转发至下一个路由器。
- 不同的路由器接入的网络拓扑不一样,会有多条道路通往目的主机。而数据帧在此过程中,是由一个网段奔赴至下一个网段。宏观上来看,符合MAC帧的局域网通信原理。
- 现象:刚开始下载比较慢,后来趋于稳定。其实路由器开始时在进行路径的选择检测。
DNS(Domain Name System)简介
DNS是一整套从域名映射到IP的系统。
TCP/IP中使用 IP地址和 端口号 来确定网络上的一台主机的一个程序。 但是IP地址不方便记忆,于是人们发明了一种叫 主机名 的东西,是一个字符串, 并且使用 hosts文件 来描述 主机名 和 IP地址的关系。
-
最初, 通过互连网信息中心(SRI-NIC)来管理这个 hosts文件的。
- 如果一个新计算机要接入网络,或者某个计算机IP变更, 都需要到信息中心申请变更 hosts文件。
- 其他计算机也需要定期下载更新新版本的hosts文件才能正确上网。
这样就太麻烦了, 于是产生了DNS系统。
- 一个组织的系统管理机构,维护系统内的每个主机的 IP和主机名 的对应关系.。
- 如果新计算机接入网络,将这个信息注册到数据库中。
-
用户输入域名的时候, 会自动查询DNS服务器, 由DNS服务器检索数据库, 得到对应的 IP地址。
- 浏览器内部内置了一些域名解析的服务器地址。
至今, 我们的计算机上仍然保留了 hosts文件。在域名解析的过程中仍然会优先查找 hosts文件 的内容。Linux下:
cat /etc/hosts
;Windows下:
C:Windows、System32、drivers、etc
。
域名简介
主域名是用来识别 主机名称和主机所属的组织机构的 一种分层结构的名称。
-
域名使用 . 连接
- com:一级域名。 表示这是一个企业域名。 同级的还有 “net”(网络提供商), “org”(非盈利组织) 等。
- baidu: 二级域名, 公司名。
- www: 只是一种习惯用法。之前人们在使用域名时,往往命名成类似于 ftp.xxx.xxx/ www.xxx.xxx 这样的格式,来表示主机支持的协议。
使用 dig 工具分析 DNS 过程
yum install bind-utils //安装 dig 工具
dig www.baidu.com
- 开头位置是 dig 指令的版本号;第二部分是服务器返回的详情, 重要的是 status 参数: NOERROR 表示查询成功。
- QUESTION SECTION 表示要查询的域名是什么;ANSWER SECTION 表示查询结果是什么。这个结果先将 www.baidu.com 查询成了 www.a.shifen.com, 再将 www.a.shifen.com 查询成了两个 ip 地址。
- 最下面是一些结果统计, 包含查询时间和 DNS 服务器的地址等。
ICMP协议
- ICMP协议是一个 网络层协议 。
- 一个新搭建好的网络, 往往需要先进行一个简单的测试,来验证网络是否畅通; 但是IP协议并不提供可靠传输。如果丢包了, IP协议并不能通知传输层是否丢包以及丢包的原因。
ICMP功能
-
ICMP主要功能包括:
- 确认 IP包 是否成功到达目标地址。
- 通知在发送过程中 IP包 被丢弃的原因.
- ICMP也是基于 IP协议 工作的。但是它并不是传输层的功能, 因此人们仍然把它归结为网络层协议;
- ICMP只能搭配 IPv4 使用. 如果是IPv6的情况下, 需要是用ICMPv6。
ICMP的报文格式
- ICMP大概分为两类报文:一类是通知出错原因;一类是用于诊断查询。
ping命令
- 注意:此处 ping 的是域名,而不是 url! 一个域名可以通过DNS解析成IP地址。
- ping命令不光能验证网络的连通性, 同时也会统计 响应时间 和 TTL(IP包中的 Time To Live,生存周期)。
- ping命令会先发送一个 ICMP Echo Request给对端;对端接收到之后, 会返回一个ICMP Echo Reply。
- ping命令基于ICMP, 是在网络层。 而端口号。 是传输层的内容。在ICMP中根本就不关注端口号这样的信息。
traceroute
命令:也是基于ICMP协议实现,能够打印出可执行程序主机,一直到目标主机之前经历多少路由器。
NAT技术背景
NAT技术当前解决IP地址不够用的主要手段,是路由器的一个重要功能。
- NAT能够将私有IP对外通信时转为全局IP。 也就是就是一种将私有IP和全局IP相互转化的技术方法。很多学校, 家庭, 公司内部采用每个终端设置私有IP,而在路由器或必要的服务器上设置全局IP。
- 全局IP要求唯一, 但是私有IP不需要; 在不同的局域网中出现相同的私有IP是完全不影响的。
NAT IP转换过程
- NAT路由器将源地址从10.0.0.10替换成全局的IP 202.244.174.37;NAT路由器收到外部的数据时, 又会把目标IP从202.244.174.37替换回10.0.0.10;
- 在NAT路由器内部, 有一张自动生成的, 用于地址转换的表;当 10.0.0.10 第一次向 163.221.120.9 发送数据时就会生成表中的映射关系。
NAPT
那么问题来了, 如果局域网内, 有多个主机都访问同一个外网服务器, 那么对于服务器返回的数据中, 目的IP都是相同的. 那么NAT路由器如何判定将这个数据包转发给哪个局域网的主机? 这时候NAPT来解决这个问题了. 使用 IP+port 来建立这个关联关系。
- 这种关联关系(互为K值)也是由NAT路由器自动维护的。例如在TCP的情况下。 建立连接时, 就会生成这个表项; 在断开连接后, 就会删除这个表项。NAT在建立映射条目时,可能替换IP地址,可能能替换端口号。
NAT技术的缺陷:
-
由于NAT依赖这个转换表, 所以有诸多限制:
- 无法从NAT外部向内部服务器建立连接;(NAT内网穿透)
- 装换表的生成和销毁都需要额外开销;
- 通信过程中一旦NAT设备异常, 即使存在热备, 所有的TCP连接也都会断开。
NAT和代理服务器
- 从底层实现上讲, NAT是工作在网络层, 直接对IP地址进行替换. 代理服务器往往工作在应用层.
- 从部署位置上看, NAT一般集成在防火墙, 路由器等硬件设备上;代理服务器则是一个软件程序, 需要部署在服务器上。