Socket 编程原理

socket编程

基本概念

socket编程即计算机网络编程，目的是使两台主机能够进行远程连接，既然要使两者产生联系，那么就要有至少一个信息发送端和一个信息接收端，因此形成了现在绝大多数 socket 编程都会用到的 C/S 架构（Client[客户端]/Server[服务端]），最典型的应用就是 web服务器/客户端。

在 Unix/Linux 中执行任何形式的 I/O 操作（比如网络连接）时，都是在读取或写入一个文件描述符，而在 Windows 中则被称为文件句柄，其本质都是一个东西，但是 Windows系统会把 socket 当成一个网络连接，需要调用专门设计的数据传输函数。

socket （套接字）是一种抽象层，程序通过它来收发数据，就像打开一个句柄将数据写在存储器上一样，使用 socket 能将程序放在网络中，并与同一网络下其他计算机进行通信。

现在问题又来了，主机内部应用间进行通信，不同应用可用进程号作为唯一标识，那么在网络间通信用什么作为唯一标识呢？其实 TCP/IP 协议簇已经解决了问题，在网络层 IP 地址可以用作网络中主机的唯一标识，传输层的”协议+端口”可用作主机应用的唯一标识，因此利用三元组（IP地址、协议、端口）就可以标识网络应用了，网络应用间可以用三元组作为标志和其他应用进行交互，socket 通信大致如下：

在这里插入图片描述

如图所示，应用程序进程在网络间的通信全部通过 socket 与底层协议交互，进行网络通信，但是 socket 并没有层的概念，它只是一种设计模式（软件抽象层），方便编程而已。

编程流程

socket 编程的底层实现是基于 TCP 和 UDP 的，因此其编程的流程也是围绕着这两个协议的客户端、服务端来进行的，大致流程如下图：

在这里插入图片描述

socket函数

在实现上述功能的过程中，要用到很多接口函数，这一节就针对这些接口函数作详细解释。

1、socket()

这个函数作用是创建一个 socket 的操作对象，它被用作 socket 描述符的唯一标识（相当于文件描述符），在本地我们可以用这个对象进行文件操作，在主机远程连接时则可以用于建立连接、收发数据。

2、bind()

这是服务器端特有的接口函数，把 socket 对象和服务器的 IP 地址、开放端口绑定在一起，在 listen() 的调用下提供服务，客户端可以通过这个来连接服务器。但是客户端是没有 bind() 绑定地址和端口的，因为客户端不用发起监听，在客户端是在调用 connect() 时由系统随机生成一个。

3、listen()

也是服务器端特有的一个接口函数，作用是监听一个端口是否有数据发送过来，函数工作的时候会调用 bind() 函数，获取里面的套接字、地址和端口信息，如果有指向这个套接字描述符、本服务器地址和正在监听的这个端口的连接发送过来，则会让其通过并开始建立连接。

4、connect()

这个函数接口是 TCP 客户端特有的，用于向服务器发起连接建立请求。只要在 connect() 的参数中输入目标服务器的地址和端口，就会向目标发起连接请求，在服务端收到请求后就会调用 accept() 开始自动进行三次握手，从而建立连接。

5、accept()

这个函数接口是 TCP 服务端特有的，当 listen() 监听到请求后就会调用这个函数去建立连接，也就是说，只要这个函数执行成功，与客户端的连接就建立完成，并且可以互相传输数据了。

6、recv()，recvfrom()

这两个函数接口是用来接收数据的，recv() 方法对应 TCP 数据流，recvfrom() 则对应 UDP 数据流，因为 TCP 面向连接而 UDP 传输数据并不创建连接，所以要分这两种办法进行数据的接收。

7、send()，sendto()

和第 6 点的函数接口类似，但是用于发送数据的，和 recv()、recvfrom() 一起实现了网络中不同进程间的通信，其中 send() 对应 TCP 的传输方式，sendto() 对应的是 UDP 的传输方式。

8、read()，write()

这两个函数其实是通用的 I/O 读写操作，可以用来读写本地的文件，自然也可以用于网络间的读写操作。

9、close()

当客户端和服务端建立连接并处理完业务后，就要关闭相应的 socket 描述符以节省系统资源。在调用 close() 后，该 socket 描述字的引用计数 -1，不能够再由对应的调用进程使用，但是只有当引用计数=0 的时候，才会触发 TCP 客户端向服务端发起终止连接的请求。

协议

既然是通过底层协议进行信息传递，那么肯定少不了 OSI 七层模型：

科来公司网络通信协议图(部分)

现在有很多

文章

都讲得比较详细了，这里就只列出一些 socket 编程会用到的协议。

TCP

TCP 协议是一种面向连接的、可靠的、基于字节流的传输层通信协议，是为了互联网上提供可靠的端到端字节流而专门设计的，因此 TCP 协议做了一些规定：数据分片、到达确认、超时重发、滑动窗口、失序处理、重复处理、数据校验。

作为可靠传输的一种协议，它有以下特点：

1.基于流的方式

2.面向连接

3.网络不佳时尽量降低系统由于重传带来的带宽开销

4.连接维护面向通信的两个端点

在连接上，因为是可靠的，所以在建立连接的时候会进行三次握手，断开连接的时候则会进行四次挥手，在 socket 编程中体现如下：

在这里插入图片描述

在 socket 编程中，因为可靠性，TCP 是用的最多的连接协议，就连 http 协议也是基于 TCP 的。

当两台主机要建立 TCP 连接时，客户端要向服务端发送 SYN 包发起连接请求，服务端收到 SYN 包后获取到客户端地址然后响应一个 SYN+ACK 包进行确认，表示接受连接，客户端收到这个确认包后也会返回一个用于确认的 ACK，到这里连接就建立完成了，接下来就可以传输数据了；

如图所示，TCP 为了保证可靠性和降低开销，每次传输的数据是分片传输的，第一个分片会告诉服务端这一次有多少个分片要传输，传输序号为最后一个的分片则会告诉服务端数据传输完毕，服务端每接收一次数据包就会响应一个 ACK 确认，反过来也一样；

在断开连接的时候则要经过四次挥手，断开连接的发起方可以是客户端也可以是服务端，其中一方发送 FIN+ACK 包告诉另一端数据传输完毕，询问是否能够断开连接，另一端收到后响应一个 ACK ，如果数据未接收完成，则通过这个 ACK 告诉对方未接收完成，暂时不要断开连。若数据传输完毕，则会发送 FIN 给信息发送方，告诉对方数据接收完成，准备好关闭连接了，另一端接收到 FIN 包后响应一个 ACK，同时状态变成 TIME_WAIT，接收方收到 ACK 确认后就断开连接，发送端等待 2msl 后若没收到接收端新的信息也会断开连接。

上面的原理看起来很复杂，但是在 socket 层面就简化了很多，双方在连接前都要先建立好套接字，服务端还要开启监听，准备工作就完成了。客户端用 connect() 向服务端发起连接请求，服务端监听到请求后用 accept() 建立连接，这样三次握手就完成了；接下来连接双方都可以用 recv() 方法和 send() 方法进行数据的收发；数据传输完成后直接调用 close() 方法就可以完成四次挥手从而断开连接。

UDP

UDP 协议和 TCP 一样用来处理数据包，并且都位于传输层，不同的是 UDP 提供面向事务的简单不可靠信息传送服务，也就是说 UDP 协议的数据包发送后是没法知道是否安全、完整到达的，而且也不提供向 TCP 那样分片、重传、确认等功能，但是有个优点就是传输性能比 TCP 要高很多，毕竟不用分配资源去保证可靠性。因此在一些条件下 UDP 传输会更加实用。

在 socket 编程中，用 UDP 协议传输数据也非常简单，客户端和服务端双方分别绑定套接字，服务端开始监听，客户端用 sendto() 直接发送数据，然后调用 close() 关闭数据出口，服务端则用 recvfrom() 接收；一次 UDP 数据传输就结束了。虽然 UDP 传输非常节省资源，但是会存在各种问题，因此在编程的时候要注意：一个 UDP 包允许报文长度 <512 字节，而 TCP 报文允许 >512 字节。

DNS

DNS 协议即地址解析协议，作用是将域名和 IP 地址互相转换，因为是基于 TCP、UDP 协议工作的，因此可以通过 socket 编程来实现其中的一些功能。在这之前我们先简单了解一下 DNS：

首先，DNS（域名系统）是一个分布式数据库，被用来维护系统内每个主机名和 IP 的对应关系，用户输入域名时会自动查询 DNS 服务器，由服务器检索数据库，返回相应的 IP 地址；

如果指定的 DNS 服务器没有记录，则会向上一层次的 DNS 服务器发起查找请求，各逻辑的树形结构（域名空间结构）如下图：

在这里插入图片描述

在解析请求时，如果本地（hosts文件）没有目标信息，就会去询问其他 DNS 服务器，这个过程是逐级提交的，其由高到低的层次划分可以分为下面几大类：

分类	作用
根域名服务器	最高层次的域名服务器，全世界仅13台，负责管理顶级域名
顶级域名服务器	负责管理在该顶级域名服务器下注册的二级子域
权威域名服务器	负责一个区的域名解析工作
本地域名服务器	当主机发起DNS查询请求时第一个查询的对象，一般为主机hosts文件/本地DNS服务器

当其他 DNS 服务器返回查询结果时，该 DNS 服务器会把结果记录在本地缓存中，成为 DNS 缓存。

查询方式分为两种：

1.递归查询：在该模式下 DNS 服务器接收到客户机请求，必须使用一个准确的查询结果回复客户机。如果 DNS 服务器本地没有存储查询 DNS 信息，那么该服务器会询问其他服务器，并将返回的查询结果提交给客户机；

2.迭代查询：当客户机发送查询请求时，DNS 服务器并不直接回复查询结果，而是告诉客户机另一台 DNS 服务器地址，客户机再向这台 DNS 服务器提交请求，依次循环直到返回查询的结果为止。

基于这些理论，我们可以利用 socket 构造 DNS 查询请求，甚至可以把连接产生的 TCP 流量封装到 DNS 查询里，实现内网穿透。

HTTP

HTTP 协议（超文本传输协议）是现在互联网中最常用的一种网络协议，是一个标准的请求-应答模型（B/S），也就是说通信过程永远都是客户端发起请求，服务器返回响应信息，当然，也是基于 TCP 协议进行通信的。在客户机与服务器建立连接后，浏览器可以向 web 服务器发送请求并显示收到的网页，当用户在浏览器地址栏中输入一个 URL 时就会向 web 服务器发出 HTTP 请求，信息包括请求修饰符、客户端信息、提交的数据等，web 服务器接收到请求后对其进行处理并响应，响应的内容包括响应状态码、协议版本、服务器的部分信息、实体信息等，这些内容以 HTTP 规定的格式送回给客户端浏览器，浏览器对其进行显示。另外，HTTP 协议是无状态协议，即对事务处理没有记忆能力，在服务器不需要先前信息时应答速度就会很快。

在 socket 编程中也遵循这个模型，分为客户端、服务端，客户端可以构造请求，发送数据给服务器，服务端可以发布静态/动态资源，供客户端获取，或者提供 I/O 接口，进行数据交互，也可以通过连接数据库，实现数据存储、查询等功能。

其工作流程如下：

1.浏览器根据域名解析 IP 地址；

2.客户端通过浏览器与 web 服务器建立一个 TCP 连接；

3.客户端向服务端发起请求；

4.服务端响应客户端的 HTTP 请求，返回 html 代码；

5.客户端解析 html 代码，请求资源；

6.资源下载完毕后关闭 TCP 连接，浏览器对页面进行渲染然后呈现给用户。

客户端根据服务器的设置发起的请求有很多种，下面列出一些常见的请求方式：

方法	作用
GET	申请获取资源
POST	客户端向服务器提交数据的方法
HEAD	申请获取响应的头部信息
PUT	用于上传资源
DELETE	用于删除资源
TRACE	用于返回原始请求内容，可用来查看中间服务器对http请求的影响
OPTIONS	用于查看服务器对特定URL都支持哪些请求
CONNECT	用于代理服务器，可把请求的连接转换成隧道
PATCH	对资源做部分修改

每次请求的请求头都会附加一些信息，补充了请求的附加内容、客户端信息、相应内容相关优先级信息，下面是一些常见的请求头信息：

头部字段名	说明
Accept	用户代理可处理的媒体类型
Accept-Charset	优先的字符集
Accept-Encoding	优先的内容编码
Accept-Language	优先的语言
Authorization	web认证信息
Expect	期待服务器的特定行为
From	用户邮箱地址
Host	请求资源所在的服务器
Proxy-Authorization	代理服务器要求客户端的认证信息
Range	实体的字节范围请求
Referer	对请求中uri的原始获取方式
TE	传输编码优先级
User-Agent	浏览器信息

而响应头则补充了资源内容更新时间等与实体有关的信息

头部字段名	说明
Accept-Ranges	是否接收字节范围的请求
Age	资源创建时间
ETag	资源匹配信息
Location	让客户端重定向到某uri
Proxy-Authenticate	代理服务器对客户端的认证信息
Retry-After	对再次请求的发起时机要求
Server	服务器的banner信息
Vary	代理缓存的管理信息
WW-Authenticate	服务器对客户端的认证信息

实体资源的头部：

头部字段名	说明
Allow	资源可支持的http方法
Content-Encoding	适用的编码方式
Content-Language	优先语言
Content-Length	网页资源的大小
Content-Location	替代对应资源的uri
Content-MD5	资源的md5值
Content-Range	资源的位置范围
Content-Type	接收的数据格式类型
Expires	资源过期的时间
Last-Modified	资源最后修改日期

除了上面的特征头部字段，还有通用的头部字段：

头部字段名	说明
Cache-Control	进行缓存操作的工作机制
Connection	控制不在转发给代理的首部字段，管理持久连接
Date	创建报文的时间
Pragma	编译报文指令
Transfer-Encoding	指定主体传输的编码方式
Upgrade	用于检测HTTP及其他协议是否可使用更高的版本进行通信
Via	代理相关信息
Warning	报错通知

HTTPS

HTTPS 是加密的 HTTP 通道，因为 HTTP 传输是明文的，存在信息泄露的风险，因此HTTPS就是在这基础上通过传输加密和身份认证保证了传输过程的安全性。

HTTPS 其实并不是应用层的新协议，而是在 http 接口通过 SSL、TLS 来加密和认证的机制，其加密过程如下：

1.客户端和服务器进行握手请求（https的握手）

2.协商加密算法

（客户端告诉服务器自己支持多少种加密组合，一个组合里面有对称、非对称、hash、密钥交换算法，服务器选择自己支持的加密强度最高的一种）

3.服务器发公钥证书给客户端

4.客户端收到后在本地进行证书匹配（验证）

（本地有根证书能解开的就说明这个公钥是那个根证书的公司签名的，没有能解开的就是不受信任的）

5.客户端收到后在本地随机生成对称密钥（本次会话结束失效）

6.客户端把生成的对称密钥用服务器给的公钥加密发给服务器

7.服务器拿到用自己公钥加密的密文后用私钥解开，取得内容

开始传输数据（两边都有加密密钥）

8.客户端把

加密的信息

和

对应的hash值

、

加了密的hash值

发给服务器

（明文信息用对称密钥加密，然后做hash计算，生成固定长度的hash值，用得到的公钥证书里的公钥对这个hash进行加密，生成hash值（给hash加密））

9.服务器拿到这3部分信息后，用自己的私钥解开由自己公钥

加了密的hash值

，和客户端发的

对应的hash值

做比较，如果相同就表示没被篡改，再用客户端发的对称密钥解开加密的信息，再做hash计算，计算出的hash值和

对应的hash值

做比较，相同的话表示数据完整性没被破坏（身份验证）

10.服务器开始接收数据

在 socket 编程中也是可以实现 https，只是除了基本的 http 模块外还需要导入 SSL 相关的模块，编程的流程大致如下：

在这里插入图片描述

如果有不对的地方，还请各位大佬指出 ^ _ ^

原文链接：https://blog.csdn.net/SmartShepi/article/details/115326953

目录