Java 后端工程师必会知识点 -(分布式 RPC 框架 Dubbo)

你用过 dubbo 嘛，知道他是干嘛的嘛？

Apache Dubbo 是一款高性能、轻量级的开源 Java 服务框架

提供了六大核心能力：面向接口代理的高性能 RPC 调用，智能容错和负载均衡，服务自动注册和发现，高度可扩展能力，运行期流量调度，可视化的服务治理与运维。其实 Dubbo 呢就是一个 RPC 框架。

那你说说什么是 RPC

RPC（Remote Procedure Call）—远程过程调用，它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。比如两个不同的服务 A、B 部署在两台不同的机器上，那么服务 A 如果想要调用服务 B 中的某个方法该怎么办呢？使用 HTTP 请求当然可以，但是可能会比较麻烦。 RPC 的出现就是为了让你调用远程方法像调用本地方法一样简单。

其实就我而言 RPC 的范围还是挺广的，比如举几个简单生产的情况

首先我觉得很少读者公司用的 fegin 其实也算一个简单的 RPC 吧？因为它也是屏蔽了底层的调用，让我们调用远程方法像调用本地方一样的方便。
第二个就是我们说的 dubbo，那他跟 fegin 的一个最大的区别，我觉得就是网络传输的方式不一样，但是他也是一个 RPC 框架，并且性能更好，但是他目前不支持跨语言调用。
第三个 thrift,小六六为啥提到它呢?当一个公司比较大的时候，比如说一个大的互联网公司，肯定不同的部门用的语言不一样，那么你就得上他了，我们这边就有这样的服务。

小伙子可以，那你说说 RPC 的原理吧

服务消费方（client）调用以本地调用方式调用服务；
client stub 接收到调用后负责将方法、参数等组装成能够进行网络传输的消息体；
client stub 找到服务地址，并将消息发送到服务端；
server stub 收到消息后进行解码；
server stub 根据解码结果调用本地的服务；
本地服务执行并将结果返回给 server stub；
server stub 将返回结果打包成消息并发送至消费方；
client stub 接收到消息，并进行解码；
服务消费方得到最终结果。

其实还是蛮简单的，你想清楚就知道是啥了，嘿嘿。大家可以理解记忆，一定要理解

我们重新聊 Dubbo,你对 Dubbo 的各个模块熟悉呢？知道每个模块的作用不

config 配置层：对外配置接口，以 ServiceConfig, ReferenceConfig 为中心，可以直接初始化配置类，也可以通过 spring 解析配置生成配置类
proxy 服务代理层：服务接口透明代理，生成服务的客户端 Stub 和服务器端 Skeleton, 以 ServiceProxy 为中心，扩展接口为 ProxyFactory
registry 注册中心层：封装服务地址的注册与发现，以服务 URL 为中心，扩展接口为 RegistryFactory, Registry, RegistryService
cluster 路由层：封装多个提供者的路由及负载均衡，并桥接注册中心，以 Invoker 为中心，扩展接口为 Cluster, Directory, Router, LoadBalance
monitor 监控层：RPC 调用次数和调用时间监控，以 Statistics 为中心，扩展接口为 MonitorFactory, Monitor, MonitorService
protocol 远程调用层：封装 RPC 调用，以 Invocation, Result 为中心，扩展接口为 Protocol, Invoker, Exporter
exchange 信息交换层：封装请求响应模式，同步转异步，以 Request, Response 为中心，扩展接口为 Exchanger, ExchangeChannel, ExchangeClient, ExchangeServer
transport 网络传输层：抽象 mina 和 netty 为统一接口，以 Message 为中心，扩展接口为 Channel, Transporter, Client, Server, Codec
serialize 数据序列化层：可复用的一些工具，扩展接口为 Serialization, ObjectInput, ObjectOutput, ThreadPool

说说 Dubbo 的架构吧

Dubbo 的架构图解

Provider：暴露服务的服务提供方
Consumer：调用远程服务的服务消费方
Registry：服务注册与发现的注册中心（一般用的 zk）
Monitor：统计服务的调用次数和调用时间的监控中心
Container：服务运行容器(Spring 的容器)

调用关系说明：

服务容器负责启动，加载，运行服务提供者。
服务提供者在启动时，向注册中心注册自己提供的服务。
服务消费者在启动时，向注册中心订阅自己所需的服务。
注册中心返回服务提供者地址列表给消费者，如果有变更，注册中心将基于长连接推送变更数据给消费者。
服务消费者，从提供者地址列表中，基于软负载均衡算法，选一台提供者进行调用，如果调用失败，再选另一台调用。
服务消费者和提供者，在内存中累计调用次数和调用时间，定时每分钟发送一次统计数据到监控中心。

聊聊 Dubbo 的架构设计方法 SPI

对于一个中间件的设计原则，插件化设计，任何的功能都可以设计。

协议扩展
调用拦截扩展
引用监听扩展
暴露监听扩展
集群扩展
路由扩展
负载均衡扩展
合并结果扩展
注册中心扩展
监控中心扩展
扩展点加载扩展
动态代理扩展
编译器扩展
Dubbo 配置中心扩展
消息派发扩展
线程池扩展
序列化扩展
网络传输扩展
信息交换扩展
组网扩展
Telnet 命令扩展
状态检查扩展
容器扩展
缓存扩展
验证扩展
日志适配扩展

其实我觉得这个才是一个代码的设计原则，但是其实很多时候，我们做业务也可以这样设计，高内聚，低耦合嘛。

小伙子不错，那你说说 Dubbo 的通信协议有哪些

dubbo 支持不同的通信协议

dubbo 协议默认就是走 dubbo 协议，单一长连接，进行的是 NIO 异步通信，基于 hessian 作为序列化协议。使用的场景是：传输数据量小（每次请求在 100kb 以内），但是并发量很高。

为了要支持高并发场景，一般是服务提供者就几台机器，但是服务消费者有上百台，可能每天调用量达到上亿次！此时用长连接是最合适的，就是跟每个服务消费者维持一个长连接就可以，可能总共就 100 个连接。基于我们的 selector 模式

rmi 协议走 Java 二进制序列化，多个短连接，适合消费者和提供者数量差不多的情况，适用于文件的传输，一般较少用。
hessian 协议走 hessian 序列化协议，多个短连接，适用于提供者数量比消费者数量还多的情况，适用于文件的传输，一般较少用。

那你说说它的序列化协议有哪些

dubbo 支持 hession、Java 二进制序列化、json、SOAP 文本序列化多种序列化协议，probuffer。但是 hessian 是其默认的序列化协议,其中 probuffer 是最快的。

为啥 probuffer 最快

它使用 proto 编译器，自动进行序列化和反序列化，速度非常快，应该比 XML 和 JSON 快上了 20~100 倍；
它的数据压缩效果好，就是说它序列化后的数据量体积小。因为体积小，传输起来带宽和速度上会有优化。

说说 Dubbo 提供的负载均衡策略

Random LoadBalance(默认，基于权重的随机负载均衡机制)->随机,按权重设置随机概率。在一个截面上碰撞的概率高，但调用量越大分布越均匀，而且按概率使用权重后也比较均匀，有利于动态调整提供者权重。
RoundRobin LoadBalance->(不推荐，基于权重的轮询负载均衡机制)
LeastActive LoadBalance->最少活跃调用数，相同活跃数的随机，活跃数指调用前后计数差。使慢的提供者收到更少请求，因为越慢的提供者的调用前后计数差会越大。
ConsistentHash LoadBalance->一致性 Hash，相同参数的请求总是发到同一提供者。(如果你需要的不是随机负载均衡，是要一类请求都到一个节点，那就走这个一致性 hash 策略。),当某一台提供者挂时，原本发往该提供者的请求，基于虚拟节点，平摊到其它提供者，不会引起剧烈变动。

自己设计一个 RPC 框架，需要考虑些什么

哈哈，其实这个也是考虑一个大局观，问的还是很大，之前小六六写个一个简单的 rpc 轮子，大家可以看看,基本上就是把 duboo 包里面的每个模块自己简单的实现下。一个 Web 后端框架的轮子从处理 Http 请求【基于 Netty 的请求级 Web 服务器】到 mvc【接口封装转发)】，再到 ioc【依赖注入】，aop【切面】，再到 rpc【远程过程调用】最后到 orm【数据库操作】全部自己撸一个（简易）的轮子。

结束

其实 Dubbo 的东西很多，但是要深入讲，每一个点都可以去跟源码，后面有机会可以去跟跟。其实我觉得 Dubbo 的官方文档写的真好，大家不管用不用 dubbo 的，我建议大家去读读，对于我们开发可以有很多的启发点，有机会我给大家说说。

原文链接：https://blog.csdn.net/m0_73088370/article/details/126143412