1. SAPI全称
Server Application Programming Interface: the API used by PHP to interface with Web Servers
https://github.com/laruence/phpbook/blob/master/1.1.md
2. PHP-FPM 工作细节
PHP FastCGI进程管理器PHP-FPM的架构 – 山上小和尚 – 博客园
一个master进程, 支持多个pool, 每个pool由master进程监听不同的端口, pool中有多个worker进程.
每个worker进程都内置PHP解释器, 并且进程常驻后台, 支持prefork动态增加.
每个worker进程支持在运行时编译脚本,
并在内存中
缓存
生成的opcode来提升性能.
每个worker进程支持配置
响应指定请求数后
自动重启, master进程会重启挂掉的worker进程.
每个worker进程能保持一个到MySQL/Memcached/Redis的持久连接, 实现”连接池”, 避免重复建立连接, 对程序透明. 「
只是一个持久连接吗?是的,参见
连接池 – 数据库短连接&长连接&连接池 – 学习/实践_穿素白衫的中少年的博客-CSDN博客
」
使用数据库持久连接时应该设置固定数量的worker进程数, 不要使用动态的prefork模式.
「应是为了避免动态的prefork模式,创建太多的worker进程,导致内存紧张,以及CPU上下文切换频繁,导致性能下降」
经
@syaokun219
和
@IM鑫爷
纠正,以下两句有误:
master进程采用epoll模型异步接收和分发请求,listen监听端口,epoll_wait等待连接.
然后分发给对应pool里的worker进程,worker进程accept请求后poll处理连接.
应该是:
master进程并不接收和分发请求, 而是worker进程直接accept请求后poll处理.
master进程不断调用
epoll_wait
和
getsockopt
是用来异步处理信号事件和定时器事件.
这里提一下, Nginx也类似, master进程并不处理请求, 而是worker进程直接处理,
不过区别在于Nginx的worker进程是epoll异步处理请求, 而PHP-FPM仍然是poll.
— 被标注部分
如果worker进程不够用, master进程会prefork更多进程,
如果prefork达到了pm.max_children上限, worker进程又全都繁忙,
这时master进程会把请求,挂起到连接队列backlog里(默认值是511).
1个PHP-FPM工作进程在同一时刻里只能处理1个请求.
MySQL的最大连接数max_connections默认是151.
只要PHP-FPM工作进程数不超过151, 就不会出现连接不上MySQL的情况.
而且正常情况下, 也不需要开启那么多的PHP-FPM工作进程,
比如,4个PHP-FPM进程就能跑满4个核心的CPU,
那么你开40个PHP-FPM进程也没有任何意义,
只会占用更多的内存, 造成更多的CPU上下文切换, 性能反而更差.
为了减少每个请求都重复建立和释放连接的开销, 可以开启持久连接,
一个PHP-FPM进程保持一个到MySQL的长连接, 实现透明的”连接池”.
Nginx跟PHP-FPM分开, 其实是很好的解耦, PHP-FPM专门负责处理PHP请求, 一个页面对应一个PHP请求,
页面中所有静态资源的请求都由Nginx来处理, 这样就实现了动静分离, 而Nginx最擅长的就是处理高并发.
PHP-FPM是一个多进程的FastCGI服务, 类似Apache的prefork的进程模型,
对于只处理PHP请求来说, 这种模型是很高效很稳定的.
不像Apache(libphp.so), 一个页面, 要处理多个请求, 包括图片, 样式表, JS脚本, PHP脚本等.
php-fpm从5.3开始才进入PHP源代码主干, 之前版本没有php-fpm.
那时的spawn-fcgi是一个需要调用php-cgi的FastCGI进程管理器,
另外像Apache的mod_fcgid和IIS的PHP Manager也需要调用php-cgi进程,
但php-fpm则根本不依赖php-cgi, 完全独立运行, 也不依赖php(cli)命令行解释器.
因为php-fpm是一个
内置了php解释器
的FastCGI服务, 启动时能够自行读取php.ini配置和php-fpm.conf配置.
「
所以,我们通常只要下载安装php-fpm即可,不需要再单独安装PHP
」
个人认为, PHP-FPM工作进程数, 设置为2倍CPU核心数就足够了.
「这是经过实践得出的一个适合的数字,针对具体的业务场景,未必是最佳,但是不差」
毕竟, Nginx和MySQL以及系统同样要消耗CPU.「
这句话的前提是Nginx和MYSQL,与PHP-FPM都部署在同一台机器上,现实中,Nginx和MySQL通常是分开的,至于PHP-FPM要不要单独部署,应视情况而定」
根据服务器内存,来设置PHP-FPM进程数非常不合理,
把内存分配给MySQL, Memcached, Redis, Linux磁盘缓存(buffers/cache)这些服务显然更合适.
过多的PHP-FPM进程反而会增加CPU上下文切换的开销.
PHP代码中应该尽量避免curl或者file_get_contents这些可能会产生较长网络I/O耗时的代码.
「但是实际是,很多服务涉及到网络请求和接收请求的参数,通常会用到curl和file_get_contents,但是应知道,这些网络I/O操作,确实可能会产生较长耗时」
注意设置CURLOPT_CONNECTTIMEOUT_MS超时时间, 避免进程被长时间阻塞.
如果要异步执行耗时较长的任务, 可以 pclose(popen(‘/path/to/task.php &’, ‘r’)); 打开一个进程来处理,
或者借助消息队列, 总之就是要尽量避免阻塞到PHP-FPM工作进程.
「异步执行耗时较长的任务,通过方式一,以往的工作中没见过,通常采用的是方式二
原因推测:方式一依然要消耗服务器的各种资源,而且存在消息/数据丢失的可能,而且代码耦合,也不利于服务扩展。
方式二,则可以使用独立的服务部署,解耦,适合扩展,降低或保证消息/数据不会丢失,方案很成熟」
在php-fpm.conf中把request_slowlog_timeout设为1秒, 在slowlog中查看是否有耗时超过1秒的代码.
优化代码, 能够为所有PHP-FPM工作进程减负,这个才是提高性能的根本方法.
能让CPU满负荷运行的操作可以视为CPU密集型操作.
curl和下载
则是典型的I/O密集型操作, 因为耗时主要发生在网络I/O和磁盘I/O.
需要PHP认证的下载操作可以委托为
Nginx的AIO线程池:
header(“X-Accel-Redirect: $file_path”);
至于curl操作, 比如可以建立一个监听9001端口的名为upload的PHP-FPM进程池(pool),
专门负责处理curl操作(通过Nginx分发), 避免curl操作阻塞到监听9000端口的计算密集的www进程池.
这时upload进程池多开点进程也无所谓.
这里想达到的效果:
就是将计算密集型业务和I/O密集型业务分开,达到互不影响,从而达到资源的最大有效利用率。
另外,下面这篇文章,也可以佐证上面红色标注部分
21 | 为什么用了负载均衡更加不均衡?-极客时间
|