【redis】常见JedisConnectionException异常分析

  • Post author:
  • Post category:其他





纯属用于笔记,转自:

http://blog.csdn.net/fachang/article/details/7984123






最近项目开发中用到了Redis, 选择了官网推荐的java client Jedis。


Redis常用命令学习:

http://redis.io/commands


Redis官方推荐Java客户端Jedis(包含了所有Redis命令的实现):

https://github.com/xetorthio/jedis

Jedis使用过程中最常见异常JedisConnectionException有时确实给我们带来了很多困惑,这个异常通常出现在两个使场景。



一、当我们执行如下JedisPool类实例的getResource()时抛出can’t get a resource异常。







异常代码如下:



redis.clients.jedis.exceptions.JedisConnectionException




: Could not get a resource from the pool




at redis.clients.util.Pool.getResource(

Pool.java:22

)

分析:



redis.clients.util.Pool.getResource会从JedisPool实例池中返回一个可用的redis连接。分析源码可知

JedisPool extends redis.clients.util.Pool<Jedis>

.而Pool<T>是通过

commons-pool开源工具包中的

org.apache.commons.pool.impl.GenericObjectPool

来实现对Jedis实例的管理的。所以我们分析一下GenericObjectPool或许能找到答案。




首先看一下common-pool的api:

http://commons.apache.org/pool/apidocs/index.html?org/apache/commons/pool/impl/GenericObjectPool.html





其中三个重要个几个属性是:




MaxActive

: 可用连接实例的最大数目,为负值时没有限制。




MaxIdle

: 空闲连接实例的最大数目,为负值时没有限制。Idle的实例在使用前,通常会通过org.apache.commons.pool.BasePoolableObjectFactory<T>的activateObject()方法使其变得可用。




MaxWait

: 等待可用连接的最大数目,单位毫秒(million seconds)。

(注:pool.getResource()方法实际调用的GenericObjectPool类borrowObject()方法,该方法会根据MaxWait变量值在没有可用连接(idle/active)时阻塞等待知道超时,具体含义参看api。)





也就是说当连接池中没有active/idle的连接时,会等待maxWait时间,如果等待超时还没有可用连接,则抛出Could not get a resource from the pool异常。所以为避免这样的错误,

我们应该根据程序实际情况合理设置这三个参数的值,同时在我们获取一个连接的程序方法中也应该合理的处理这个异常,当没有连接可用时,等待一段时间再获取也许是个比较好的选择。

二、当我们获取连接后对redis进行操作时,抛出redis.clients.jedis.exceptions.JedisConnectionException: java.net.SocketTimeoutException: Read timed out异常。



异常代码如下:


redis.clients.jedis.exceptions.JedisConnectionException: java.net.SocketTimeoutException: Read timed out




at redis.clients.jedis.Protocol.process(Protocol.java:79)



at redis.clients.jedis.Protocol.read(Protocol.java:131)



at redis.clients.jedis.Connection.getIntegerReply(Connection.java:188)



at redis.clients.jedis.Jedis.sismember(Jedis.java:1266)






这是一个比较麻烦的异常,困扰了我一天的时间。我们都知道Redis是对内存进行操作,速度应该都在毫秒级,这是我们通常的认识,所以当对Redis操作出现几秒的超时时间,你能想象吗?



我们还是先分析一下Jedis的源代码吧,以sadd操作为例:





  1. public Long sadd(final String key, final String… members) {




  2. checkIsInMulti();



  3. client.sadd(key, members);



  4. return client.getIntegerReply();



  5. }






client是redis.clients.jedis.Client.java的实例,继承关系如下:






public class Client extends BinaryClient implements Commands;




public class BinaryClient extends Connection;




Connection包装了对Redis server的socket操作,命令写操作通过socket.getOutputStream()输出流将命令信息发送到redis server,当写完命令后要通过socket.getInputStream()的到的输入流将

命令执行结果返回,这中间必然会有一个命令执行到结果返回的延时时间,这就是一个Jedis调用redis命令操作所用的时间。





需要说明的是,Redis server是单线程执行所有连接发送过来的命令的,也就是说不管并发中有多少个client在发送命令,redis-server端是单线程处理的,并按照默认的FIFO方式处理请求,

这个可在redis.conf配置文件中配置。关于redis server的详细运行机制参见:http://redis.io/documentation




所以client.sadd(key, members);调用完后只是将命令信息发送到了redis server端,具体有没有执行要看redis server的负载情况。然后,通过client.getIntegerReply();等待(time out)返回结果。



Connection初始化socket时有多种选择,其中设置socket time out 的方法如下:




  1. public void rollbackTimeout() {




  2. try {




  3. socket.setSoTimeout(timeout);



  4. socket.setKeepAlive(false);



  5. } catch (SocketException ex) {




  6. throw new JedisException(ex);



  7. }



  8. }






由redis.clients.jedis.Protocol.DEFAULT_TIMEOUT = 2000 我们知道默认的超时时间是2秒,这个时间相对于redis操作内存毫秒级的速度来说已经很长,那我们为什么还会遇到




ava.net.SocketTimeoutException: Read timed out异常呢?redis操作内存虽然平均毫秒级的,但当数据量很大时未必都如此快速。在我的开发过程中就遇到过一个集合到了


千万级数据量,一次操作超时时间在秒级是很正常的,而且机器性能很好的情况下已经如此,更何况我们本机开发的机器相对于生产服务器来说速度会更慢了。所以在初始化JedisPool时应该根据实际

情况通过redis.clients.jedis.JedisPoolConfig合理设置连接池参数,通过edisPool构造方法,合理设置socket读取输入InputStream的超时时间。


  1. pool = new JedisPool(config, host, port, 100000);



注意第四个参数time out,设置成我们能容忍的超时时间,单位是毫秒。但不知道为什么既然单位是毫秒,为什么参数类型是int而不是long。



设置第四个参数后,我在四千万数据量集合上操作最多一次大概超时5秒,问题基本解决。