【最佳实践】如何优雅的进行重试-瞿广的博客

最近公司在搞活动，需要依赖一个第三方接口，测试阶段并没有什么异常状况，但上线后发现依赖的接口有时候会因为内部错误而返回系统异常，虽然概率不大，但总因为这个而报警总是不好的，何况死信队列的消息还需要麻烦运维进行重新投递，所以加上重试机制势在必行。

重试机制可以保护系统减少因网络波动、依赖服务短暂性不可用带来的影响，让系统能更稳定的运行的一种保护机制。让你原本就稳如狗的系统更是稳上加稳。

为了方便说明，先假设我们想要进行重试的方法如下：

public class HelloService{
  private static AtomicLong helloTimes = new AtomicLong();
  public String hello(){
    long times = helloTimes.incrementAndGet();
    if(times%4 != 0){
      log.warn("发生异常，time：{}",LocalTime.now());
      throw new HelloRetryException("发生hello异常");
    }
    return "Hello";
  }
}

也就是说，这个接口每调4次才会成功一次。

0|2 手动重试

先来用最硬核也是最简单的方法，直接在调用的时候用for循环进重试

程序在极短的时间内进行了4次重试，然后成功返回。

这样虽然看起来可以解决问题，但实践上，由于没有重试间隔，很可能当时依赖的服务尚未从网络异常中恢复过来，所以极有可能接下来的几次调用都是失败的。

而且，这样需要对代码进行大量的侵入式修改，显然，不优雅。

0|3 代理模式

上面的处理方式由于需要对业务代码进行大量修改，虽然实现了功能，但是对原有代码的侵入性太强，可维护性差。

所以需要使用一种更优雅一点的方式，不直接修改业务代码，那要怎么做呢？

其实很简单，直接在业务代码的外面再包一层就行了，代理模式在这里就有用武之地了。

public class HelloRetryProxyService implements IHelloService{
  @Autowired
  private HelloRetryService helloRetryService;

  @Override
  public String hello(){
    int maxRetryTimes = 4;
  }
}

这样，重试逻辑就都由代理类来完成，原业务类的逻辑就不需要修改了，以后想修改重试逻辑也只需要修改这个类就行了，分工明确。比如，现在想要在重试之间加上一个延迟，只需要做一点点修改即可：


public String hello(){
  int maxRetryTimes = 4;
  String s = "";
  for(int retry = 1; retry <= maxRetryTimes; retry++){
    try{
      s = helloRetryService.hello();
      return s;
    } catch (HelloRetryException e){
      log.info("调用失败，准备重试")
    }
    //延时一秒
    try{
      Thread.sleep(1000);
    } catch (InterruptedException e){
        e.printStrackTrace();
    }
  }
  throw new HelloRetryException("重试次数耗尽");
}

代理模式虽然要更加优雅，但是如果依赖的服务很多的时候，要为每个服务都创建一个代理类，显然过于麻烦，而且其实重试的逻辑都大同小异，无非就是重试的次数和延时不一样而已。如果每个类都写这么一长串类似的代码，显然，不优雅！

0|4 JDK动态代理

这时候，动态代理就闪亮登场了。只需要写一个代理处理类，就可以开局一条狗，砍到九十九。

@Slf4j
public class RetryinvocationHandler implements InvocationHandler{
  private final Object subject;
  public RetryInvocationHandler (Object subject){
    this.subject = subject;
  }

  @Override
  public Object invoke(Object proxy,Method method,Object[] args) throws throwable{
    int times = 0;
    while(times < RetryConstant.MAX_TIMES){
      try {
        return methos.invoke(subject,args);
      } catch (Exception e){
        times++;
        log.info();
        if(times >= RetryConstant.MAX_TIMES) {
          throw new RuntimeException(e);
        }
      }
      //延时一秒
      try{
        Thread.sleep(1000);
      } catch (interruptedException e){
        e.printStackTrace();
      }
    }
    return null;
  }
  /**
   * 获取动态代理
   *
   * @param realSubject 代理对象
   */
   public static Object getProxy(Object realSubject){
     InvocationHandler handler = new RetryInvocationHandler(realSubject);
     return Proxy.newProxyInstance(handler.getClass().getClassLoader()),
            realSubject.getClass().getInterfaces(),handler);
   }



}

来一发单元测：

@Test
public void helloDynamicProxy(){
  IHelloService realService = new HelloService();
  IHelloSerivce ProxyService = (IHelloSerivce)RetryInvocationHandler.getProxy(realService);

  String hello = proxyService.hello();
  log.info("hello:{}",hello);
}

在重试了4次之后输出了Hello，符合预期。

动态代理可以将重试逻辑都放到一块，显然比直接使用代理类要方便很多，也更加优雅。

不过不要高兴的太早，这里因为被代理的HelloService是一个简单的类，没有依赖其它类，所以直接创建是没有问题的，但如果被代理的类依赖了其它被Spring容器管理的类，则这种方式会抛出异常，因为没有把被依赖的实例注入到创建的代理实例中。

这种情况下，就比较复杂了，需要从Spring容器中获取已经装配好的，需要被代理的实例，然后为其创建代理类实例，并交给Spring容器来管理，这样就不用每次都重新创建新的代理类实例了。

新建一个工具类，用来获取代理实例：

使用的是JDK动态代理：

至此，主要代码就完成了，修改一下HelloService类，增加一个依赖：

img/java-retry-hello-service.jpg

NameService其实很简单，创建的目的仅在于测试依赖注入的Bean能否正常运行。

@Service
public class NameService {
  public String getName(){
     return "Frank";
  }
}

来一发测试：

@Test
public void helloJdkProxy() throws InvocationTargetException, 
                                    NoSuchMethodException,InstantiationException, 
                                    IllegalAccessException{
    IHelloService proxy = (IHelloService) retryProxyHandler.getProxy(HelloService.class);
    String hello = proxy.hello();
    log.info("hello:{}", hello);
}

完美，这样就不用担心依赖注入的问题了，因为从Spring容器中拿到的Bean对象都是已经注入配置好的。当然，这里仅考虑了单例Bean的情况，可以考虑的更加完善一点，判断一下容器中Bean的类型是Singleton还是Prototype，如果是Singleton则像上面这样进行操作，如果是Prototype则每次都新建代理类对象。

另外，这里使用的是JDK动态代理，因此就存在一个天然的缺陷，如果想要被代理的类，没有实现任何接口，那么就无法为其创建代理对象，这种方式就行不通了。

0|5 CGLib 动态代理

既然已经说到了JDK动态代理，那就不得不提CGLib动态代理了。使用JDK动态代理对被代理的类有要求，不是所有的类都能被代理，而CGLib动态代理则刚好解决了这个问题。

创建一个CGLib动态代理类：

img/java-retry-cglib-proxy.jpg

想要换用CGLib动态代理，替换一下这两行代码即可：

// 3. 不存在则生成代理对象
//     bean = RetryInvocationHandler.getProxy(source);
CGLibRetryProxyHandler proxyHandler = new CGLibRetryProxyHandler();
bean = proxyHandler.getCglibProxy(source);

开始测试：

@Test
public void helloCGLibProxy(){
  IHelloService proxy = (IHelloService)retryProxyHandler.getProxy(HelloServcie.class);
  String hello = proxy.hello();
  log.info("hello:{}",hello);

  hello=proxy.hello();
  log.info("hello:{}",hello);
}

这样就很棒了，完美的解决了JDK动态代理带来的缺陷。优雅指数上涨了不少。

但这个方案仍旧存在一个问题，那就是 需要对原来的逻辑进行侵入式修改，在每个被代理实例被调用的地方都需要进行调整，这样仍然会对原有代码带来较多修改。

0|6 Spring AOP

想要无侵入式的修改原有逻辑？想要一个注解就实现重试？用Spring AOP不就能完美实现吗？使用AOP来为目标调用设置切面，即可在目标方法调用前后添加一些额外的逻辑。

先创建一个注解：

@Target(ElementType.METHOD)
@Retention(RetentionPolicy.RUNTIME)
@Documented
public @interface Retryable {
  int retryTimes() default 3;
  int retryInterval() default 1;
}

有两个参数，retryTimes 代表最大重试次数，retryInterval代表重试间隔。

然后在需要重试的方法上加上注解：

@Retryable(retryTimes = 4, retryInterval = 2)
public String hello(){
  long times = helloTimes.incrementAndGet();
  log.info("hello times:{}",times)
  if(time %4 !=0){
    log.warn("发生异常，time：{}",LocalTime.now());
    throw new HelloRetryException("发生Hello异常");
  }
  return "hello "+ nameService.getName();
}

接着，进行最后一步，编写AOP切面

开始测试：

这样就相当优雅了，一个注解就能搞定重试，简直不要更棒。

0|7 Spring 的重试注解

实际上Spring中就有比较完善的重试机制，比上面的切面更加好用，还不需要自己动手重新造轮子。

那让我们先来看看这个轮子究竟好不好使。

先引入重试所需的jar包：

		<dependency>
			<groupId>org.springframework.retry</groupId>
			<artifactId>spring-retry</artifactId>
		</dependency>
    
		<dependency>
			<groupId>org.aspectj</groupId>
			<artifactId>aspectjweaver</artifactId>
		</dependency>

然后在启动类或者配置类上添加@EnableRetry注解，接下来在需要重试的方法上添加@Retryable注解

@Retryable
public String hello(){
  long times = helloTimes.incrementAndGet();
  log.info("hello times:{}",times)
  if(time %4 !=0){
    log.warn("发生异常，time：{}",LocalTime.now());
    throw new HelloRetryException("发生Hello异常");
  }
  return "hello "+ nameService.getName();
}

默认情况下，会重试三次，重试间隔为1秒。当然我们也可以自定义重试次数和间隔。这样就跟我前面实现的功能是一毛一样的了。

但Spring里的重试机制还支持很多很有用的特性，比如说，可以指定只对特定类型的异常进行重试，这样如果抛出的是其它类型的异常则不会进行重试，就可以对重试进行更细粒度的控制。默认为空，会对所有异常都重试。

@Retryable(value = {HelloRetryException.class})
public String hello(){
  ...
}

也可以使用include和exclude来指定包含或者排除哪些异常进行重试。
可以用maxAttemps指定最大重试次数，默认为3次。
可以用interceptor设置重试拦截器的bean名称。
可以通过label设置该重试的唯一标志，用于统计输出。
可以使用exceptionExpression来添加异常表达式，在抛出异常后执行，以判断后续是否进行重试。

此外，Spring中的重试机制还支持使用backoff来设置重试补偿机制，可以设置重试间隔，并且支持设置重试延迟倍数。

举个例子：

@Retryable(value = {HelloRetryException.class}, maxAttempts = 5,
          backoff = @Backoff(delay = 1000, mutiplier = 2}))
public String hello(){
  ...
}

该方法调用将会在抛出HelloRetryException异常后进行重试，最大重试次数为5，第一次重试间隔为1s，之后以2倍大小进行递增，第二次重试间隔为2s，第三次为4s，第四次为8s。

重试机制还支持使用@Recover 注解来进行善后工作，当重试达到指定次数之后，将会调用该方法，可以在该方法中进行日志记录等操作。

这里值得注意的是，想要@Recover 注解生效的话，需要跟被@Retryable 标记的方法在同一个类中，且被@Retryable 标记的方法不能有返回值，否则不会生效。

并且如果使用了@Recover注解的话，重试次数达到最大次数后，如果在@Recover标记的方法中无异常抛出，是不会抛出原异常的。

@Recover
public boolean recover(Exception e) {
  log.error("达到最大重试次数",e);
  return false;
}

除了使用注解外，Spring Retry 也支持直接在调用时使用代码进行重试：

@Test
public void normalSpringRetry(){
  // 表示哪些异常需要重试，key表示异常的字节码，value为true表示需要重试
  Map<Class<? extends Throwable>, Boolean> exceptionMap = new HashMap<>();
  exceptionMap.put(HelloRetryException.lcass,true);

  //构建重试模板实例
  RetryTemplate retryTemplate = new RetryTemplate();

  //设置重试回退操作策略，主要设置重试间隔时间
  FixedbackOffpolicy backOffPolicy = new FixedBackOffPolicy();
  long fixedPeriodTime = 1000L;
  backOffPolicy.setBackOffPerild(fixedPeriodTime);

  //设置重试策略，主要设置重试次数
  int maxRetryTimes = 3;
  SimpleRetryPolicy retryPolicy = new SimpleRetryPolicy(maxRetryTimes, exceptionMap);

  retryTemplate.setRetryPolicy(retryPolicy);
  retryTemplate.setBackOffPolicy(backOffPolicy);

  Boolean execute = retryTemplate.execute(
    //RetryCallback
    retryContext -> {
      String hello = helloService.hello();
      log.info("调用的结果：{}",hello)
      return true;
    }
    //RecoverCallback
    retryContext -> {
      //RecoveryCallback
      log.info("已达到最大重试次数");
      return false;
    }
  )

}

此时唯一的好处是可以设置多种重试策略：

NeverRetryPolicy：只允许调用RetryCallback一次，不允许重试
AlwaysRetryPolicy：允许无限重试，直到成功，此方式逻辑不当会导致死循环
SimpleRetryPolicy：固定次数重试策略，默认重试最大次数为3次，RetryTemplate默认使用的策略
TimeoutRetryPolicy：超时时间重试策略，默认超时时间为1秒，在指定的超时时间内允许重试
ExceptionClassifierRetryPolicy：设置不同异常的重试策略，类似组合重试策略，区别在于这里只区分不同异常的重试
CircuitBreakerRetryPolicy：有熔断功能的重试策略，需设置3个参数openTimeout、resetTimeout和delegate
CompositeRetryPolicy：组合重试策略，有两种组合方式，乐观组合重试策略是指只要有一个策略允许重试即可以，悲观组合重试策略是指只要有一个策略不允许重试即可以，但不管哪种组合方式，组合中的每一个策略都会执行

可以看出，Spring中的重试机制还是相当完善的，比上面自己写的AOP切面功能更加强大。

回退策略

NoBackOffPolicy：无退避算法策略，每次重试时立即重试
FixedBackOffPolicy：固定时间的退避策略，需设置参数sleeper和backOffPeriod，sleeper指定等待策略，默认是Thread.sleep，即线程休眠，backOffPeriod指定休眠时间，默认1秒
UniformRandomBackOffPolicy：随机时间退避策略，需设置sleeper、minBackOffPeriod和maxBackOffPeriod，该策略在[minBackOffPeriod,maxBackOffPeriod之间取一个随机休眠时间，minBackOffPeriod默认500毫秒，maxBackOffPeriod默认1500毫秒
ExponentialBackOffPolicy：指数退避策略，需设置参数sleeper、initialInterval、maxInterval和multiplier，initialInterval指定初始休眠时间，默认100毫秒，maxInterval指定最大休眠时间，默认30秒，multiplier指定乘数，即下一次休眠时间为当前休眠时间*multiplier
ExponentialRandomBackOffPolicy：随机指数退避策略，引入随机乘数可以实现随机乘数回退

这里还需要再提醒的一点是，由于Spring Retry用到了Aspect增强，所以就会有使用Aspect不可避免的坑——方法内部调用，如果被 @Retryable 注解的方法的调用方和被调用方处于同一个类中，那么重试将会失效。

但也还是存在一定的不足，Spring的重试机制只支持对异常进行捕获，而无法对返回值进行校验。

0|8 Guava Retry

最后，再介绍另一个重试利器——Guava Retry。

相比Spring Retry，Guava Retry具有更强的灵活性，可以根据返回值校验来判断是否需要进行重试。

先来看一个小栗子：

先引入jar包：

		<dependency>
			<groupId>com.github.rholder</groupId>
			<artifactId>guava-retrying</artifactId>
       <version>2.0.0</version>
		</dependency>

然后用一个小Demo来感受一下：

@Test
public void guavaRetry(){
  Retryer<String> retryer = RetryerBuilder<String> newBuilder()
                            .retryIfExceptionOfType(HelloRetryException.class)
                            .retryIfResult(StringUtils::isEmpty)
                            .withWaitStrategy(WaitStrategies.fixedWait(3, TimeUnit.SECONDS))
                            .withStopStrategy(StopStrategies.stopAfterAttempt(3))
                            .build();
  try{
    retryer.call(() -> helloService.hello());
  } catch (Exception e){
    e.printStackTrace();
  }
}

先创建一个Retryer实例，然后使用这个实例对需要重试的方法进行调用，可以通过很多方法来设置重试机制，比如使用retryIfException来对所有异常进行重试，使用retryIfExceptionOfType方法来设置对指定异常进行重试，使用retryIfResult来对不符合预期的返回结果进行重试，使用retryIfRuntimeException方法来对所有RuntimeException进行重试。

还有五个以with开头的方法，用来对 重试策略/等待策略/阻塞策略/单次任务执行时间限制/自定义监听器 进行设置，以实现更加强大的异常处理。

通过跟Spring AOP的结合，可以实现比Spring Retry更加强大的重试功能。

仔细对比之下，Guava Retry可以提供的特性有：

可以设置任务单次执行的时间限制，如果超时则抛出异常。
可以设置重试监听器，用来执行额外的处理工作。
可以设置任务阻塞策略，即可以设置当前重试完成，下次重试开始前的这段时间做什么事情。
可以通过停止重试策略和等待策略结合使用来设置更加灵活的策略，比如指数等待时长并最多10次调用，随机等待时长并永不停止等等。

0|9 总结

本文由浅入深的对多种重试的姿势进行了360度无死角教学，从最简单的手动重试，到使用静态代理，再到JDK动态代理和CGLib动态代理，再到Spring AOP，都是手工造轮子的过程，最后介绍了两种目前比较好用的轮子，一个是Spring Retry，使用起来简单粗暴，与Spring框架天生搭配，一个注解搞定所有事情，另一个便是Guava Retry，不依赖于Spring框架，自成体系，使用起来更加灵活强大。

个人认为，大部分场景下，Spring Retry提供的重试机制已经足够强大，如果不需要Guava Retry提供的额外灵活性，使用Spring Retry就很棒了。当然，具体情况具体分析，但没有必要的情况下，不鼓励重复造轮子，先把别人的轮子研究清楚再想想还用不用自己动手。

本文到此就告一段落了，又用了一天的时间完成了完成了一篇文章，写作的目的在于总结和分享，我相信最佳实践是可以总结和积累下来的，在大多数场景下都是适用的，这些最佳实践会在逐渐的积累过程中，成为比经验更为重要的东西。因为经验不总结就会忘记，而总结出来的内容却不会被丢失。

如果对于重试你有更好的想法，欢迎提出交流探讨，也欢迎关注我的公众号进行留言交流。

【最佳实践】如何优雅的进行重试

TOC

0|1 说明