第 4 章 测试替身 - 《Java 研发自测》
测试替身是单元测试中非常有用的一个概念,用来隔离组件之间的依赖关系,让不可测试的组件变得可以测试。
曾听很多朋友说,测试替身这个概念非常难理解,它有种浓浓的翻译味。我一直在尝试找一个合适的类比来说明这些概念,直到有一次我家的灯泡坏了,我带着这个灯泡到一家五金店购买新的灯泡。老板在柜子里翻出一个差不多的灯泡,然后插到门后预留的一个灯座上,灯泡亮了起来。我忽然灵光一闪,这不就是测试替身一个绝妙的类比么?代替真实灯座(基础设施)进行验证(单元测试)的装置就是测试替身。
合理运用测试替身可以在运行测试时去除对运行环境的依赖。这也给了我们一个启示,那就是尽可能地使用清晰的边界来设计代码,让编写单元测试更加容易。
编写单元测试有时候不是那么容易。对于前面提到的类比,假如灯泡是通过电线直接连接到供电系统的而不是灯座,那么测试就会变得非常困难。
本章的目标是解决单元测试在实际编写的过程中遇到的各种困难,通过测试替身让单元测试可以顺利进行。在 Java 技术栈中,我们可以使用 Mockito、PowerMock 这两种测试替身工具。
本章涵盖的内容有:
- 使用 Mockito 实现 public 方法的模拟,用于解决大部分可测性问题。
- 使用 PowerMock 实现特殊的测试场景。比如在被测试的代码中有一段 Sytem.out. printf 代码,我们很难进行替换,那么就需要使用更特殊的方法。
4.1 测试替身简介
一个完整的应用程序或者一个系统有时很难提供一个纯粹的类来进行单元测试,对象之间的依赖往往交织在一起,需要拆成各个单元才能逐个击破,这也是单元测试的必要条件。
要将这些交织在一起的对象拆开,需要通过一些工具来模拟相关数据或替换具有某些特定行为的类等。网站 xunitpatterns.com 把这些工具称为 Test Double,翻译过来就是 “测试替身”。
在不同的测试图书中对测试替身有不同的说法。比如,在一些图书中将 Stubs 表述为测试替身,但在有些图书中 Stubs 被作为测试替身中的一类来看待。
Martin Fowler 为了让这些概念更容易理解,在他的网站 https://martinfowler.com/bliki/TestDouble.html 上重新给出了测试替身的含义,下面主要结合 Martin Fowler 的看法针对测试替身相关概念给出说明。一般情况下,日常交流中会直接使用英文来描述这些概念,为了理解方便,这里也提供相应的中文名称以供参考。
我们将 Test Double 作为抽象概念,描述多种测试替身的集合,而测试替身具体的种类使用下面的概念阐述(名词形式)。
- Dummy :哑对象(数据)。此对象仅仅用于填充参数列表,实际上不会用到它们,对测试结果也没有任何影响。
- Fake: 一些假的对象或者组件。它可完整替代依赖组件。例如内存数据库 H2,一般只会在测试环境下起作用,不会应用于生产。
- Stub: 桩件。为被测试对象提供数据,没有任何行为,往往是测试对象依赖关系的上游数据。
- Spy:间谍对象。它代理了待测对象所依赖的对象,其行为往往由被代理的真实对象提供,代理的目的是了解被依赖对象内部的运行过程。
- Mock: 模拟对象。用于模拟被测试对象的依赖,它往往是一个具有特定行为的对象。开发者在测试开始前根据期望设置预期返回的结果,被测试对象在调用这个模拟对象的方法时,返回预先设定的值。
在实际开发中,不同的测试框架对这些概念的实现会有一些不同,但大体上不会差太多。例如,在前面我们将 Stub 理解为给被测试对象提供数据的对象,而在 Mockito 的源码中,为模拟对象设置预期行为的过程也叫作 Stub,动词为 Stubbing。测试框架往往会提供与 Mock、Spy 相关的实现,Stub、Fake、Dummy 则需要自己配置或者实现,在本章以及后续的章节中将会聚焦于 Mock、Spy 的原理和使用上。
注意:为了表述清晰,后文中 Mock、Spy 使用中文名称表述。Mock 翻译为中文时,动词为 “模拟”,名词为 “模拟对象”;Spy 翻译为中文时,动词为 “监视”,名词为 “间谍对象”。
图 4-1 简单说明了这些测试替身分别有什么用,在实际项目中不必全部引入,根据需要使用即可。以用户注册为例,我们编写的单元测试会聚焦于注册部分的代码,至于其他部分,能模拟就尽量想办法模拟。
图 4-1 各种测试替身的解释
下面我们使用 Mockito 来测试依赖关系复杂的对象。
本章的示例代码见 https://github.com/java-self-testing/java-self-testing-example/tree/master/stubs。
4.2 Mockito
图 4-2 为 Mockito 的 Logo,画面中包含了一杯莫吉托鸡尾酒,Mockito 的名称就是由莫吉托(Mojito)的谐音而来。
图 4-2 Mockito 的 Logo
Mockito 是一个易用的模拟框架,可以通过干净、流式的 API 编写出容易阅读的测试代码。Mockito 和 JUnit 4 配合得非常完美,在 StackOverflow 社区的投票中排名较高,另外它也是 GitHub 中引用占比非常高的一个框架。
Mockito 最常用的是 mock、spy 这两个方法,它的大部分工作都可以通过这两个静态方法来完成。使用 mock 方法输入一个需要模拟的类型后,Mockito 会构造一个模拟对象,并提供一系列方法操控所生成的模拟对象。例如,根据参数返回特定的值、抛出异常或验证这个模拟对象中的方法是否被调用,以及通过何种参数调用等。spy 方法在使用上与 mock 方法类似,唯一不同的是它需要传入一个实例化好的对象,Mockito 会代理这个方法而不是新建一个模拟类。
选择 Mockito 的另外一个原因还在于它的生态和可拓展性。后面我们在介绍一些静态方法、私有方法的模拟和测试时,会借助 PowerMock 来完成,PowerMock 和 Mockito 能很好地协作。
4.1.1 使用 mock 方法
在下面的示例代码中,stubs 模块有一个 UserService 对象,用来演示用户注册的逻辑。在 register 方法中,注册的过程分为对密码进行 Hash 计算、让数据持久化和发送邮件这三个步骤,事实上,实际场景下的注册方法比这更加复杂,这里做了大量简化,以便于我们将注意力集中在单元测试上。
1 | ppublic class UserService { |
为了演示 Mockito 的基本使用方法,这里没有使用 Spring 框架,需要读者自己通过构造函数组织对象依赖关系。
我们的测试目标是 register 方法,与之前的示例不同,这里的被测试方法没有返回值,因此无法根据返回值断言,如果测试过程中没有发生异常就代表功能和逻辑正常。另外,这个方法会调用其他对象,复杂的依赖关系在现实中很常见,示例中已经简化了。
在上述示例中,UserService 对象的构造方法需要传人 userRepository、emailService、encryptionService 这三个对象,否则无法工作。
下面演示的是应用了模拟对象的测试示例。首先,创建一个 Maven 项目或者模块,在 Pom 文件中增加 Mockito 的依赖:
1 | <dependency> |
Mockito 使用了 Byte Buddy 作为代理技术,根据暴露出来的 API 可知,只需要传入一个类作为参数就可以生成一个代理对象,并指定这个代理对象的行为以便返回特定的值,从而完成测试工作。
在下面的测试代码中,会使用 Mockito 创建我们需要的被依赖对象:
1 | public class UserServiceTest { |
在上述代码中,mock 方法帮我们创建了一个模拟对象,而非真实的对象。mock 方法是一个静态方法,来自 Mockito,为了让内容简短,我们一般直接导入静态方法。Mockito 类是 Mockito 的门面类,提供了大量的静态方法供开发者使用。
上述示例是以 Given…When…Then 的方式来组织测试代码的,这可让测试看起来更为清晰。Given…When…Then 是一种测试的风格,前面在介绍单元测试时已经使用过,由于这里使用了测试替身,这种风格体现得更加明显,下面简单介绍一下。
很多文章认为这种测试用例的风格是行为驱动开发(BDD)的一部分,很多 E2E 测试框架将其作为默认的代码组织形式,因此被广泛推荐使用。其基本思想是将编写场景(或测试)分解为以下三个部分:
- Given 部分描述在开始指定的行为之前程序的状态,可以将其视为测试的前提条件。
- When 部分触发被测试对象的调用。
- Then 部分检查和断言指定行为所产生的变化。这种变化可以是方法调用成功的返回值、抛出的异常、下游的方法被调用等。
Mockito 也提供了一个门面类 BDDMockito 来让开发者使用相关 API 编写 BDD 风格的测试。在单元测试中,BDD 不是必选项,但我们依然可以模仿与之类似的风格。
按照这个模式,一个测试中应该只包含一组 Given…When…Then,如果出现多组,则建议拆分成多个测试。
对 register 方法来说,想要让测试更有效,就需要验证传给 sendEmail 方法的参数是否符合我们的预期。这里可以使用 verify 方法传入模拟对象,并调用相关方法。verify 还可以传入验证的次数,如果是一个循环,被模拟的对象可能会不止一次被调用,不传入的情况下默认是 1。示例代码如下:
1 | verify(mockedEmailService).sendEmail( |
verify(mockedEmailService) 等价于 verify(mockedEmailService, 1)。
在上述代码中,verify(mockedEmailService) 等价于 verify(mockedEmailService, 1) 。这里还需要验证发送邮件的参数是否是我们所期望的。比如验证发送邮件的地址是否为 “admin@test.com”,发送的内容中是否包含了用户名等信息。
上述代码使用了 eq 方法进行对比,需要注意的是,eq 方法和 assertThat 中的 equalTo 不太一样。eq 方法是通过对参数进行验证来实现对比的,它来自于 ArgumentMatchers 对象。
我们知道,只有被成功拦截的对象才能用 verify 方法验证。一个形象的例子是,当你去政务中心办理新的身份证时,工作人员会在数个工作日内完成办理,然后通过邮递员派发到指定的收货地址。政务中心的高级检查人员来检查身份证办理的工作是否做到位时,并不需要去监控证件办理人员的一举一动,只需要到下游的环节抽查办理的结果即可。最高明的方法无疑是悄悄扮演成邮递员与办事员对接工作。检查人员就是这里被模拟的对象,那么 “方法” 被调用的时候,下游的 “参数” 也就被传递到检查人员手上。
容易联想的是,检查点可以是调用的次数、调用的参数、调用的延时等,而实现的细节和每步的逻辑在 verify 方法中并不需要检查。反之,包含数十个 verify 断言方法的测试让编写者和阅读者都感到困惑,它们的职责不够单一,检查点互相覆盖,但又没有充分发挥作用。
4.2.2 捕捉参数对象
前面我们验证了邮件发送的内容是否符合我们的预期,但是并没有验证传入 userRepository. saveUser 方法的内容是否按照我们的预期执行。因此我们不仅需要验证 saveUser 方法的调用次数,还需要验证传入的对象。
在 Java 中,如果修改了一个对象的属性值,在进行相等判断时,只会通过引用比较对象。因此,无法起到断言和校验的作用。所以在使用 verify 方法进行验证时,需要捕捉传人的参数对象,再通过前面介绍的断言来完成验证。
在这种情况下,可以通过 ArgumentCaptor 构建一个 Argument 对象,并捕捉参数,再用于断言。示例代码如下:
1 | ArgumentCaptor<User> argument = ArgumentCaptor.forClass(User.class); |
4.2.3 设置模拟对象的行为
在 register 方法中,我们通过 encryptionService.sha256 方法来对密码进行 Hash 计算。在单元测试中,我们可以修改模拟对象中方法的行为,从而实现一个完整的单元测试。
在不预设返回值的情况下,调用模拟对象的方法会按照下面的规则返回默认值:
- 如果方法的返回值是一个包装类型,模拟对象会默认返回 null。
- 如果是基本类型,会返回相应的默认值,例如数字类型会返回 0,布尔类型会返回 false。
因此,为了测试各种行为,需要让模拟对象按照我们的意图返回数据或者做一些其他操作。通过 when(…). thenReturn(…) 语句可以修改模拟对象中被模拟的方法被调用时的行为或返回值。
下面的示例中,sha256 方法传入了一个 any 方法,它是参数匹配器,通过匹配一些条件来决定是否修改被模拟方法的行为或返回值。如果 any 方法不带参数,则意味着任何参数都满足条件。如果 any 方法使用 any(Class type) 的形式传入一个参数类型,那么它会限定具体的参数类型。类似地,ArgumentMatchers 类中还有 eq、contains 等方法用于更精确的匹配。
1 | when(mockedEncryptionService.sha256(any())) |
when 方法可接收一个模拟对象或间谍对象(后面会讨论)作为参数,随后会调用以下几个方法预置行为。
- thenReturn:预置一个返回值。
- thenThrow:抛出一个异常。
- thenCallRealMethod:调用间谍对象上被代理的原始方法。
- thenAnswer:返回一个 Answer 对象,Answer 对象是预置行为的封装类,上面三种都是一种 Answer 的实现。
仔细观察你会发现,这里赋予一个模拟对象相应行为的操作是通过直接调用这个模拟对象上的方法,并传递一个参数匹配对象来实现的。使用这种语法设置模拟对象的预期行为,就像调用普通方法一样方便,但是容易让人感到困惑。
我第一次使用这个语法的时候感到不可思议,这驱使我去阅读了 Mockito 的源代码。Mockito 在线程的上下文中会记录模拟对象的状态,如果还没有被赋予期望的行为,模拟对象上的方法被调用则会被认为是设置阶段。若存在模拟对象的方法已经被设置了行为,那么它再被调用会返回先前设置的返回值或触发相应逻辑。
这种设计有点像一把特殊设计的枪,第一次扣下扳机时只是为了让子弹上膛,第二次扣下扳机才会发射子弹。
Mockito 还有一些隐藏的规则,若想避免掉入这些陷阱则需要了解一下:
- 可以多次定义预置行为,后续的定义会覆盖前面的设置,以最后一次为准。但是不推荐这种做法,这是一种代码坏味道,引入了一些无效的代码,而且会让可读性下降。
- 一旦预置了行为,无论调用多少次每次调用都会返回相同的内容。
- Mockito 还提供了其他形式的语法,以便更灵活地给模拟对象设置预期行为。
1. do(…).when(…) 语法
注意,对于没有返回值的方法,不能使用 when(…).thenReturn(…) 这种语法设置预期行为,这是因为 when 方法需要接收一个被模拟方法的返回值作为参数,如果被模拟方法没有返回值,可以使用 do(…).when(…) 语法,取得的效果类似。在下面这种情况下,把预置的行为写在前面即可。
1 | doThrow(new RuntimeException()).when(mockedList).clear(); |
相关的一系列方法的说明如下。
- doReturn:预置一个返回值。
- doThrow:抛出一个异常。
- doNothing:什么都不做。
- doCallRealMethod:调用间谍对象上被代理的原始方法。
- doAnswer:前面几种方法的封装。
需要特别注意的是,这里的 when 不是接收方法调用后的返回值,而是会接收模拟对象本身,注意区分这两种情况。
2. BDD 风格语法
还记得前面提到的 Given…When…Then 的测试风格吗?
在 Mockito 默认 API 提供的方法中,when 方法被用于定义模拟对象的预置行为,但这样一来就与 BDD 的风格不一致了,在可读性上会受到一定的影响。
Mockito 为了鼓励使用 BDD 测试风格,也提供了一套 API,在这套 API 里,使用 BDD-Mockito 类中的方法代替了 Mockito 类(BDDMock 为 Mockito 的方法别名),可以模仿 BDD 的风格进行测试。它的用法很简单,将前面的 when 修改为 given,将 then 替换为 will 即可。示例代码如下:
1 | given(mockedEncryptionService.sha256(any())) |
在团队达成共识的情况下,利用上述方法别名可以提高测试的自解释性。
4.2.4 参数匹配器
参数匹配器是 Mockito 的一个特色功能,可以让 Mock 变得更加灵活,用于区分同一个方法多次被不同的参数调用的情况。参数校验器和 JUnit 中断言的匹配器是类似的模式。
Mockito 需要借助参数匹配器来绑定预置行为,参数匹配器也会用于 verify 方法中,起到断言的作用。
为了暴露 ArgumentMatchers 中的 API,Mockito 类直接继承了 ArgumentMatchers 类,这足以说明它的重要性。
前面的例子中使用了 any 参数匹配器,其用途是让任何参数都可匹配到。如果使用 any 参数匹配器,下面的代码执行后会打印 true。
1 | List mockedList = mock(List.class); |
如果想要得到更为细致的类型匹配,可以使用 any(Class)、anyxxx 等关于类型的参数匹配器。因为没有匹配上,下面的代码会打印出 false,这是 Mockito 默认的行为导致的。
1 | List mockedList = mock(List.class); |
在上述代码中最容易弄错的是 null 值的处理,由于字面量(不经过定义而在代码中直接使用的值)、参数匹配器、断言中的匹配器均有多种的写法,开发者非常容易被误导。
使用下面这段代码可以体验不同的匹配方式带来的不同效果。注意,理解在不同情况下对 null 值的处理方式,可以避免很多未知的问题。
1 | List mockedList = mock(List.class); |
4.2.5 使用 spy 方法
如果项目中的对象很多,对所有待测试对象所依赖的对象都进行模拟,工作量会非常大,我们不得不想办法减少相应的工作量。试想,如果对象 B 依赖 A,对象 A 已经通过了单元测试,那么可以认为 A 是可信任的。A 的结果可以在多数情况下直接用于测试,它并不影响测试的正确性。
要想实现上述设想,可以使用 spy 方法。spy 方法相当于对被测试对象需要依赖的方法进行代理,在不改变原来的逻辑的情况下,对所依赖的对象进行监听,也可以对部分方法设置预期行为。可以说 spy 方法实现了一种特殊的模拟。其内部实现和 mock 方法类似,可以看作是局部模拟行为。
由于被 spy 方法应用的对象往往会有自己的实现,因此可以省去 given 方法。间谍对象依然可以和模拟对象一样被验证,以及给部分方法预置行为。
例如,对于 EncryptionService,我们给 sha256 方法一个真实的实现:
1 | public String sha256(String text) { |
在 register 的单元测试中,修改 EncryptionService 类的 mock 方法为 spy 方法,并删除 mockedEncryptionService 的 Given 操作。
1 | EncryptionService mockedEncryptionService = spy(new EncryptionService()); |
重新运行测试,可以得到与使用 mock 方法同样的测试结果。使用 spy 方法可以大大减少测试样板代码,避免重复工作。使用 spy 方法就像是一个间谍侵人需要注入的对象观察下游对象的行为,并记录一切,然后在测试完成后汇报他看到的信息一样。
应用了 spy 方法的对象也可以被验证,在下面的示例中,仍然可以验证 register 方法确实调用了 sha256 方法。
1 | verify(mockedEncryptionService).sha256(eq("xxx")); |
4.2.6 使用注解
如果每次都编写 mock、spy 方法来创建模拟对象,代码会显得冗长且不易阅读。利用 Java 注解的能力,可以让模拟行为提前自动准备好,在实际工作中,大多数情况下会通过注解完成测试,从而减少测试的代码量。
使用注解只需要修改需要被模拟的三个对象,并使用注解代替手动创建即可:
1 | @Mock |
如果只是加上注解,测试方法并不知道这个测试类需要处理注解并初始化模拟行为,因此需要在测试类上添加一个 Runner 让 Mockito 有机会去处理注解。Rumner 中的逻辑运行在所有生命周期钩子的最前面,具有最大的灵活性。
我们可在测试类上增加下面的注解:
1 | @RunWith(MockitoJUnitRunner.class) |
到目前为止,想要充分利用 Mockito 的特性可以使用 MockitoJUnitRunner,还可以通过 PowerMockRunner 来配合使用 PowerMock,通过 SpringRumner 来配合使用 Spring。我们也可以定义一个基类,在基类上使用 @RunWith 注解修饰,这样就不必在所有的子类中重复定义了。
@mock 注解等价于 mock 方法,@spy 注解类似,等价于 spy 方法。拿到模拟对象或间谍对象以后,还需要将模拟出来的对象注入被测试类中才能使用。Mockito 提供了 @InjectMocks 注解来完成这部分工作。@InjectMocks 的注入工作是根据类型来实现的,类似于依赖注人,但如果需要注入一个类的不同实例,注解就无能为力了。
使用注解的完整测试代码如下,也可以在 GitHub 上的示例代码仓库中找到此代码段。
1 | @RunWith(MockitoJUnitRunner.class) |
4.2.7 其他技巧
在使用 Mockito 的时候,还有一些技巧可以用来排错,在遇到问题的时候可能会对我们有帮助。
1. 清理模拟状态
如果需要在一个测试方法中反复设置模拟对象的行为,以及重复验证被模拟的方法是否被调用,但是模拟对象上的状态反复变化会干扰测试,那么可以使用 reset 方法清理掉此状态。
当然,一般情况下不必手动清理模拟状态,测试结束后 Mockito 会自动清理。如果在一些测试场景中,必须使用 reset 方法手动清理,也请先考虑是否应该将其拆分成多个不同的测试。
2. 获取模拟状态
使用 Mockito 时,可能会因为错误操作导致模拟不生效,为方便调试,可以打印出模拟对象的信息来探查原因,示例代码如下:
1 | EncryptionService mockedEncryptionService = mock(EncryptionService.class); |
执行上述代码即可输出当前对象的模拟状态。通过检查输出的结果,我们可以判断参数匹配是否工作:
1 | true |
3. 使用 Lambda 风格校验参数
使用参数捕获来验证下游对象是否正常工作的代码较为冗长,这时可以使用 Matcher 来实现 Lambda 风格的参数校验。原理为参数校验器 argThat 接受一个 ArgumentMatcher 接口的实例,可以使用匿名的方式实现该接口。这个接口只有一个 matches 方法,在 Java 1.8 之后,可以简写为箭头函数,也就是 Lambda 风格的写法。
校验 mockedEncryptionService 的 sha256 方法的,示例代码如下:
1 | verify(mockedEncryptionService).sha256(argThat(new ArgumentMatcher<String>() { |
改写成 Lambda 后变得非常简洁:
1 | verify(mockedEncryptionService).sha256(argThat(argument -> { |
甚至可以写成一行:
1 | verify(mockedEncryptionService).sha256(argThat(argument -> argument.equals("xxx"))); |
上面的例子可能过于简单无法说明使用 Lambda 表达式进行断言的方便性,更复杂的例子参考示例代码库中 lambda_verify_object_example 测试示例。
关于 Mockito 实现的详情可以阅读本书的最后一章,进一步了解这些测试框架和库的源码分析过程。
4.3 增强测试:静态、私有方法的处理
Mockito 很强大,能帮我们完成大部分模拟工作,但是对于一些特殊的方法它还是无能为力。
例如,当我们获取系统当前的时间戳时,可能会调用 System.currentTimeMillis(),但我们无法模拟这个方法。我们有可能会遇到一些有趣的现象,部分测试过了一段时间后就无法通过了,这是因为在实现中可能有对系统时间戳进行检查的逻辑。再比如财务报销单相关的逻辑,费用产生几个月后再进行报销测试就会失败。这是因为我们在初次测试时,使用的模拟数据是一个固定的时间,因此几个月后重新运行相关的单元测试就无法通过了。
另外,实际项目中不可避免地需要模拟系统中的静态方法、私有方法,以及对一些私有方法进行测试(虽然不推荐测试私有方法),如果遇到的是遗留系统,public 方法很大,测试的成本非常高,这时也可以采用技术手段测试私有方法。
配合 Mockito 使用的另外一个框架是 PowerMock。PowerMock 支持各种模拟框架并对这些框架提供了拓展。powermock-api-mockito 是一个拓展库,它通过拓展 Mockito 并结合 PowerMock 功能来做增强测试,解决模拟静态、私有方法的困难,并在必要时测试静态、私有方法。
虽然应尽可能地避免使用 PowerMock 这类对封装性破坏较大的库,但是在特殊的场景下还是可以少量使用,它可以快速解决一些不必要的麻烦,具体视情况而定。PowerMock 主要面向有测试经验的开发人员,尽量不要交给初级的开发人员使用。
虽然 PowerMock 和 Mockito 都是通过操作字节码来实现模拟功能的,不过两者在实现上有较大的区别,定位也不一样。Mockito 是通过对被模拟的类进行字节码处理来实现一个代理类的,用于控制预置的所有逻辑。PowerMock 则是对被测试的代码进行处理,通过替换被测试代码的字节码来实现一些高级功能。因此它也额外提供了一些对私有方法、变量访问的功能,可以方便地访问被测试类的内部状态。
这部分的示例代码见 https://github.com//java-self-testing/java-self-testing-example/tree/master/powermock 。
4.3.1 模拟静态方法
为了便于演示模拟静态方法的过程,下面会给前面示例中的 User 对象增加 createAt 字段,createAt 字段在 register 方法内被填充,然后进行持久化。
更新后的 User 对象如下:
1 | public class User { |
并给 user 对象设置对应的值,也就是 Instant.now() 方法的返回值,即系统当前的时间。
1 | user.setCreateAt(Instant.now()); |
依据前面的测试可知,这会给测试带来不便,因此需要想办法模拟 Instant.now 这个方法,示例代码如下:
1 | assertEquals("", argument.getValue().getCreateAt()); |
首先,引入 PowerMock 的相关依赖。PowerMock 有两个模块,一个是对 JUnit 的封装,另外一个是对 Mockito 的封装。它们间接地依赖了 JUnit 和 Mockito,因此可以先把原来的测试依赖移除,再添加这两个依赖。由于 powermock-api-mockito2 对 Mockito 的版本有一定的兼容性要求,所以建议使用下面的方式添加依赖,避免冲突。
1 | <dependency> |
然后,使用 PowerMockRunner 代替 Mockito 的 Runner,并使用 @PrepareForTest 对用到该静态方法的地方进行初始化。示例代码如下:
1 | @RunWith(PowerMockRunner.class) |
如此,在测试过程中,我们就可以模拟 Instant 类中的静态方法了,并且会影响 UserService 中使用它的地方。示例代码如下:
1 | Instant moment = Instant.ofEpochSecond(1596494464); |
模拟完成后,Instant.now() 就会按照我们期望的值返回结果,测试代码自然也就可以按照预先设定的值来进行断言了。由于 PowerMock 与 Mockito 能很好地在一起工作,因此可以继续使用 Mockito 的 API 来编写测试。对于特殊的模拟行为,使用 PowerMock 中的语法代替 Mockito 中的语法即可。完整的测试如下:
1 | @RunWith(PowerMockRunner.class) |
下面介绍一下使用 PowerMock 时需要特别注意的地方,从而避免在实际项目中碰到问题。@PrepareForTest 中的参数为一个被处理的目标类,这个类不是被模拟的类,而是被测试的类(业务代码),目的是让被测试代码中的特殊模拟生效。例如,在上面的示例子中,被测试的类是 UserService,我们需要模拟的是 Instant.now 方法,这个方法要在 UserService 中使用,因此我们需要处理的类是 UserService 而不是 Instant。这是使用 PowerMock 的过程中最常见的一个陷阱,原因是静态方法是类级别的方法,需要在被测试类加载前准备完毕。想要特殊模拟在被测试代码中生效,就需要使用 @PrepareForTest 进行处理。具体的实现是在 PowerMockRunner 中完成的,其中用了很多字节码级别的技术,想要关心具体实现的读者可以参考源码。
上面的例子中,我们不需要验证 Instant.now 方法的调用情况。如果在某些情况下需要验证静态方法,可以使用 PowerMock 的 verifyStatic 方法重新加载修改后的类,然后进行验证。示例代码如下:
1 | PowerMockito.verifyStatic(Static.class); |
需要注意的是,每次验证都需要调用 verifyStatic,因为这两句代码是成对出现的。
4.3.2 模拟构造方法
有时候被测试的代码中可能会直接使用 new 关键字创建一个对象,这种情况就不太好隔离被创建的对象了。如果不使用 PowerMock,甚至这段代码都不能被测试。对此,有两个途径可解决:一是使用工厂方法进行解耦,即用依赖注入代替直接使用 new 关键字:另一种方式是使用 PowerMock 对构造方法进行模拟。
第一种方法相当于修改被测试的代码,在重构时这样做不太安全,因此可以考虑使用第二种方法。在 PowerMock 中使用 whenNew 这个方法可以拦截构造方法的调用,直接返回其他对象或者异常。对构造方法进行模拟是 PowerMock 中最常用的特性之一。
如果在处理一个遗留系统时,在 UserService 中的 register 方法中发现了这样一段代码:
1 | public void register(User user) { |
那么可以使用 whenNew 方法传入一个准备好的模拟对象,以此替换原有的实现,从而达到可测试的目的。
1 | // Given |
使用 Mockito 准备一个模拟对象,在 new 语句执行时,PowerMock 会将这个模拟对象返回,这样后续的断言就可以得到保障,把不可测的代码变成了可测试的代码。
自然地,如果需要验证构造方法是否被调用,可以使用 verifyNew(LogService.class). withNoArguments()。
4.3.3 模拟私有方法
与前面的问题类似,在进行重构时,我们发现类中有一些特别长的私有方法,这些私有方法比较复杂,使得测试成本很高。
一种解决方式是通过重构将这些私有方法搬到另外一个类中,使得类的私有方法数量处于较少的状态。另外一种是通过 PowerMock 对私有方法进行模拟操作。使用 PowerMock 模拟私有方法非常简单,只需要使用 PowerMockito 类中的 when 方法代替 Mockito 中的同名方法即可。因为直接调用私有方法会出现 Java 语法报错,所以 PowerMockito 类中的 when 方法提供了与 Mockito 类似的 API,但是它的方法名需要以字符串作为额外的参数传人。
假如 LogService 对象中有一个私有方法 _log 用于发送日志到日志平台,由于一些基础设施的原因导致测试失败,那么可以使用 PowerMock 将其隔离,让其他的测试逻辑正常进行。
下面的示例代码演示了如何使用 PowerMock 模拟私有方法。
1 | public class LogService { |
下面的代码用于当 _log 被调用时不让其有副作用:
1 | @RunWith(PowerMockRunner.class) |
但是需要注意的是,处理私有方法时要处理以下两个对象:被模拟的对象和被测试的对象。在前面的例子中,UserService 是被测试的对象,LogService 是需要被模拟的对象。如果是 LogService 中的私有方法需要被隔离掉,@PrepareForTest 中的参数则应该设置为 LogService 而不是 Userservice。同理,如果 UserService 中有一个私有方法,我们想做一些处理,该怎么办呢?首先,需要将 @PrepareForTest 的参数设置为 UserService,其次,由于 UserService 是被测试对象,无法应用 when 方法,因此需要使用 spy 方法包装处理。
4.3.4 反射工具箱
如果一个被测试对象有一个私有属性,但是由于某些原因无法赋予模拟对象,导致测试困难,那么可以使用反射方式修改它的可访问性。例如,某 Person 类上有一个私有属性 name,现在需要为其赋予一个新的值,那么可以像下面这样编写代码:
1 | Person person = new Person(); |
上述代码比较烦琐,Mockito 和 PowerMock 都提供了一组反射工具类,用于访问私有成员,比 Java 本身的反射能力要强一些。
1. 访问私有属性
比如,我们在 LogService 中增加了一个 prefix 属性,用于打印日志的前缀,示例代码如下:
1 | private String prefix = "warning: "; |
那么使用 Mockito(非 PowerMock)的 FieldSetter 工具类可以直接修改私有属性:
1 | LogService logService = new LogService(); |
2. 测试私有方法
如果我们遇到某个私有方法时,想要测试它,一种比较好的方法是将私有方法修改为包级别私有,并将测试代码放到同一个包下,但是它处于 test 目录下(比如,待测试的私有方法位于 src/main/java 中,测试代码位于 src/test/java 中),这样测试代码就能访问到该方法了。
另外一种方法是,使用一些辅助工具,例如,使用 PowerMock 中的 Whitebox 类等,提供对私有方法、属性的访问。示例代码如下:
1 | Whitebox.invokeMethod(testObj, "method1", new Long(10L)); |
大部分情况下建议避免使用反射方式,因为它会大大破坏封装性。不过,在处理遗留系统时,如果因为没有测试保护而不敢贸然修改源代码,且遗留系统中会有很多代码不具备可测试性,那么可以酌情使用这类方法添加一些测试守护重构。
对于新实现的代码,如果出现了需要用到反射才能完成测试的情况,则说明代码中存在坏味道,需要及时处理。
4.4 测试代码的结构模式
使用测试替身后,测试代码的结构会变得有些复杂,对于如何良好地组织测试代码的结构,一些专家也总结了几种模式。
4.4.1 准备 - 执行 - 断言
准备 - 执行 - 断言(Arrange-Act-Assert)是一种主流的单元测试代码结构模式,它非常类似 “三段论” 的文章结构:
- 准备:准备测试数据、模拟依赖对象、初始化测试状态(如果有的话)。
- 执行:对测试目标进行调用,执行相关方法和逻辑。
- 断言:验证执行的结果是否满足预期,包括进行断言、对 Mock 中的下游对象参数进行验证等。
其实从本章的开始,我们就是按照这种结构来介绍单元测试的,每个测试方法基本具有类似的结构。在 BDD 中,Given…When…Then 的语法结构也与之类似。
在敏捷开发中,用户故事可以认为是一个功能特性单位,评价一个用户故事是否完成,可以使用多个验收条件。验收条件可以看作功能测试的测试用例,单元测试只不过是其微观形态。
这种模式非常简单,很容易和团队达成一致,从而写出结构合理、统一的单元测试来。
4.4.2 四阶段测试
四阶段测试(Four-Phase Test)是准备-执行-断言的拓展,该模式描述了创建简洁、可读且结构良好的测试需要具备如下4个阶段。
- 设置:建立测试的先决条件,包括模拟依赖对象、准备测试数据。
- 执行:对系统做一些事情,对测试目标进行调用。
- 验证:检查预期结果,断言和对模拟对象中的下游对象参数进行验证。
- 清理:测试结束后将被测系统恢复到初始状态。
看起来和准备-执行-断言模式类似,对吧?其实只是对它做了一些补充,对测试各部分的职责进行了划分,越来越多的测试框架也在参考这种模式的实现。
在 JUnit 中,@Beforexxx 方法中可以实现一些通用的准备工作,因此可以将其视作设置的一部分。前面提到过另外一个概念 Fixture,此概念在很多测试中都能看到,翻译为中文是测试夹具或测试工具类,意思是在设置阶段进行的通用的准备工作(封装为测试 Fixture)。
JUnit 的 @Afterxxx 方法对应的是清理工作,大部分情况下可以自动处理。图 4-3 展示一个测试类(一般也是一个测套件)和多个测试之间的关系。
图 4-3 测试代码的结构
4.5 基于测试替身的反思
使用测试替身编写测试,会驱使我们去思考如何设计出更好的业务代码结构。通常情况下,人们容易对他人严苛,对自己宽容,但编写测试的时候是难得的对自己 “严苛” 的时候。可测试的业务代码一般都具有清晰的层次结构。
4.5.1 “大泥球”
“大泥球” 是一个用来比喻糟糕的软件设计的术语。一份不经过设计、随意堆砌的代码,没有清晰的结构特征,就像一个泥球一样,毫无结构可言。
1 | 所谓的大泥球就是一个随意结构化、蔓延的、不经心的、意大利面条式的代码混合体。系统展现了无可争议的表象:不受管制的增长、重复、权宜之计的修补。信息被系统中相距很远的模块杂乱地共享,重要信息常变为全局的或者重复的。 |
产生 “大泥球” 的原因可能有:
- 开发者往往只是关注如何编写代码,而不是关注设计。由于缺乏前期的设计,遇到问题或者新特性时直接进行碎片式的修改,让代码变得混乱和混沌。
- 用户的需求发生变化,但是架构的演进没有跟上,系统变得越来越复杂,维护也变得越来越昂贵。
- 开发者受设计能力的制约。
“大泥球” 的代码非常难测试,这些代码往往源自一些遗留系统,需要使用大量的测试替身技巧才能勉强编写出一些测试来保护代码。
为了解决 “大泥球” 的问题,除了使用面向对象的 SOLID 原则增强设计和开发以外,还需要注意使用 “编排和复用分离” 的技巧。有的时候,我们无论让方法分解得多小,都很难绝对地消除重复,或者消除重复的代价是又造成了其他方面的耦合。这时,根据代码的职责进行简单的划分,就可以让其职责变清晰,比如,我们可以将代码分为编排逻辑和复用逻辑。
编排逻辑指的是用于组织原子方法的逻辑,例如用户在注册时会组合调用存储、发送邮件、加密等方法,就可以看作是编排逻辑。编排逻辑关注于场景,而非具体的事情。对于编排逻辑来说,重复优于复用。因为编排本身具有业务含义,如果复用编排逻辑会让这些业务含义混合在一起,那么这种复用并没有带来好处。此外,编排相关的方法彼此之间也不应该互相调用。
复用逻辑指的是可以被多个场景使用的通用逻辑,例如发送邮件时,只需要关注发送邮件这个动作即可,至于发送之后是否需要存储,则交由编排逻辑来处理。
在进行单元测试时,复用逻辑几乎不需要使用测试替身,因为它足够原子化:编排逻辑则需要使用大量的测试替身,好在这其中没有多少逻辑,所以单元测试也还是比较容易实现。另外,E2E 测试应该更关注编排逻辑这一部分,如果单元测试处理这部分逻辑的成本过高,也可以交给 E2E 测试。
4.5.2 分层过多
另外一种代码结构也会让测试变得困难,就是分层过多的代码结构。这种代码可能存在过度设计,比如,一个简单的功能由 3~4 层代码实现。如果根据分层进行单元测试,会造成测试和替身数量远远多于源代码。
分层过多主要是因为设计者没有清晰地认识每个类的职责,他认为分层越多越清晰。实际上,这种做法反而让代码的可读性下降了。因为阅读者往往需要追溯非常多的方法才能找到真正实现业务逻辑的地方。
分层过多的问题如何解决?这取决于设计者对业务逻辑的认知,另外也可以借鉴一些思维方法。通过认识论我们知道,对于现实世界中的一个行为,我们可以基于 “主体” 和 “客体” 来进行分析。也就是说,在现实世界中,主体通过操作客体来完成一项任务。而在面向对象中,具有行为的 Service 通常会操作一些 Entity、DTO 等具有属性和数据的对象,它们之间也构成了主客关系。
在分层设计中,首先需要弄清楚 “主体” 类的职责是什么,如果某些 “主体” 类的职责一致或者类似,则应该考虑合并。
4.5.3 滥用测试替身
过多地使用测试替身也会带来问题,比如,封装性会受到破坏,测试代码比业务代码还长很多,在这种情况下,不使用测试替身反而会更加简单和高效。
滥用测试替身会带来如下问题。
- 测试难以理解。过于复杂的模拟行为让测试代码变得极其难以理解,尤其是具有全局状态再配合模拟行为的测试。复杂的测试有可能会让不熟悉代码的开发者花上一整天的时间来修复出现的问题,极大地降低了开发效率。
- 重构成本增加。如果重构的目标代码里包含具有测试替身的测试代码,那么会导致一系列测试需要重新修改。
滥用测试替身往往是为了追求完美的单元测试覆盖率,比如试图让单元测试达到 100%,从而想尽办法进行极端的模拟。事实上,在编写测试代码之前,应该先和团队达成一定的共识,优先覆盖最重要的逻辑,为真正需要测试的地方添加单元测试。
4.6 小结
本章介绍了什么是测试替身,以及如何使用测试替身来让单元测试更为简单。在实际工作中,被测试的代码不一定容易被模拟和测试。通过关注前期设计、变更适配需求让代码具有很好的测试性,在实际开发过程中是非常重要的一件事。
当我们确实需要对私有方法进行测试以及行为模拟时,可以使用 PowerMock 对私有方法进行模拟和验证,并使用反射工具(例如 Whitebox、FieldSetter 等)来访问私有属性和方法。
当我们的测试变得非常复杂时,团队成员需要就测试代码的组织结构达成契约,这时,可以参考一些测试代码的结构模式。通过遵循同样的编写风格和模式,可以让团队中的代码风格更统一,提高开发效率和体验。
最后介绍了如何通过单元测试来感受源代码的设计质量,以及如何通过测试替身的实现难度来反思代码设计中的一些问题。
我们应该避免使用 “大泥球” 样的代码结构,在设计代码时,也要注意免去不必要的分层,当然更不能滥用测试替身,以免降低测试的可阅读性和可维护性。