您现在的位置是：首页 > 其它

当前栏目

单元测试之旅：预见优秀之②——寻求优秀

之旅优秀单元测试寻求

2023-09-14 09:11:10 时间

2. 单元测试进阶——寻求优秀

2.1 使用测试替身

在现代开发者测试的上下文中，除了允许在某些依赖缺失的情况下编译执行代码以外，崇尚测试的程序员还创建了一套“仅供测试”的工具，用于隔离被测试的代码、加速执行测试、使得随机行为变得确定、模拟特殊情况以及能够使测试访问隐藏信息等。满足这些目的的各种对象具有相似之处，但又有所区别，我们统称为测试替身（test double）。

这一节我们先探讨开发者采用测试替身的理由，理解了测试替身潜在的好处以后，我们再解析来看看各种可供选择的测试替身的类型。

测试替身的威力

引入测试替身的最根本的原因是——将被测试代码与周围隔离开。为了时不时的验证一段代码的行为是否符合期望值，我们最好的选择就是替换其周围的代码，使得获取对环境的完整控制，从而在其中测试目标代码。

通过以下的几个部分，我们来讨论测试替身的好处。

隔离被测试的代码
代码的世界，一般包括了两种：被测试代码和与被测试代码进行交互的代码。
接下来我们用一个简单的例子，展示如何隔离代码。示例代码如下：

public class Car {
    private Engine engine;

    public Car(Engine engine) {
        this.engine = engine;
    }

    public void start() {
        this.engine.startUp();
    }

    public void stop() {
        this.engine.shutDown();
    }

    public void drive(Route route) {
        for (Directions directions : route.directions()) {
            directions.follow();
        }
    }
}

这个例子中，包括了两个协作类：Engine 和 Route，还有一个间接使用者：Directions
我们站在 Car 的视角，用测试替身替换 Engine 和 Route ，用伪实现替换Route，那么我们就完全控制了向 Car 提供的各种 Directions。
类之间的关系如下：

加速执行测试
由于Car 需要调用 Directions，而后者的产生依赖于 Route，假设在 Route 层面需要的时间比较多，测试来不及等这么久的情况下，可以通过使用对 Route 放置测试替身，实现快速的不用等待的测试执行。
放置一个测试替身，令它总是返回预先计算好的路径，这样会避免不必要的等待，而且测试运行的更快了，
使执行变得确定
任何的测试代码，都可能包含了不确定的随机性。为了验证代码和测试具有确定的结果，我们需要能够针对同样的代码进行重复的运行测试，并总能够得到相同的结果。
事实上，这个情况非常理想状态。很多时候，生产的代码有随机因素。或许不确定的行为，最典型的情形就是依赖于时间的行为。回到我们的 Car 的这个例子，不同的时间，得到的路线（Route的Directions）可能是不同的。在高峰时间和非高峰时间，得到的路径导航，可能是不相同的。我们通过对 Route进行测试替身，使得之前不确定的测试变得确定起来。
暴露隐藏的信息
在 Car 这个例子里面，可以用测试替身完成最后一个需要它的理由。我们能看到，当 Car 进行启动的时候，需要调用了engine的 start()的方法。engine目前是私有型，我们在测试中无法获得的engine的项目类型。那么我们需要用一个测试替身，来通过给它增加状态的方式，验证单元测试对乱码的讨厌。
被测试的代码：

public class TestEngine extends Engine {
    public boolean isRunning() {
        return isRunning;
    }

    private boolean isRunning;

    public void start() {
        this.isRunning = true;
    }
}

测试替身的类型

主要的测试替身有桩（Stub）、伪造对象（Fake）、测试间谍（Spy）以及模拟对象（Mock）四种。

Stub（桩）：一般什么都不做，实现空的方法调用或者简单的硬编码返回即可。
Fake（伪造对象）：真实事物的简答版本，优化的伪造真实事物的行为，但是没有副作用或者使用真实事物的其它后果。比如替换数据库的对象，而得到虚假的伪造对象。
Spy（测试间谍）：需要得到对象内部的状态的时候，而该对象对外又是封闭的，那么需要做一个测试间谍，事先学会反馈消息，然后潜入对象内部去获取对象的状态。测试间谍是一种测试替身，它用于记录过去发生的情况，这样测试在事后就能知道所发生的一切。
Mock（模拟对象）：模拟对象是一个特殊的测试间谍。是一个在特定的情况下可以配置行为的对象，规定了在什么情况下，返回什么样的值的一种测试替身。Mock已经有了非常成熟的对象库，包括JMock、Mockito和EasyMock等。

2.2 [探讨]优秀单元测试的支柱

分析：独立的测试易于单独运行

什么样的单元测试是独立的测试？

分析：可维护的测试才是有意义的

什么样的措施可以使得单元测试是可维护的？

可读的代码才是可维护的

如何从测试用例的要素中匹配单元测试代码的可读性？

可靠的测试才是可靠的

从哪些角度的思考与设计可以让单元测试代码变得可信赖和可靠？

2.3 识别单元测试中的坏味道

过度断言

过度断言是如此谨慎的敲定每个待检查行为的细节，以致它变得脆弱，并且掩盖了整体广度很深度之下的意图。当遇到过度断言，很难说清楚它要检查什么，并且当你退后一步观察，会看到测试打断的频率可能远超平均水平。它如此挑剔，以致无论任何变化都会造成输出与期望不同。

我们看下面的例子来具体讨论。被测试的类叫做LogFileTransformer，是一个用来转换日志格式的类。

public class LogFileTransformerTest {
    private String expectedOutput;
    private String logFile;
    @Before
    public void setUpBuildLogFile(){
        StringBuilder lines = new StringBuilder();
        lines.append("[2015-05-23 21:20:33] LAUNCHED");
        lines.append("[2015-05-23 21:20:33] session-di###SID");
        lines.append("[2015-05-23 21:20:33] user-id###UID");
        lines.append("[2015-05-23 21:20:33] presentation-id###PID");
        lines.append("[2015-05-23 21:20:33] screen1");
        lines.append("[2015-05-23 21:20:33] screen2");
        //TODO: lines.append(...)
        logFile = lines.toString();
    }
    @Before
    public void setUpBuildTransformedFile(){
        StringBuilder lines = new StringBuilder();
        lines.append("LAUNCHED");
        lines.append("session-di###SID");
        lines.append("user-id###UID");
        lines.append("presentation-id###PID");
        lines.append("screen1");
        lines.append("screen2");
        //TODO: lines.append(...)
        expectedOutput = lines.toString();
    }
    @Test
    public void testTransformationGeneratesRgiht(){
        TransfermationGenerator generator = new TransfermationGenerator();
        File outputFile = generator.transformLog(logFile);
        Assert.assertTrue("目标文件转换后不存在！", outputFile.exists());
        Assert.assertEquals("目标文件转换后不匹配！", expectedOutput, getFileContent(outputFile));
    }
}

看到过度断言了么？这里有两个断言，但是哪个是罪魁祸首，什么造成断言被滥用了呢？

第一个断言检查目标文件是否创建，第二个断言检查目标文件的内容是否符合期望。现在，第一个断言的价值值得商榷，而且很可能需要被删除。但是我们主要关注第二个断言——过度断言：

java Assert.assertEquals("目标文件转换后不匹配！", expectedOutput, getFileContent(outputFile));

看上去，它精确的验证了测试名称所暗示的内容，这是个重要的断言。问题是这个测试太宽泛了，导致断言对整个日志文件进行大规模的比较。这是一张厚厚的安全网，毫无疑问，即使是输出中最微小的变化，也会是断言失败。这也正是存在的问题。

上述例子太容易失败而变得脆弱，断言并无本质的错误，但是问题在于测试违反了构成优秀测试的基本指导原则。

一个测试应该只有一个失败原因

那么我们如何改进这个测试？

我们需要避免全文测试，就算需要要求，也需要分部分内容去测试。

@Test
public void testTransformationGeneratesRgiht2(){
    TransfermationGenerator generator = new TransfermationGenerator();
    File outputFile = generator.transformLog(logFile);
    Assert.assertTrue("目标文件转换后不匹配！", getFileContent(outputFile).contains("screen1###0"));
    Assert.assertTrue("目标文件转换后不匹配！", getFileContent(outputFile).contains("screen1###51"));
}
@Test
public void testTransformationGeneratesRgiht3(){
    TransfermationGenerator generator = new TransfermationGenerator();
    File outputFile = generator.transformLog(logFile);
    Assert.assertTrue("目标文件转换后不匹配！", getFileContent(outputFile).contains("session-di###SID#0"));
}

修改后，分部对指定的部分进行测试。

人格分裂

改进测试的一个最简单的方法，就是找出人格分裂的情况。当测试出现了人格分裂的时候，我们认为它本身体现了多个测试，那是不对的。一个测试应当仅检查一件事并妥善执行。

我们看下面的例子。测试类针对一些命令行接口，用不同的命令行参数来测试Configuration类对象的行为。

public class ConfigurationTest {
    @Test
    public void testParingCommandLineArguments() {
        String[] args = {"-f", "hello.txt", "-v", "--version"};
        Configuration c = new Configuration();
        c.processArguments(args);
        Assert.assertEquals("hello.txt", c.getFileName());
        Assert.assertFalse(c.isDebuggingEnabled());
        Assert.assertFalse(c.isWarningsEnabled());
        Assert.assertTrue(c.isVerbose());
        Assert.assertTrue(c.shouldShowVersion());
        
        c = new Configuration();
        try{
            c.processArguments(new String[] {"-f"});
            Assert.fail("should 测试失败" );
        }catch (InvalidArgumentException expected){
            // 没有问题
        }
    }
}

这个测试的多重人格体现在它涉及了文件名、调试、警告、信息开关、版本号显示，还处理了空的命令行参数列表。这里没有遵循准备 --> 执行 --> 断言的结构。很明显这里断言了许多东西，虽然它们全部与解析命令行参数有关，但是还是可以彼此隔离的。

这个测试的主要问题是胃口太大，同时还存在一些重复，我们先排除这些干扰，这样就可以看清主要问题了。

首先，在测试里用了多次对Configuration类的构造器实例化的操作，我们可以将此类的操作抽取出来，并用@Before方法中实例化。这样也去掉了测试中的一部分重复。

代码如下：

protected Configuration c;
@Before
public void instantiateDefaultConfiguration() {
    c = new Configuration();
}

去掉重复的实例化以后，我们剩下来对 processArguments()的两次不同调用和6个不同的断言（包括了 try-catch-fail模式）。这样意味着我们至少要用两个不同的场景——也就是两个不同的测试。

结合上面的 @Before，代码如下：

@Test
public void validArgumentsProvided(){
      String[] args = {"-f", "hello.txt", "-v", "--version"};
    c.processArguments(args);
    Assert.assertEquals("hello.txt", c.getFileName());
    Assert.assertFalse(c.isDebuggingEnabled());
    Assert.assertFalse(c.isWarningsEnabled());
    Assert.assertTrue(c.isVerbose());
    Assert.assertTrue(c.shouldShowVersion());
}
@Test
public void missingArgument(){
    try{
          c.processArguments(new String[] {"-f"});
          Assert.fail("should 测试失败" );
    }catch (InvalidArgumentException expected){
          // 没有问题
    }
}

但是其实我们还在半路上，一些检查条件是命令行参数的显然结果，另一些是隐含的默认值。从这个角度改进，我们将测试分解成多个测试类。如下图所示：

这次重构意味着有一个测试关注于验证正确的默认值，另一个测试类验证显示设置的命令行值能正确工作，第三个指出应当如何处理错误的配置项。代码如下：

AbstractConfigTestCase

public abstract class AbstractConfigTestCase {
    protected Configuration c;

    @Before
    public void instantiateDefaultConfiguration() {
        c = new Configuration();
        c.processArguments(args());
    }

    protected String[] args() {
        return new String[] {};
    }
}

TestDefaultConfigValues

public class TestDefaultConfigValues extends AbstractConfigTestCase {
    @Test
    public void defaultOptionsAreSetCorrectly() {
        assertFalse(c.isDebuggingEnabled());
        assertFalse(c.isWarningsEnabled());
        assertFalse(c.isVerbose());
        assertFalse(c.shouldShowVersion());
    }
}

TestExplicitlySetConfigValues

public class TestExplicitlySetConfigValues extends AbstractConfigTestCase {
    @Override
    protected String[] args() {
        return new String[] { "-f", "hello.txt", "-v", "-d", "-w", "--version" };
    }

    @Test
    public void explicitOptionsAreSetCorrectly() {
        assertEquals("hello.txt", c.getFileName());
        assertTrue(c.isDebuggingEnabled());
        assertTrue(c.isWarningsEnabled());
        assertTrue(c.isVerbose());
        assertTrue(c.shouldShowVersion());
    }
}

TestConfigurationErrors

public class TestConfigurationErrors extends AbstractConfigTestCase {
    @Override
    protected String[] args() {
        return new String[] { "-f" };
    }

    @Test(expected = InvalidArgumentException.class)
    public void missingArgumentRaisesAnError() {
    }
}

过分保护

运行 Java 代码的时候，常见的Bug之一就是突然出现NullPointerException或InndexOutOfBoundsException，这是由于方法意外的收到空指针或者空串参数造成的。当然这些可以由程序员对其进行单元测试，从而增强守卫，保护好自己。

但是，程序员往往不是保护测试免于以NullPointerException而失败，而是让测试优雅的以华丽措辞的断言而失败。这是一种典型的坏味道。

代码示例：用了两个断言来验证正确的计算：一个验证返回的Data对象不为空，另一个验证实际的计数是正确的。

public class TestCount {
    @Test
    public void count(){
        Data data = project.getData();
        Assert.assertNotNull(data);
        Assert.assertEquals(8, data.count());
    }
}

这是过度保护的测试，以为assertNotNull(data)是多余的。在调用方法之前，第一个断言检查data不为空，如果为空，测试就失败，这样的测试受到了过度的保护。这是因为当data为空的时候，就算没有第一个断言，测试仍然会时报。第二个断言试图调用data上的count()时，测试会不幸的以NullPointerException而失败。

需要做的事情，是删除冗余的断言，它基本上是不能提供附加价值的断言和测试语句。

删除第5行。Assert.assertNotNull(data);

重复测试

程序员在写代码的时候，往往关注和追求整洁的代码（clean code）。而重复就是导致代码失去整洁的罪魁祸首之一。那么什么是重复呢？简单来说，重复是存在多份拷贝或对单一概念的多次表达——这都是不必要的重复。

重复是不好的，它增加了代码的不透明性，使得散落在各处的概念和逻辑很难理解。此外，对于修改代码的程序员来说，每一处重复都是额外的开销。如果忘记或者遗漏了某处的改动，那么又增加了出现Bug的机会。

代码示例：这个代码展示了几种形式的重复。

public class TestTemplate {
  @Test
  public void emptyTemplate() throws Exception {
      assertEquals("", new Template("").evaluate());
  }

  @Test
  public void plainTextTemplate() throws Exception {
      assertEquals("plaintext", new Template("plaintext").evaluate());
  }
}

代码中出现了最常见的文本字符串重复，在两个断言中，空字符串和plaintext字符都出现了两次。我们叫这种重复为文字重复。我们可以通过定义局部变量来移除它们。同时在上述测试类中，还存在另一种重复，也许比显而易见的字符串重复有趣的多。当我们提取那些局部变量的时候，这种重复会变得更加清晰。

首先，我们抽取重复的字符串，清理这些坏的味道。

public class TestTemplate {
  @Test
  public void emptyTemplate() throws Exception {
      String template = "";
      assertEquals(template, new Template(template).evaluate());
  }

  @Test
  public void plainTextTemplate() throws Exception {
      String template = "plaintext";
      assertEquals(template, new Template(template).evaluate());
  }
}

其次，确实还有一些比较严重的重复，我们看这两个测试，只有字符串是不同的。当我们抽取的字符串之后，剩下的断言是一模一样的，这种操作不同数据的重复逻辑，我们叫做结构重复。以上的两个代码块用一致的结构操作了不同的数据。

我们去掉这种重复，提炼重复后，产生一个自定义的断言方式。

public class TestTemplate {
  @Test
  public void emptyTemplate() throws Exception {
      assertTemplateRendersAsItself("");
  }

  @Test
  public void plainTextTemplate() throws Exception {
      assertTemplateRendersAsItself("plaintext");
  }

  private void assertTemplateRendersAsItself(String template) {
      assertEquals(template, new Template(template).evaluate());
  }
}

条件逻辑

在测试中，一旦存在条件逻辑的时候，一般都不是一件好事儿。这里的条件逻辑，是一种坏味道。假设我们正在重构代码，并运行之前的单元测试来保证代码一切正常。可是此时发现某个测试失败了。看上去很出乎意料，没想到这点小的变更却会影响测试，但是它的确发生了。我们查看代码，却突然发现自己无法知道，测试失败的时候，代码当时在干什么。

代码示例：测试创建了DictionaryDemo（字典）对象，用数据填充它，并验证请求到的Iterator（迭代器）的内容是正确的。

public class DictionaryTest {
    @Test
    public void returnsAnIteratorForContents(){
        DictionaryDemo dictionary = new DictionaryDemo() ;
        dictionary.add("key1", new Long(3));
        dictionary.add("key2", "45678");
        for (Iterable e = dictionary.iterator(); e.hasNext();){
            Map.Entry entry = (Map.Entry) e.next();
            if( "key1".equals(entry.getKey())){
                Assert.assertEquals(3L, entry.getValue());
            }
            if( "key2".equals(entry.getKey())){
                Assert.assertEquals("45678", entry.getValue());
            }
        }
    }
}

我们可以看到，这个测试针对的只是 DictionaryDemo的内部行为，但是仍然非常难理解和解释。通过遍历条目，我们得到返回的Iterator，并根据键值对的关系，通过 Key，找到该条目的 Value。但是实际上，如果这两个 Key 没有被添加进去的时候，这个测试不会报错。这里存在了坏的味道。通过使用自定义断言，得到修改。

代码如下：

public class DictionaryTest {

    @Test
    public void returnsAnIteratorForContents2(){
        DictionaryDemo dictionary = new DictionaryDemo() ;
        dictionary.add("key1", new Long(3));
        dictionary.add("key2", "45678");
        assertContains(dictionary.iterator(), "key1", 3L);
        assertContains(dictionary.iterator(), "key2", "45678");

    }

    private void assertContains(Iterator i, Object key, Object value){
        while (i.hasNext()){
            Map.Entry entry =  (Map.Entry) i.next();
            if( key.equals(entry.getKey())){
                Assert.assertEquals(value, entry.getValue());
                return;
            }
        }
        Assert.fail();
    }
}

最后强调一下，Assert.fail()很容易被遗漏掉。接下来我们就要再一次修改这样的坏味道了。

永不失败的测试

永不失败的测试，如果是真的能够做到百战百胜，那么是再好不过了。但是往往事与愿违，永不失败的测试往往比没有测试还糟糕。因为它给了虚假的安全感，这样的测试没有价值，出了事情它绝不警告你。

检查代码是否抛出期望的异常，或许这是一个最常见的在永不失败的测试的场景。

示例代码：

public class HelloWorldTests {
    @Test
    public void includeForMissingResourceFails(){
        try {
            new Environment().include("somethingthatdoesnotexist");
        }catch (IOException e){
            Assert.assertThat(e.getMessage(),
                    contains("somethingthatdoesnotexist"));
        }
    }
}

这个代码清单中测试的结果是这样的：

如果代码如期工作并抛出异常，那么这个异常就被catch代码块捕获，于是测试通过。
如果代码没有如期工作，也就是没有抛出异常，那么方法返回，测试通过，我们并未意识到代码有任何问题。

但是，这是一个抛异常的测试，在没有抛出异常的时候，测试其实是失败的，需要调用fail()来表示失败。

public class HelloWorldTests {
    @Test
    public void includeForMissingResourceFails(){
        try {
            new Environment().include("somethingthatdoesnotexist");
              Assert.fail();
        }catch (IOException e){
            Assert.assertThat(e.getMessage(),
                    contains("somethingthatdoesnotexist"));
        }
    }
}

简单的增加对 JUnit 中 fail() 方法的调用，是得测试起作用。现在除非抛出期望的异常，否则测试失败。

另外 JUnit 4 引入的一个新特性是 @Test 注解的 expected 属性。

public class HelloWorldTests {
    @Test(expected = IOException.class)
    public void includeForMissingResourceFails(){
        new Environment().include("somethingthatdoesnotexist");
    }
}

这样的特性，更短、更容易解析、更不易出错和遗漏。当然这种方法的缺点也很明显：我们不能访问所抛出的实际异常对象，无法进一步对异常进行断言。总之，要防止偶然的写一个用不失败的的测试，最好的方法是养成运行测试的习惯，或许是临时修改被测试的代码来故意触发一次失败，从而看到所犯的错误以及坏味道。

2.4 [探讨]在项目中进行单元测试

分析：项目中单元测试策略

在一个项目中，单元测试的策略的制定与执行需要考虑哪些因素？

分析：如何组织单元测试的数据

在一个项目中，单元测试的数据是否应该以硬编码的形式写入代码中？如果不是的话，需要如何组织这些测试用的数据呢？

分析：谁该为项目的质量负责

请思考一个问题，一个典型的项目组（包含项目经理、测试、开发和需求分析师）中谁应该为项目的质量负责？

本文转自知乎号：汇智动力技术团队，有更多IT技术问题，欢迎加Q2834267066进行交流。

猜你喜欢

用原生JS实现网页调用系统自带的分享功能
注册MSSQL账号，一步之遥！（去mssql里注册账号）
一个看上去是bug却是正确插入排序变种
php读取30天之内的根据算法排序的代码
Java BigDecimal加减乘除运算[通俗易懂]
探索Linux之美：一次小小的.sh之旅（linux了.sh）
图片底部空白间隙解决办法
ORA-14658: specified dependent table is not affected by this operation ORACLE 报错故障修复远程处理
MySQL中的结果集是什么（mysql中什么是结果集）
MySQL Error number: MY-013694; Symbol: ER_HEALTH_INFO; SQLSTATE: HY000 报错故障修复远程处理
新版Linux内核：开创技术未来（最新的linux内核版本）
【Flutter】Flutter 开源项目参考
Linux配置文件：从解析到应用（linux配置文件解析）
idea创建java项目_使用IDEA创建java项目（hello word）
库使用脚本写入Redis数据库实现弹性架构机制（脚本写redis数据）

相关主题

Python之旅
Go语言之旅
5年编程之旅
WCF之旅
Hbase 之旅
我的开源之旅
linux 内核之旅

zl程序教程