针对大型数据库的单元测试

Unit testing against large databases

我想问一下您对大型数据库进行单元测试的建议。

我想为一个大多数是在T-SQL中实现的应用程序编写单元测试，因此模拟数据库不是一个选择。
数据库很大(大约10GB)，因此在测试运行后恢复数据库实际上也是不可能的。

该应用程序的目的是管理信贷协议中的应用程序处理。有些用户具有更改agreement对象状态的特定角色，而我的工作是测试此过程的一部分。

我正在考虑两种方法：

第一种方法

创建符合特定条件的协议，然后测试协议状态的更改(例如，从在某个办公室等待到在该特定办公室处理)。这些协议将在应用程序本身中创建，它们将成为我的测试用例。所有测试都将包含在执行这些测试后将回滚的事务中。
好处

这种方法的优点是非常简单的测试。可以很容易地描述预期的数据，因为我完全知道转换后对象的外观。

缺点

缺点是数据库无法以破坏测试的方式进行更改。测试用例中使用的用户和协议必须始终看起来相同，如果需要更改数据库，则必须重复准备过程。

第二种方法

在单元测试中创建协议。以编程方式创建符合特定条件的协议。用于创建协议的数据将是随机选择的。同样，将随机创建将更改协议状态的用户。

好处

此方法的优点是易于更改对象，并能够在具有不同数据的数据库上运行测试。

缺点

两个对象(协议和用户)都有很多字段和相关数据，而且恐怕要花一些时间来实现这些对象的创建(我也担心这些对象可能包含一些错误，因为创建方法如果没有错误，将很难实现)。

您如何看待这两种方法？

是否有任何Stack Overflow读者都值得按照第二种方法描述的那样创建对象？

这里的任何人都有创建此类测试的经验吗？

我不确定我是否完全同意您的假设，即您无法在测试运行后还原数据库。尽管我绝对同意某些测试应该在全尺寸，多TB数据库上运行，但我不明白为什么您不能在一个小得多的测试数据库上运行大多数测试。是否存在需要测试的约束，例如"不能超过十亿个相同的行？"

实际上，我的建议是对大多数功能规格使用较小的测试数据库，并在每次测试时创建并删除其所有表，并尽可能减少测试功能所需的样本数据。