转载

使用Selenium测试时必需知道的7件事

Selenium 是一套用于进行浏览器自动化测试的开源工具集，可进行Web应用的端到端测试。Selenium主要包括两个工具：一是Selenium IDE，这是一个在Firefox上运行的插件，可对用户的行为进行录制与回放，还可以将录制的内容生成代码后在Selenium Remote Control上运行。二是本文的重点Selenium WebDriver（简称WebDriver），这是一个开源的项目，能够让用户编写在各种主流浏览器上运行的互操作代码。目前已经推出了支持C#、Java等语言的类库。 W3C的WebDriver规范也正是在这个开源项目的基础上发展起来的。

WebDriver可谓QA工程师进行UI测试最强大的利器，它提供了丰富的API以实现访问DOM、运行JavaScript、模拟键盘输入等操作。利用WebDriver进行编程可实现UI测试的完全自动化，为回归测试、乃至持续集成流程提供了极大的便利性。尽管如此，但使用WebDriver编写测试需要投入大量的时间，并且由于浏览器行为的多样性，以及UI的易变性，需要进行大量的代码维护工作。与应用程序的代码一样，编写测试代码同样需要遵循良好的代码规范与设计，糟糕的代码结构会很快使得测试代码的维护变成一个无底洞，最终被团队无奈地抛弃。

在今年的OpenWest 2015大会上，来自Lucidchart的 Jared Yarn 进行了一场关于Selenium WebDriver测试方面的演讲，并随后撰文总结了演讲的内容。他首先谈起了所在的团队在使用WebDriver时所遇到的困境，当时他们维护着由大约40个不同开发者编写的300多个测试用例（该团队没有专职的测试人员，测试代码全部由开发者编写），每天的运行都会产生70个左右的错误，这一情况在分配了专门的维护人员之后也没有多少改善。为了彻底改进测试集的可靠性、可伸缩性以及可维护性，Yarn与整个团队一起对整个测试代码结构进行了重构。经过重构后，误判的失败率降到了1%以下，并且编写测试的时间也大大缩短了。

Yarn将这次重构的成功归结为以下七点。

创建Application User对象

团队首先要解决的问题是编写测试所需投入的精力过大，为了克服这一点，他们设计了一些实体对象。首先创建的是一种Application User对象，它代表了网站的后端功能，并且通过一些辅助方法提供了准备测试场景、或是在测试完成前进行teardown（清理）工作的功能。以下是使用这种对象的一个示例：

class EditorPerformanceTest extends LucidSpec { val user = new ChartUser override def beforeAll() { user.login() user.createDocument() } … override def afterAll() { user.finished() }

通过这种对象的应用，所有的准备工作被简化成两个方法调用（login与createDocument），而teardown中的逻辑则由finished方法实现，因此开发者可以专注于具体的测试逻辑，将精力集中在bug修复或特性的检测。

创建Application Driver对象

WebDriver的API非常丰富，单是定位某个UI元素就有不下20种做法，这种巨大的灵活性也令人望而生畏。有数之不尽的方式可以完成拖放、单击、滚动以及输入等操作。为了简化这一点，Yarn的团队设计了一种Application Driver类，以简化一些最常见的操作。它首先继承自WebDriver类，并引用了Selenium中的Actions类，随后加入了一些方法用于实现最常见的用户操作，例如单击元素与执行脚本等等。可以通过下面这个UML图概括这个类的设计。

使用Selenium测试时必需知道的7件事

其使用方法如下：

def dragAndDrop(cssFrom: String, cssTo: String) { val elem1 = getElementByCss(cssFrom) val elem2 = getElementByCss(cssTo) actions.dragAndDrop(elem1, elem2) } def contextClickByCss(css: String) actions.contextClick(getElementByCss(css)) }

通过ID访问DOM对象

在WebDriver测试过程中，如何定位一个DOM元素是最有挑战性的任务之一。常见的方式包括XPath、CSS路径以及各种复杂的CSS选择器（类似于jQuery），但这些方式在元素移动了位置或改变了CSS类名之后就会失效，不得不重新修改代码。因此，Yarn建议使用DOM元素的ID进行定位，这种方式的好处是不受元素所在位置、以及所应用的样式的影响。Yarn的团队随后对产品的某一重要特性进行了UI改版，而由于页面中的ID保持不变，因此测试代码的改动非常之少。

页面对象模式

页面对象模式（Page Object Pattern）是测试代码可维护性的关键因素，这一模式本身非常简单，它表示每个页面应了解如何执行该页面当中的所有操作。举例来说，登录页面知道应当如何提交用户的认证信息、如何点击“忘记密码链接”等等操作。如果将这些功能转移到一个公用的地方，就可以在所有测试中重用这部分功能。以下代码表示了一个文档页面的功能：

object DocsList extends RetryHelper with MainMenu with Page { val actionsPanel = new ActionsPanel val fileBrowser = new FileBrowser val fileTree = new FileTree val sharingPanel = new SharingPanel val invitationPanel = new InvitationPanel

这个页面中的操作非常多，因此Yarn将其分解为多个较小的类，每个类都代表了页面中某个块的功能。它们各自包含在这一区域内可执行的操作的相关方法，正如以下代码所示：

def clickCreateDocument(implicit user: LucidUser) { doWithRetry() { user.clickElement("new-document-button") } } def selectDocument(fileNum: Int=0)(implicit user: LucidUser) { doWithRetry() { user.driver.getElements(docIconCss)(fileNum).click() } } def numberOfDocsEquals(numberOfDocs: Int)(implicit user: LucidUser) : Boolean ={ predicateWithRetry(WebUser.longWaitTime *5, WebUser.waitTime) { numberOfDocuments == numberOfDocs } }

行为的重试

在WebDriver测试过程中，最糟糕的问题在于误判的错误，这为自动化构建过程带来了很大的困难。对于Yarn的团队来说，这个问题也是他们所面对的头号大敌。为了克服这一点，他们为测试加入了重试的功能，使得测试结果得到很大的改善。以下是这个重试方法的代码：

/** * Try and take an action until it returns a value or we timeout * @param maxWaitMillis the maximum amount of time to keep trying for in milliseconds * @param pollIntervalMillis the amount of time to wait between retries in milliseconds * @param callback a function that gets a value * @tparam A the type of the callback * @return whatever the callback returns, or throws an exception */ @annotation.tailrec private def retry[A](maxWaitMillis: Long, pollIntervalMillis: Long)(callback: => A): A = { val start = System.currentTimeMillis Try { callback } match { case Success(value) => value case Failure(thrown) => { val timeForTest = System.currentTimeMillis - start val maxTimeToSleep = Math.min(maxWaitMillis - pollIntervalMillis, pollIntervalMillis) val timeLeftToSleep = maxTimeToSleep - timeForTest if (maxTimeToSleep <= 0) { throw thrown } else { if (timeLeftToSleep > 0) { Thread.sleep(timeLeftToSleep) } retry(maxWaitMillis - pollIntervalMillis, pollIntervalMillis)(callback) } } } }

这段代码的功能是通过一个简单的递归算法执行所传入的实际行为，直到该行为成功，或是运行超时为止。以下是使用这个方法的简单示例：

def numberOfChildren(implicit user: LucidUser): Int = { getWithRetry() { user.driver.getCssElement(visibleCss).children.size } }

测试集重试

Yarn的团队所做的最后一项改善是配置测试集的重试，测试集重试会将失败的测试缓存起来，然后重新运行这些失败的测试。只要在后续的重试中有一次成功，这项测试就会被认为通过。否则将继续重试，直到重试次数达到上限为止。 Yarn的做法是尽量将一些依赖于第三方功能的行为区分开来，特意为这些功能的集成编写非常健壮的代码似乎没有什么意义，因此可以将它们放到一个可重试的测试集中。对于他们来说，重试的目的不是为了修复测试代码中的问题，而是为了消除测试报告中由误判所带来的影响。

创造乐趣

Selenium的开发很容易令人感到疲惫，许多测试会无故地失败，让这些测试得到正确的结果是非常繁琐的工作，重复性的样板代码令人提不起兴致。而在Yarn的团队建立了一个可靠的、可维护以及可伸缩的框架之后，工作就变得有趣起来了。各种有趣的想法层出不穷，有一位开发者实现了对绘画canvas截图并上传至Amazon S3服务的功能，随后又加入了一个截图比较的工具以实现图片比较测试。其它令人印象深刻的测试还包括与Google Drive、Yahoo与Google的单点登录等功能的整合。整个测试工作开始变得生动起来，这也为团队最终实现了重构的目标带来了极大的推动力。

感谢徐川对本文的审校。

给InfoQ中文站投稿或者参与内容翻译工作，请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博（@InfoQ，@丁晓昀），微信（微信号： InfoQChina ）关注我们，并与我们的编辑和其他读者朋友交流（欢迎加入InfoQ读者交流群使用Selenium测试时必需知道的7件事）。