在MySQL 5.7中做逻辑备份恢复有了一个新的工具mysqlpump,如果你掌握了mysqldump,那么使用mysqlpump就是分分钟的事情,因为很多参数都是很相似的,可以理解它是mysqldump的加强版,一个亮点就是有了并行的选项,使得数据备份的性能更加强大。
有一点值得说明的是,为了保证数据一致性,我们一般备份都会使用--single-transaction的选项,在5.7.11以前,mysqlpump和并行参数是有冲突的,在这个版本之后做了修复。
但是mysqlpump到底怎么样呢,我在5.7.17的版本中做了一些简单的测试,可以看出一些性能的差异。
为了尽可能保证导出的数据备份能够占用少的磁盘空间,我们经常会使用gzip来压缩,我们就分了几个场景来对比压缩,不压缩,开启并行后的数据备份的性能差异。
我选取的数据集大小在30G左右。含有5个数据库,单表数据量在200万以上,单库的表数量在10个以上。
得到的一个基本测试结果如下,后续的测试结果会一并补上。
option | real | idle% | dump_size(byte) |
compress=false | 6m52.232s | 85.92 | 26199028017 |
compress=false|gzip | 43m12.574s | 90.72 | 12571701197 |
compress=true | 19m24.541s | 80.48 | 26199028017 |
compress=true |gzip | 43m12.515s | 84.94 | 12571200219 |
parallelism=4 | 5m30.005s | 76.43 | 26199028017 |
parallelism=4 |gzip | 42m41.433s | 90.51 | 12575331504 |
parallelism=8 | 4m44.177s | 66.73 | 26199028017 |
可以看到默认来说,导出一个30G左右的dump需要近7分钟,而启用了并行之后,并行度为4的时候,导出时间是5分半,提升了1.5分钟(20%),并行度为8之后提升了2分钟左右(30%)。而在系统层面做了压缩的时候,压缩率达到了近48%。还是相当不错的。在compress=true只是在服务端客户端交互中使用数据包压缩,最后的备份集大小是没有任何改变的。后续会测试使用不同的压缩算法,备份的性能差异。