在今天的文章里,我想谈下使用内存中OLTP的内存优化文件组来获得持久性,还有如何配置它来获得高性能。在进入正题前,我想简单介绍下使用你数据库里这个特定文件组,内存OLTP是如何获得持久性的。
早些天对内存中OLTP(代号Hekaton)的一个大误解是,人们认为内存中OLTP是不具有ACID属性的——只有ACI属性,没有D属性( Durability )。但这不是真的,因为在内存中OLTP里,每个在内存中的操作都是完全日志的。如果你的数据库崩溃,内存中OLTP可以将你的数据库和内存优化表在崩溃发生前恢复常态。内存中OLTP记录每个操作到传统SQL Server的事务日志。因为在非持久性内存里发生的一切都是基于MVCC原则,内存中OLTP只记录重做(redo)日志记录,任何时间都没有撤销(undo)日志,因为用内存中OLTP在故障恢复期间从不会有撤销操作发生。对进行中的事务进行回滚操作,只有前版本才是可以的。
当事务的提交时,重做(redo)日志才会写入。另外所谓的 离线检查点工作者(Offline Checkpoint Worker) 将成功提交的事务从事务填入一对所谓的 数据和德尔塔文件(Data and Delta Files) ,来自内存中OLTP的数据和德尔塔文件会加速故障恢复。故障恢复重建你的内存优化表初始于数据和德尔塔文件对,然后自上个检查发生的所有改变从事务日志里应用。我们来看下这个概念。
因为在内存OLTP里一切都是和高性能有关,数据和德尔塔文件SQL Server只用 顺序读写(sequential I/O) 。不会涉及到随机读写(random I/O),因为这会杀死性能。现在的问题是,什么信息会写入数据和德尔塔文件对?内存中OLTP数据文件包含插入到内存优化表的记录。因为插入只发生在文件末尾,顺序读写很容易实现。当你在内存优化表删除指定记录时,记录只在对应的德尔塔文件逻辑上标记为删除。这个信息也是加在德尔塔文件末尾,这样又是真正的在存储里顺序读写。UPDATE语句只是新记录和老记录副本INSERT语句和DELETE语句的组合。很简单,是不是?下图展示了这个重要概念。
如果你想进一步了解内存中OLTP如何实现持久性的,我强烈推荐Tony Rogerson写的文章 How Hekaton (XTP) achieves Durability for “Memory Optimised” Tables 。
内存优化表的故障恢复以你数据和德尔塔文件对存储的速度进行。因此当你创建数据库,当考虑并决定配置存储文件对的内存中OLTL文件组,仔细对待就非常重要。首先你要包含内存优化数据的存储增加文件组,如下代码所示:
-- Add a new memory optimized file group ALTER DATABASE InMemoryOLTP ADD FILEGROUP InMemoryOLTPFileGroup CONTAINS MEMORY_OPTIMIZED_DATA GO
在内存优化文件组创建后(在传统 FILESTREAM 文件组覆盖下),你可以添加存储容器(storage container)到文件组。这里你可以使用 ADD FILE 命令,如下代码所示:
1 -- Add a new storage container 2 ALTER DATABASE InMemoryOLTP ADD FILE 3 ( 4 NAME = N'InMemoryOLTPContainer', 5 FILENAME = N'C:/Program Files/Microsoft SQL Server/MSSQL12.SQL2014/MSSQL/DATA/InMemoryOLTPContainer' 6 ) 7 TO FILEGROUP [InMemoryOLTPFileGroup] 8 GO
估计你现在网上看到的所有文章里都只介绍增加1个存储容器——这会大大伤及你的性能!原因很简单:
为了克服这些限制,你可以添加多个属于内存优化文件的存储容器在不同的“物理”硬盘上。这样的话,数据和德尔塔文件在多个存储容器间会以循环(round-robin)样式分配。假设配置2个存储容器会发生什么:
下图给你具体演示了这个概念。
但是只使用2个存储容器并不解决你的磁盘瓶颈问题,因为只有2个容器,所有的数据文件存储在第1个容器,所有的德尔塔文件存储在第2个容器。一般来说,你的数据文件比你的德尔塔文件会多很多,这就是说在不同物理硬盘上的2个存储容器之间的读写很不平衡。存储你所有数据文件的第1个存储容器比存储你所有德尔塔文件的第2个容器需要更多的IOPS。
为了多个物理硬盘之间IOPS平均分布与平衡。对于你的内存优化文件组,微软推荐至少4个存储容器。当你有4个存储容器时,想象下会发生什么,如下图所示:
如果你使用这个配置,在第1个物理硬盘上你有第1个文件对(数据和德尔塔文件),在第2个物理存储上你有第2个文件对(数据和德尔塔文件),在第1个物理硬盘上你有第3个文件对(数据和德尔塔文件),以此类推。最后你在多个物理硬盘键平均散布了你的读写请求,这会加速你的故障恢复进程,因为故障恢复可以在存储容器里并行,这会加速你数据库联机。
在这个文件里你看到对于内存中OLTP,存储速度和吞吐量还是非常重要的。在存储里,你的数据必须是物理永驻的,不然当你的SQL Server崩溃或重启时,你的数据就会丢失。你内存优化文件组配置会大大影响文件组给你的吞吐量。如果你在生产环境运行内存中OLTP,你应该至少配置4个存储容器分布在2个物理硬盘。在性能要求更高的场景,你甚至可以增加超过2个物理硬盘的更多存储容器。正如微软说的:“ 内存中OLTP的故障恢复是以你存储速度进行的 ”。
感谢关注!