转载

索引深入浅出：非聚集索引的B树结构在聚集表

一个表只能有一个聚集索引，数据行以此聚集索引的顺序进行存储，一个表却能有多个非聚集索引。我们已经讨论了聚集索引的结构，这篇我们会看下非聚集索引结构。

非聚集索引的逻辑呈现

简单来说，非聚集索引是表的子集。当我们定义了一个非聚集索引时，SQL Server把整套非聚集索引键存在不同的页里。我们来看下一个包含BusinessEntityID(PK),PersonType,FirstName,LastName这4列的表，这个表上有一个非聚集索引定义。主体表按BusinessEntityID列（聚集索引键）的顺序存储。非聚集索引的存储是与主体表分离的。如果你仔细看非聚集索引表，你会发现，记录是按Firstname，lastname 列的顺序排列的。简单理解下，非聚集索引就是主体表的子集。

假设现在我们要找出first name值为 Michael 的记录。如果你从实体表找的话，我们需要从头到脚把每条记录匹配一次，因为记录并没有按first name列排序保存。如果这个表记录有上千条记录的话，这将是一个非常无聊且费时的工作。如果我们在非聚集索引表里找将会容易很多，因为这个表是按first name列以字母顺序排列的。我们很容易定位到first name是 Michael 的记录。我们并不需要再往下找，因为我们确定没有更多的first name是 Michael 的记录了。

现在我们得到了Firstname，lastname的值。那我们如何拿到其它2列的值？让我们对非聚集索引做一些改动，将BusinessEntityID列也作为非聚集索引。

索引深入浅出：非聚集索引的B树结构在聚集表

现在，一旦我们定位到记录，我们可以使用BusinessEntityID（聚集索引键）列返回主体表，得到其他列的值，这个操作被称为书签查找（bookmark lookups）或RID查找。

聚集索引与非聚集索引

非聚集索引和聚集索引有一样的B树结构。非聚集索引键不会对主体表的数据排序做任何改变，因为聚集索引强制SQL Server将数据以聚集索引键的顺序存储。聚集索引的叶子层由包含表具体数据的数据页组成，而非聚集索引的叶子层由索引页组成。

非聚集索引可以定义在堆表或聚集表。在非聚集索引的叶子层，每个索引行包含非聚集索引键值和行定位器。这个定位器指向聚集索引或堆表的数据行。在非聚集索引行里的行定位器要么指向行，要么指向行聚集索引键。如果是堆表，它没有聚集索引，行定位器是个指向行的指针。这个指针由页里行的（文件号：页号：槽号，file identifier ：page number ：slot number）组成。整个指针被称为ROW ID（RID）。如果表有聚集索引，行定位器是行的聚集索引键。

非聚集索引深入浅出

我们用文章“ 索引深入浅出：聚集索引的B树结构 ”用到的salesorderdetails创建一个非聚集索引，这个表在salesorderdetailid列有一个聚集索引。

1 CREATE UNIQUE INDEX Ix_ProductId ON SalesOrderDetail(ProductId,Salesorderid)

收集非聚集索引相关信息：

 1 TRUNCATE TABLE dbo.sp_table_pages  2 INSERT INTO sp_table_pages EXEC('DBCC IND(IndexDB,SalesOrderDetail,2)')  3 GO  4   5 SELECT * FROM dbo.sp_table_pages ORDER BY IndexLevel DESC --根节点/索引页  6 DBCC TRACEON(3604)  7 DBCC PAGE(IndexDB,1,3472,3)  8   9 DBCC TRACEON(3604) 10 DBCC PAGE(IndexDB,1,3416,3)--叶子节点/索引页 11  12 DBCC TRACEON(3604) 13 DBCC PAGE(IndexDB,1,3557,3)--叶子节点/索引页 14 SELECT * FROM dbo.sp_table_pages WHERE IndexLevel=0 --叶子节点/索引页

根据上述信息进行非聚集索引逻辑示意图的绘制：

索引深入浅出：非聚集索引的B树结构在聚集表

现在我们来分析下SQL Server如何存储非聚集索引，首先我们通过DBCC IND命令查看非聚集索引的页分配情况，最后一个参数，2是Ix_ProductId的索引号。

1 DBCC IND(IndexDB,SalesOrderDetail,2)

索引深入浅出：非聚集索引的B树结构在聚集表

我们看到输出结果一共有229条记录，包含1个IAM页和229个索引页。我们可以通过找IndexLevel 列值最大的记录，来找根页（root page）。记住索引层级是从叶子层向根层增长的。

1 SELECT * FROM dbo.sp_table_pages ORDER BY IndexLevel DESC --根节点/索引页

索引深入浅出：非聚集索引的B树结构在聚集表

在这个表里，我们根层（root leve）页号是3472，index level是1，这就是说，这个非聚集索引的B树结构只有根层（root level）和叶子层（leaf level），没有中间层（intermediate level）。我们来看看3472页。

1 DBCC TRACEON(3604) 2 DBCC PAGE(IndexDB,1,3472,3)

索引深入浅出：非聚集索引的B树结构在聚集表

返回结果一共有227条记录（227个叶子层的索引页）。部分结果如上所示。这和聚集索引里的根层（root）/中间层（intermediate）的页结构是一样的。productid与salesorderid组合的值小于或等于（707，51151）的所有记录，可以在子页3416里找到。productid与salesorderid组合的值在（707，51151）与（707，55920）之间的所有记录，可以在子页3417里找到，并以此类推。

我们来看看3417页。

1 DBCC TRACEON(3604) 2 DBCC PAGE(IndexDB,1,3417,3)

索引深入浅出：非聚集索引的B树结构在聚集表

一共返回539条记录，都是product id为707的记录。这里的索引只用2层，这个是B树结构的叶子层。你会注意到，这里没有子页ID列，但我们有salesorderdetailid列（聚集索引键），SQL Server用它来进行键或书签查找操作。

我们来看看，SQL Server如何使用这个索引进行一个SELECT操作。点击工具栏的索引深入浅出：非聚集索引的B树结构在聚集表显示包含实际的执行计划。

1 SET STATISTICS IO ON 2 GO 3 SELECT *  FROM SalesOrderDetail WHERE productid=707 AND SalesOrderid=51192

索引深入浅出：非聚集索引的B树结构在聚集表

可以看到执行计划的键查找操作。因为这里where条件刚好完全符合我们非聚集索引定义，SQL Server用这个索引来执行查询。首先SQL Server读取B树结构的根页。我们的查询条件组合（707，51192）落在根页的第二条记录上，因此SQL Server走到它的子页（页号3417）。在这个页里，我们可以用条件组合（707，51192）定位到具体的记录上，它的salesorderdetailid值是37793。从这里开始，SQL Server使用salesorderdetailid值进行键查找（key look up）操作。从上一个文章知道，但我们进行任何聚集索引键查找是，需要执行3个I/O。因此这里，SQL Server需要执行5个I/O操作（2个在非聚集索引，3个在聚集索引的书签/键查找（bookmark/key lookup），这个和你的结果输出一致。

索引深入浅出：非聚集索引的B树结构在聚集表

为了更好的理解它，我们可以把非聚集索引当作salesorderdetail 表的一个子表（我们把它叫做Saleorderdetail_NC），有productid,salesorderid 和 SalesorderDetailid列，并且 ProductId与salesorderid列组合为聚集索引。上述查询的结果可以通过以下2个查询来获得。

1 SELECT *  FROM SalesOrderDetail_nc WHERE productid=707 AND SalesOrderid=51192 2 GO 3 SELECT *  FROM SalesOrderDetail WHERE SalesOrderDetailid=37793

我们再来看一个查询：


1 SELECT *  FROM SalesOrderDetail WHERE productid=707

索引深入浅出：非聚集索引的B树结构在聚集表

查询返回3083条记录，查询条件与非聚集索引的第一列匹配。但是SQL Server并没用聚集索引来执行这个查询，查询计划如下所示。

索引深入浅出：非聚集索引的B树结构在聚集表

这样做的原因是，如果使用非聚集索引，就需要为3083条记录执行书签查找（key lookup）。这会产生9249个I/O操作（3083*3）。因此，SQL Server使用了聚集索引扫描，它只需要1501（对于聚集索引树结构需要的页数）个I/O操作。如果我们做一个小的改动，只要Productid ,SalesOrderDetailid and SalesOrderId列，SQL Server会使用非聚集索引，因为它不需要进行书签查找（bookmark lookup）操作。非聚集索引的叶子层已经包含这些列了。

1 SELECT productid,salesorderdetailid,salesorderid  FROM SalesOrderDetail WHERE productid=707

索引深入浅出：非聚集索引的B树结构在聚集表

这篇文章真的有点长，而且我是该死的BING输入法出错，导致浏览器崩溃，丢失一个晚上3个小时成果，重新写好的，希望大家看了之后可以透彻理解非聚集索引了，晚安各位！！2015-05-14 00:18:42

正文到此结束

所属分类：编程技术

本文标签： UI sql SQL Server cat 参数 key db Select tab CEO root IDE 数据
版权声明： 本文为互联网转载文章，出处已在文章中说明(部分除外)。如果侵权，请联系本站长删除，谢谢。
本文海报： 生成海报一生成海报二

其他链接

关于本站

本站定位：个人技术类博客

本站作用：写博客、记日志、闲聊扯淡鼓捣技术。

问题交流

索引深入浅出：非聚集索引的B树结构在聚集表

非聚集索引的逻辑呈现

聚集索引与非聚集索引

非聚集索引深入浅出

热门推荐

相关文章

说给你听

本文目录

随机标签

书籍教程

近期评论

网站信息

其他链接

关于本站

问题交流