你的位置:首页 > 数据库

[数据库]表上的DELETE操作


在今天的文章里,我想给你快速展示下当我们从表里删除记录时,在SQL Server里发生了什么。首先我们来创建一个简单的表,在8KB的页上刚好能插入4条记录。 

1 -- Create a simple table where 4 records fit onto 1 page2 CREATE TABLE TestTable3 (4   Col1 INT IDENTITY(1, 1),5   Col2 CHAR(2000)6 )7 GO

接下来我们插入4条记录,这样的话一个页刚好全部填满。

 1 -- Insert 4 records 2 INSERT INTO TestTable VALUES 3 ( 4   REPLICATE('1', 2000) 5 ), 6 ( 7   REPLICATE('2', 2000) 8 ), 9 (10   REPLICATE('3', 2000)11 ),12 (13   REPLICATE('4', 2000)14 )15 GO

为了研究我们堆表的细节,我们使用DBCC PAGE命令来倾倒出分配的页面。因此我们还要启用3604跟踪标志,这样的话SQL Server从DBCC PAGE命令直接把结果输入到我们SSMS的会话窗口:

1 -- Enable the Trace Flag 36042 DBCC TRACEON(3604)3 GO

我们可以使用DBCC IND命令返回所有分配给指定表或索引的页: 

1 -- Retrieve all pages of the table2 DBCC IND(DataModifications, TestTable, -1)3 GO

从输出可以看到,2个页属于我们的表:数据页本身,还有IAM(索引分配图(index allocation map))页。

我这里的页号是118,通过DBCC PAGE命令倾倒出页面: 

1 -- Dump out one specific page2 DBCC PAGE (DataModifications, 1, 118, 2)3 GO

当你使用选项2的第3个参数倾倒,SQL Server返回你16进制的页倾倒,包括在页尾所谓的行偏移数组(Row Offset Array),不以任何方式影响数据。

行偏移数组指向在页上的物理位置,即每条记录存储的地方。第1条记录总是直接存储在页头偏移量96(0x60h)的地方。你也会看到,行偏移数组是逆向增长的。现在让我们从表里删除第2条记录: 

1 -- Delete a record from the table2 DELETE FROM TestTable3 WHERE Col1 = 24 GO

通常这里你会期待记录从页里删除。但事实上并不如此:当你再次执行DBCC PAGE命令时,你会看到在页上老记录的内容还是可以看到。在DELETE操作期间,SQL Server唯一做的是,在页尾行偏移数组里,对应的槽无效了。

如你所见,第2个槽的偏移量是0x0,这是无效的,意味着我们的记录被删除了。在页开始部分,你总会找到96 bytes的页头。现在让我们从表里删除其它的剩余3条记录。 

1 -- Delete all the remaining records from the table2 DELETE FROM TestTable3 GO

当你再次用DBCC PAGE命令查看页,你会看到页全部内容还是没改变:每条记录的每个数据在页上还是物理存在的!但是在行偏移数据里每条记录都指向偏移量0x0,这意味着每条记录都被删除。这与你的表是否使用了聚集索引无关——老数据在页上一直存在。
现在的问题是,SQL Server什么时候会初始化页?当你现在插入新的记录,SQL Server会覆盖页的原始内容。但在我们的情况里,这只是物理部分,第1条记录存储的位置。你还是能看到其它“删除”的记录内容。当你在页尾看下行偏移数组,你会看到它已被SQL Server完全初始化了,也意味着你在行偏移数组里你现在只有1个槽了:

当你下次授权给程序sysadmin特权时,要考虑下这个情况了。使用合适的命令,这些程序还是能看到已经“删除”的数据。

感谢关注!