你的位置:首页 > 数据库

[数据库]论Postgres的“已提交的而且 xmin’比当前事务的XID小的记录对当前事务才是可见的”


最近在网上看到这样一句话Postgres“已提交的而且 xmin 比当前事务的XID小的记录对当前事务才是可见的”。先不评断这句话的正确性;看下这句话的结构,因果关系;
按照此话的意思;要postgres中的数据可见必须满足两个必要条件:
  1. 事务已经提交(commit);
  2. 提交时插入记录的xmin 小于 当前current_txid(事务id)。
而网上对这句话的解释:“这意味着,你可以开始一个新事务然后插入一行记录,直到你提交(COMMIT)之前,你插入的这行记录对其他事务永远都是不可见的。等到提交以后,其他后创建的新事务就可以看到这行新记录了,因为他们满足了 xmin < XID 条件,而且创建哪一行记录的事务也已经完成”。看起来挺合理的,无懈可击似的。接下来我们来推敲推敲。要说记录的可见性;这还得从事务的隔离级别说起。
 
根据《PostgreSQL9.4.4-CN-v1.0.pdf》文档介绍: SQL标准定义了四个级别的事务隔离 { SERIALIZABLE | REPEATABLE READ | READ COMMITTED | READ UNCOMMITTED }; postgres目前只实现了 {SERIALIZABLE | REPEATABLE READ | READ COMMITTED }这三种。详细大家去看文档;这里不做介绍。
  • 事务隔离级别READ COMMITTED
事务隔离级别:读已提交(READ COMMITTED)这是postgres,greenplum默认的事务隔离级别。若从先事务隔离级别(读已提交)来解释:就是读已经提交的记录;是不是这样呢? 来验证下。
--session A 事务id为1844;postgres=# begin;BEGINpostgres=# select txid_current(); txid_current --------------     1844     --session B 事务id为1845;并在插入一条记录在lottu05表(未提交)postgres=# begin;BEGINpostgres=# select txid_current(); txid_current --------------     1845postgres=# insert into lottu05 values (1001,'lottu');INSERT 0 1--在session A/B查看记录; session A读不到记录; session B可以读到记录。postgres=# select * from lottu05; id | name ----+------(0 rows)--在session B提交插入的记录;在查看session A是否可以看到记录。postgres=# select xmin,* from lottu05; xmin | id | name ------+------+------- 1845 | 1001 | lottu--表明session A(当前事务为ID:1844)可以读 插入记录事务id为1845 已经提交的记录。--总结: 事务隔离级别为读已提交(READ COMMITTED)就是读已经提交的记录。由此可见,对读已提交隔离级别而言"已提交的而且 xmin’比当前事务的XID小的记录对当前事务才是可见的"是不正确的。而网上的解释:也是必要不充分条件。那该如何诠释这说话呢?请看下文讲解是根据当前postgres系统的当前事务ID相比;目前系统下一个事务ID为1846-- 我们现在看下当前postgres系统 下一个事务id[postgres@localhost ~]$ pg_controldata |grep NextXIDLatest checkpoint's NextXID:     0/1846--意思是说这条记录后面开启会话从事务id:1846是可见的。不充分的是事务ID:1844也可以读到该记录。--然而这句话来源何处;我想是有依据的。接下来我们做一个实验。模拟postgrs穿越到过去。             --session C 现在插入1002-1008条记录;结果如下:postgres=# select xmin,id,name from lottu05; xmin | id | name  ------+------+--------- 1845 | 1001 | lottu 1846 | 1002 | lottu02 1847 | 1003 | lottu03 1848 | 1004 | lottu04 1849 | 1005 | lottu05 1850 | 1006 | lottu06 1851 | 1007 | lottu07 1852 | 1008 | lottu08  --我们现在使用将数据库postgres回到 txid 为1849。注意:该动作不建议操作;[postgres@localhost ~]$ pg_stopwaiting for server to shut down.......... doneserver stopped[postgres@localhost ~]$ pg_resetxlog -x 1849 $PGDATATransaction log reset[postgres@localhost ~]$ pg_startserver starting[postgres@localhost ~]$ psqlpsql (9.5.0)Type "help" for help.postgres=# select xmin,id,name from lottu05; xmin | id | name  ------+------+--------- 1845 | 1001 | lottu 1846 | 1002 | lottu02 1847 | 1003 | lottu03 1848 | 1004 | lottu04 1849 | 1005 | lottu05--可以看到上面的xmin:(1850-1852)是不可见的。--等数据库的事务ID超过1852;这些数据可以展示出来。postgres=# select txid_current(); txid_current --------------     1850postgres=# select txid_current(); txid_current --------------     1851postgres=# select txid_current(); txid_current --------------     1852postgres=# select xmin,id,name from lottu05; xmin | id | name  ------+------+--------- 1845 | 1001 | lottu 1846 | 1002 | lottu02 1847 | 1003 | lottu03 1848 | 1004 | lottu04 1849 | 1005 | lottu05 1850 | 1006 | lottu06 1851 | 1007 | lottu07 1852 | 1008 | lottu08 --从这个实验看来 确实是需要满足网上所说的两个条件。上面也提过;该操作不建议操作。设想;当前时代若可以穿越到历史上各个时代;那历史不乱套了吗?同理如此。所以说对隔离级别为READ COMMITTED而言;如同它字面解释一样;只要记录COMMITTED;就可以读到。 注意:--1.该操作不等同 oracle的flashback操作;虽然回到了历史;历史上已经发生的还是会发生。--2.该操作并不能做数据恢复操作。若对数据做删除进行恢复;可以参考--http://www.cnblogs.com/lottu/p/5761885.html 

总结:对隔离级别为READ COMMITTED而言;如同它字面解释一样;只要记录COMMITTED;就可以读到
  • 事务隔离级别:REPEATABLE READ
事务隔离级别:REPEATABLE READ;是不是如同它而言呢?接下来拭目以待吧。
--开启SESSION A; ctid为1857。postgres=# truncate table lottu05;TRUNCATE TABLEpostgres=# begin;BEGINpostgres=# select txid_current(); txid_current --------------     1857--开启session B;隔离级别为REPEATABLE READ。事务id为:1858postgres=# begin ISOLATION LEVEL REPEATABLE READ;BEGINpostgres=# select txid_current(); txid_current --------------     1858 --在session A插入 10条记录并提交postgres=# insert into lottu05 select generate_series(1001,1010),'lottu'||generate_series(1,10);INSERT 0 10postgres=# commit;COMMIT--在session B查看是否可以读到记录postgres=# select * from lottu05; id | name ----+------(0 rows)    --结果表明session B 读不到 已经提交且 事务ID:1857比session B的事务ID为1858要小的记录。

总结:
对Postgres记录的可见性;网上这句话“已提交的而且 xmin 比当前事务的XID小的记录对当前事务才是可见的”的解释(这意味着,你可以开始一个新事务然后插入一行记录,直到你提交(COMMIT)之前,你插入的这行记录对其他事务永远都是不可见的。等到提交以后,其他后创建的新事务就可以看到这行新记录了,因为他们满足了 xmin < XID 条件,而且创建哪一行记录的事务也已经完成”)是充分不必要;而非充要条件。而这句话的真伪;我相信看到此处的读者应该明白了。
--参考文献
http://blog.163.com/digoal@126/blog/static/163877040201183043153622/
http://www.cnblogs.com/lottu/p/5761885.html