数据库系统概论（第十一章：并发控制） - 好文

第十一章  并发控制

1、多用户数据库系统
允许多个用户同时使用的数据库系统
2、多事务执行方式
（1）事务串行执行
每个时刻只有一个事务运行，其他事务必须等到这个事务结束以后方能运行
不能充分利用系统资源，发挥数据库共享资源的特点
（2）交叉并发方式（Interleaved  Concurrency）
在单处理机系统中，事务的并行执行是这些并行事务的并行操作轮流交叉运行
单处理机系统中的并行事务并没有真正地并行运行，但能够减少处理机的空闲时间，提高系统的效率
（3）同时并发方式（simultaneous  concurrency）
多处理机系统中，每个处理机可以运行一个事务，多个处理机可以同时运行多个事务，实现多个事务真正的并行运行
最理想的并发方式，但受制于硬件环境
更复杂的并发方式机制
3、本章讨论的数据库系统并发控制技术是以单处理机系统为基础的
4、事务并发执行带来的问题
（1）会产生多个事务同时存取同一数据的情况
（2）可能会存取和存储不正确的数据，破坏事务隔离性和数据库的一致性
5、数据库管理系统必须提供并发控制机制
6、并发控制机制是衡量一个数据库管理系统性能的重要标志之一

11.1.1 并发控制概述
1、事务是并发控制的基本单位
2、并发控制机制的任务
（1）对并发操作进行正确调度
（2）保证事务的隔离性
（3）保证数据库的一致性
3、并发操作带来的数据不一致性
（1）丢失修改（Lost Update）
两个事务T1和T2读入同一数据并修改，T2的提交结果破坏了T1提交的结果，导致T1的修改被丢失。
（2）不可重复读（Non-repeatable Read）
不可重复读是指事务T1读取数据后，事务T2执行更新操作，使T1无法再现前一次读取结果。

不可重复读包括三种情况：

事务T1读取某一数据后，事务T2对其做了修改，当事务T1再次读该数据时，得到与前一次不同的值事务T1按一定条件从数据库中读取了某些数据记录后，事务T2删除了其中部分记录，当T1再次按相同条件读取数据时，发现某些记录神秘地消失了。
事务T1按一定条件从数据库中读取某些数据记录后，事务T2插入了一些记录，当T1再次按相同条件读取数据时，发现多了一些记录。
后两种不可重复读有时也称为幻影现象（Phantom Row）
（3）读“脏”数据（Dirty Read）
   读“脏”数据是指：
事务T1修改某一数据，并将其写回磁盘
事务T2读取同一数据后，T1由于某种原因被撤销
这时T1已修改过的数据恢复原值，T2读到的数据就与数据库中的数据不一致
T2读到的数据就为“脏”数据，即不正确的数据
4、记号
（1）R(x):读数据x
（2）W(x):写数据x
5、数据不一致性：由于并发操作破坏了事务的隔离性

6、并发控制就是要用正确的方式调度并发操作，使一个用户事务的执行不受其他事务的干扰，从而避免造成数据的不一致性
7、对数据库的应用有时允许某些不一致性，例如有些统计工作涉及数据量很大，读到一些“脏”数据对统计精度没什么影响，可以降低对一致性的要求以减少系统开销
8、并发控制的主要技术
封锁(Locking)
时间戳(Timestamp)
乐观控制法
多版本并发控制(MVCC)

11.2  封锁
1、什么是封锁
（1）封锁就是事务T在对某个数据对象（例如表、记录等）操作之前，先向系统发出请求，对其加锁
（2）加锁后事务T就对该数据对象有了一定的控制，在事务T释放它的锁之前，其它的事务不能更新此数据对象。
（3）封锁是实现并发控制的一个非常重要的技术
2、基本封锁类型
（1）一个事务对某个数据对象加锁后究竟拥有什么样的控制由封锁的类型决定。
（2）基本封锁类型
排它锁（Exclusive Locks，简记为X锁）
排它锁又称为写锁。
若事务T对数据对象A加上X锁，则只允许T读取和修改A，其它任何事务都不能再对A加任何类型的锁，直到T释放A上的锁。
保证其他事务在T释放A上的锁之前不能再读取和修改A 。
共享锁（Share Locks，简记为S锁）
共享锁又称为读锁
若事务T对数据对象A加上S锁，则事务T可以读A但不能修改A，其它事务只能再对A加S锁，而不能加X锁，直到T释放A上的S锁
保证其他事务可以读A，但在T释放A上的S锁之前不能对A做任何修改

11.3  封锁协议
1、什么是封锁协议
（1）在运用X锁和S锁对数据对象加锁时，需要约定一些规则，这些规则为封锁协议（Locking Protocol）。
何时申请X锁或S锁
持锁时间
何时释放
（2）对封锁方式规定不同的规则，就形成了各种不同的封锁协议，它们分别在不同的程度上为并发操作的正确调度提供一定的保证。
2、保持数据一致性的常用封锁协议
一级封锁协议
（1）事务T在修改数据R之前必须先对其加X锁，直到事务结束才释放。
正常结束（COMMIT）
非正常结束（ROLLBACK）
（2）一级封锁协议可防止丢失修改，并保证事务T是可恢复的。
（3）在一级封锁协议中，如果仅仅是读数据不对其进行修改，是不需要加锁的，所以它不能保证可重复读和不读“脏”数据。
二级封锁协议
（1）一级封锁协议加上事务T在读取数据R之前必须先对其加S锁，读完后即可释放S锁。
（2）二级封锁协议可以防止丢失修改和读“脏”数据。
（3）在二级封锁协议中，由于读完数据后即可释放S锁，所以它不能保证可重复读。
三级封锁协议
（1）一级封锁协议加上事务T在读取数据R之前必须先对其加S锁，直到事务结束才释放。
（2）三级封锁协议可防止丢失修改、读脏数据和不可重复读。
封锁协议小结
（1）三级协议的主要区别
什么操作需要申请封锁以及何时释放锁（即持锁时间）
（2）不同的封锁协议使事务达到的一致性级别不同
封锁协议级别越高，一致性程度越高

11.4  活锁和死锁
（1）封锁技术可以有效地解决并行操作的一致性问题，但也带来一些新的问题
死锁
活锁
11.4.1 活锁
1、事务T1封锁了数据R

2、事务T2又请求封锁R，于是T2等待。
3、T3也请求封锁R，当T1释放了R上的封锁之后系统首先批准了T3的请求，T2仍然等待。

4、T4又请求封锁R，当T3释放了R上的封锁之后系统又批准了T4的请求……
5、T2有可能永远等待，这就是活锁的情形
6、避免活锁：采用先来先服务的策略
（1）当多个事务请求封锁同一数据对象时
（2）按请求封锁的先后次序对这些事务排队
（3）该数据对象上的锁一旦释放，首先批准申请队列中第一个事务获得锁

11.4.2  死锁
1、事务T1封锁了数据R1
2、T2封锁了数据R2
3、T1又请求封锁R2，因T2已封锁了R2，于是T1等待T2释放R2上的锁
4、接着T2又申请封锁R1，因T1已封锁了R1，T2也只能等待T1释放R1上的锁
5、这样T1在等待T2，而T2又在等待T1，T1和T2两个事务永远不能结束，形成死锁
6、解决死锁的方法
两类方法
（1）死锁的预防
（2）死锁的诊断与解除
7、死锁的预防
（1）产生死锁的原因是两个或多个事务都已封锁了一些数据对象，然后又都请求对已为其他事务封锁的数据对象加锁，从而出现死等待。
（2）预防死锁的发生就是要破坏产生死锁的条件
（3）预防死锁的方法
一次封锁法
顺序封锁法
8、死锁的诊断与解除
（1）死锁的诊断
超时法
如果一个事务的等待时间超过了规定的时限，就认为发生了死锁
优点：实现简单
缺点：
有可能误判死锁
时限若设置得太长，死锁发生后不能及时发现

等待图法
用事务等待图动态反映所有事务的等待情况
事务等待图是一个有向图G=(T，U)。
T为结点的集合，每个结点表示正运行的事务。
U为边的集合，每条边表示事务等待的情况。
若T1等待T2，则T1，T2之间划一条有向边，从T1指向T2
并发控制子系统周期性地（比如每隔数秒）生成事务等待图，检测事务。如果发现图中存在回路，则表示系统中出现了死锁。

解除死锁
选择一个处理死锁代价最小的事务，将其撤消
释放此事务持有的所有的锁，使其它事务能继续运行下去

11.5  并发调度的可串行性
1、数据库管理系统对并发事务不同的调度可能会产生不同的结果
2、串行调度是正确的
3、执行结果等价于串行调度的调度也是正确的，称为可串行化调度

11.5.1 可串行化调度
1、可串行化(Serializable)调度
多个事务的并发执行是正确的，当且仅当其结果与按某一次序串行地执行这些事务时的结果相同
2、可串行性(Serializability)
（1）是并发事务正确调度的准则
（2）一个给定的并发调度，当且仅当它是可串行化的，才认为是正确调度

11.5.2 冲突可串行化调度
1、冲突可串行化
（1）一个比可串行化更严格的条件
（2）商用系统中的调度器采用
2、冲突操作：是指不同的事务对同一数据的读写操作和写写操作：
Ri(x)与Wj(x)        /*事务Ti读x，Tj写x，其中i≠j*/
Wi(x)与Wj(x)         /*事务Ti写x，Tj写x，其中i≠j*/
   其他操作是不冲突操作
3、冲突
不能交换（Swap）的动作:
同一事务的两个操作
不同事务的冲突操作
4、冲突可串行化（续）
（1）一个调度Sc在保证冲突操作的次序不变的情况下，通过交换两个事务不冲突操作的次序得到另一个调度Sc’，如果Sc’是串行的，称调度Sc是冲突可串行化的调度
（2）若一个调度是冲突可串行化，则一定是可串行化的调度
（3）可用这种方法判断一个调度是否是冲突可串行化的
（4）冲突可串行化调度是可串行化调度的充分条件，不是必要条件。还有不满足冲突可串行化条件的可串行化调度。

11.6  两段锁协议
1、数据库管理系统普遍采用两段锁协议的方法实现并发调度的可串行性，从而保证调度的正确性
2、两段锁协议
指所有事务必须分两个阶段对数据项加锁和解锁
（1）在对任何数据进行读、写操作之前，事务首先要获得对该数据的封锁
（2）在释放一个封锁之后，事务不再申请和获得任何其他封锁
“3、两段”锁的含义
事务分为两个阶段
（1）第一阶段是获得封锁，也称为扩展阶段
事务可以申请获得任何数据项上的任何类型的锁，但是不能释放任何锁
（2）第二阶段是释放封锁，也称为收缩阶段
事务可以释放任何数据项上的任何类型的锁，但是不能再申请任何锁
4、事务遵守两段锁协议是可串行化调度的充分条件，而不是必要条件。

5、若并发事务都遵守两段锁协议，则对这些事务的任何并发调度策略都是可串行化的
6、若并发事务的一个调度是可串行化的，不一定所有事务都符合两段锁协议
7、两段锁协议与防止死锁的一次封锁法
（1）一次封锁法要求每个事务必须一次将所有要使用的数据全部加锁，否则就不能继续执行，因此一次封锁法遵守两段锁协议
（2）但是两段锁协议并不要求事务必须一次将所有要使用的数据全部加锁，因此遵守两段锁协议的事务可能发生死锁

11.7  封锁的粒度
1、封锁对象的大小称为封锁粒度(Granularity)
2、封锁的对象:逻辑单元，物理单元
3、选择封锁粒度原则
（1）封锁粒度与系统的并发度和并发控制的开销密切相关。
封锁的粒度越大，数据库所能够封锁的数据单元就越少，并发度就越小，系统开销也越小；
封锁的粒度越小，并发度较高，但系统开销也就越大

11.7.1 多粒度封锁
1、多粒度树
（1）以树形结构来表示多级封锁粒度。
（2）根结点是整个数据库，表示最大的数据粒度。
（3）叶结点表示最小的数据粒度。
2、允许多粒度树中的每个结点被独立地加锁
3、对一个结点加锁意味着这个结点的所有后裔结点也被加以同样类型的锁
4、在多粒度封锁中一个数据对象可能以两种方式封锁：显式封锁和隐式封锁
5、显式封锁和隐式封锁
（1）显式封锁: 直接加到数据对象上的封锁。
（2）隐式封锁:是该数据对象没有独立加锁，是由于其上级结点加锁而使该数据对象加上了锁
（3）显式封锁和隐式封锁的效果是一样的
（4）系统检查封锁冲突时
要检查显式封锁
还要检查隐式封锁
（5）对某个数据对象加锁，系统要检查
该数据对象
有无显式封锁与之冲突
所有上级结点
检查本事务的显式封锁是否与该数据对象上的隐式封锁冲突：(由上级结点已加的封锁造成的）
所有下级结点
看上面的显式封锁是否与本事务的隐式封锁（将加到下级结点的封锁）冲突

11.7.2 意向锁
1、引进意向锁（intention lock）目的
提高对某个数据对象加锁时系统的检查效率
2、如果对一个结点加意向锁，则说明该结点的下层结点正在被加锁
3、对任一结点加基本锁，必须先对它的上层结点加意向锁
4、常用意向锁
意向共享锁(Intent Share Lock，简称IS锁)
意向排它锁(Intent Exclusive Lock，简称IX锁)
共享意向排它锁(Share Intent Exclusive Lock，简称SIX锁)
5、IS锁
如果对一个数据对象加IS锁，表示它的后裔结点拟（意向）加S锁。
6、IX锁
如果对一个数据对象加IX锁，表示它的后裔结点拟（意向）加X锁。
7、SIX锁
如果对一个数据对象加SIX锁，表示对它加S锁，再加IX锁，即SIX = S + IX。
8、具有意向锁的多粒度封锁方法
（1）申请封锁时应该按自上而下的次序进行
（2）释放封锁时则应该按自下而上的次序进行
9、具有意向锁的多粒度封锁方法
（1）提高了系统的并发度
（2）减少了加锁和解锁的开销
（3）在实际的数据库管理系统产品中得到广泛应用

11.9 小结
1、数据库的并发控制以事务为单位

2、数据库的并发控制通常使用封锁机制
（1）基本封锁
（2）多粒度封锁
3、活锁和死锁
4、并发事务调度的正确性
（1）可串行性
并发操作的正确性则通常由两段锁协议来保证。
两段锁协议是可串行化调度的充分条件，但不是必要条件
（2）冲突可串行性
5、其他并发控制机制
时间戳方法
乐观控制法
多版本并发控制

热门工具换一换