💻
QMMMS的笔记
博客
  • QMMMS的笔记
  • agent
    • MCP的背景、原理和开发
    • Agent 历史与背景
    • Agentic Workflows
    • 环境检查与基础工具
    • Tool Call
    • 工具与运行时的值
    • temp
    • 处理 Tool Call error
    • trick
  • algorithm
    • 线性结构
    • 二叉树
    • 图
    • 查找
    • 排序
    • 动态规划
    • 优化方法
    • 数学
    • 迁移至Java
  • computer_composition
    • 系统总线
    • 存储器
    • 输入输出系统
    • 计算机的运算方法
    • 指令系统
    • 补充
  • computer_network
    • 引入
    • 应用层
    • 传输层
    • 网络层(数据平面)
    • 网络层(控制平面)
    • 链路层
    • 常见问答
    • 实验
  • database
    • SQL实战
    • 关系代数
    • 数据库设计
    • 规范化
    • 数据库基本概念
    • 查询原理
    • 数据库恢复技术
    • 并发控制
  • dev_tools
    • Git
    • Nginx
    • Spring
    • LangChain
    • PyTorch Cheat Sheet
    • MyBatis
    • MySQL Cheat Sheet
    • MySQL 补充
    • Redis
    • Docker
    • RocketMQ
    • Chrome
  • linux
    • Linux基础命令与使用
    • 文件与权限
    • 文件与目录操作
    • 权限属性高级
    • 命令与文件的查找
    • 文件压缩和打包
    • vim编辑器
    • shell变量
    • 命令补充
    • 数据流重定向
    • 管道命令
    • shell脚本
    • 用户管理
    • 用户间交流
    • 计划任务
    • 进程管理
    • 软件管理
    • 认识系统服务
    • 运维常用命令
    • 常用命令
  • llm
    • 大规模语言模型概述
    • 分布式训练概述
    • 有监督微调概述
    • 强化学习与LLM
    • LLM评估概述
    • 大模型应用
    • 理解大模型
    • 量化
    • 预训练
    • 上下文学习
  • machine_learning
    • 引入
    • 大致正确学习
    • 一致收敛
    • 偏差还是过拟合?
    • 可学习的充要条件
    • 非均匀可学习性
    • 计算复杂性
  • mathematics
    • 概率与统计基础
    • 线性代数基础
  • operating_system
    • 操作系统基本概念
    • 进程和线程
    • 同步,互斥与死锁
    • 内存管理
    • 文件系统
    • I/O系统
    • 保护与安全
    • 《现代操作系统》
  • statistical_learning
    • 统计学习引入
    • 线性回归
    • 分类
    • 重抽样方法
    • 线性模型选择与正则化
    • 非线性模型
    • 基于树的方法
    • 支持向量机
    • 无指导学习
    • 马尔科夫链和蒙托卡罗方法简明理解
    • R语言速查
  • deep_learning
    • basic_concepts
      • 逻辑回归与损失函数
      • 神经网络
      • 正则化、预处理、权重初始化
      • 优化算法
      • 机器学习策略
      • 复习:从计算机视觉的角度
      • 卷积神经网络
      • 深度卷积网络示例
      • 计算机视觉任务
      • 循环神经网络
      • 自然语言处理任务
      • 注意力
      • Transformers 家族
      • 显卡扫盲
      • 强化学习概述
    • semi-supervise
      • 半监督学习简介
      • Consistency Regularization
      • Proxy-label Methods
      • Holistic Methods
      • Generative Models
      • Graph-Based SSL
      • Self-Supervision for SSL
      • Other SSL methods
  • programming
    • cpp
      • STL
      • C++基础
      • 内存管理
      • 面向对象
    • java
      • 环境和介绍
      • 注释
      • String
      • 面向对象思想
      • Object
      • 包
      • 访问权限修饰符
      • 初始化块
      • 接口
      • 内部类
      • 注解
      • 枚举
      • 集合框架
      • List
      • Map
      • 泛型
      • 迭代
      • IO与流
      • 序列化
      • 异常
      • Lambda
      • Stream流
      • Socket
      • 缓冲
      • 命名规范
      • 拆箱装箱
      • 值传递
      • 深拷贝
      • 反射
      • JVM
      • 并发编程基础
    • python
      • 并发编程
      • 环境管理
  • software_engineering
    • basic_concepts
      • 系统分析与设计概述
      • 规划
      • 需求分析与原型设计
      • 项目管理
      • 建模
      • 数据库设计
      • 架构
      • 配置管理
      • 测试管理
      • 安全
      • 编码原则
      • 微服务
      • 补充内容
    • software_testing
      • CMMI基础
      • PPQA与SQA
      • 软件测试基础
      • 黑盒测试
      • 白盒测试
      • 集成测试
      • 系统测试
      • 测开面试补充
由 GitBook 提供支持
在本页
  • 挑战
  • 事务隔离级别
  • 锁
  • 死锁
  • 并发调度
  • 粒度
在GitHub上编辑
  1. database

并发控制

[TOC]

事务并发执行可能会存取和存储不正确的数据,破坏事务的隔离 性和数据库的一致性。

挑战

并发操作的潜在不一致性:

  • 丢失修改(lost update):事务1与事务2从数据库中读入同 一数据并修改,事务2的提交结果破坏了事务1 提交的结果,导致事务1的修改被丢失。

  • 读“脏”数据(dirty read):事务1修改某一数据,并将其写回磁盘。事务2读取同 一数据后,事务1由于某种原因被撤消,这时事务1已 修改过的数据恢复原值,事务2读到的数据就与数据 库中的数据不一致,是不正确的数据,又称为“脏” 数据。

  • 不可重复读(non-repeatable read):事务1读取数据后,事务2执行更新操作并提交,使事务1无法再现前一次读取结果。包括三种如下,后两种不可重复读有时也称为幻影现象(phantom row)或者Phantom read (幻影读):

    • 事务2对其做了修改,当事务1再次读该数据时,得到与前一次不同的值。

    • 事务2删除了部分记录,当事务1再次读取数据时, 发现某些记录神秘地消失了。

    • 事务2插入了一些记录,当事务1再次读取数据时,发现多了一些记录。

事务隔离级别

The levels from low to high are:

  • Read uncommitted (未提交读):可以读其他事务未提交但已经修改的数据,存在读“脏”数据问题等问题。

  • Read committed (己提交读) :可以读其他事务已经提交的数据,存在不可重复读问题。

  • Repeatable read (可重复读):某事务读取的数据不允许被其他事务修改。存在幻影读问题。

  • Serializable (序列化):就像串行执行事务。

四个层级都不允许多个事务同时修改数据,所以丢失修改问题在这四个层级都不会出现。

锁

锁类型:

  • Shared lock (共享锁),或者读锁。

  • eXclusive lock (排它锁),或者写锁。

协议类型:

  • First level lock protocol (一级封锁协议):没有读锁,写锁在修改数据前加,事务结束后释放。存在读“脏”数据问题等问题。

  • Second level lock protocol (二级封锁协议):读锁在读数据前加,读完释放。写锁在修改数据前加,事务结束后释放。存在不可重复读问题。

  • Third level lock protocol (三级封锁协议):读锁在读数据前加,事务结束后释放。写锁在修改数据前加,事务结束后释放。

数据库管理系统通常使用two-phase locking(两段锁)protocol,即一个事务可以看成两个阶段,第一个阶段只请求锁,第二个阶段只释放锁。

一次性封锁(下一部分提到)是两段锁协议的子集。

死锁

  • Livelock(活锁):数据库课程的活锁和操作系统的活锁不太一样,这里指的是优先级低导致的饥饿问题。可以通过老化解决。

  • Deadlock (死锁)

处理死锁方法:

  • deadlock prevention (死锁预防):One-time block (一次性封锁)和Ordering block (顺序封锁)。

  • deadlock detection and deadlock recovery scheme (死锁诊断与解除):数据库的常用方法,如果等待图有环则出现死锁,选择回滚一个或多个事务来解除死锁。

并发调度

Serializability (可串行性) 是并发调度的唯一评价标准。即,两个并发的事务,如果并发结果与串行结果一样(T1T2,或者T2T1),则具有可串行性。

具体来说,对于事务i和j,如果通过等价转换能让i的所有操作移到一边,j在另一边,则说这个调度是conflict serializable schedule (冲突可串行化调度),那它一定也是有可串行性的。

等价转换的原则是,不能交换Conflict operations (冲突操作),例如:

  • 对于同一个数据x,$R_i(x)$ and $W_j ( x )$ are conflict operations

  • 对于同一个数据x,$W_i(x)$ and $W_j ( x )$ are conflict operations

  • 对于不同数据的操作不冲突。

例子:

粒度

有时加锁时不必要对整个数据库加锁,只对行加锁就足够,这种程度的区别叫做粒度(granularity)。

Multiple granularity tree (多粒度树)表示这种粒度的差别:

扩展的锁类型:

  • Intention-Shared (IS) Lock (意向共享锁)

  • Intention-Exclusive (IX) Lock (意向排他锁)

  • Shared and Intention-Exclusive (SIX) Lock (共享意向排他锁,S+IX)

这种意向指只有部分更细粒度的对象会被加显示锁(S和X)

如上图,左侧时兼容表,右侧是锁的严格等级。

几个例子:

  • IS对IS,都是读,没事。

  • IS对IX,读的部分和写的部分可能不重叠,没事。

  • IX对IX,写的部分可能不重叠,没事。

  • SIX对SIX,两者都要读所有部分,即使部分修改也一定会冲突,不兼容。

在加锁时:

  • Ti must lock the root of the tree first in any mode

  • Ti can lock a node in S or IS mode only if Ti currently has the parent of Q locked in IS mode.

  • Ti can lock a node Q in X, SIX, or IX mode only if Ti currently has the parent of Q locked in either IX or SIX mode.

在释放锁时:

  • Ti can lock a node only if Ti has not previously unlocked any node (that is, two phase locking).

  • Ti can unlock a node Q only if Ti currently has none of the children of Q locked (that is , bottom-up order).

上一页数据库恢复技术下一页dev_tools

最后更新于9个月前