[PAI严选]第二弹:mysql篇

“超大分页通常发生在数据量极大的情况下，如果直接使用 LIMIT 1000000, 10 并且带排序，MySQL 会查出前一百万零十条数据，然后丢弃前面的，效率极低。

我们的解决方案是：子查询 + 覆盖索引（延迟关联）。

首先，通过覆盖索引快速查出目标分页的 ID 列表（因为只查 ID，不查整行，所以不用回表，速度极快）；然后再用这些 ID 作为条件，通过子查询或 JOIN 回表去查出真正需要的数据行。这样极大地减少了回表的次数，提升了查询效率。”

[满分回答]：

“我们在建索引时主要遵循以下几个原则：

[满分回答]：

“常见的踩坑场景有这四个：

[满分回答]：

“我们的调优口诀分五步：

[满分回答]：

“事务的特性是 ACID，以 A 向 B 转账 500 元为例：

[满分回答]：

“可以把隔离级别看作是数据库配的‘滤网’：

RU (读未提交)：没滤网。别人正在写、还没提交的半成品数据你能看见。他一回滚，你就遇到脏读。
RC (读已提交)：动态滤网。别人没提交你看不见，解决了脏读。但因为滤网是每次查询动态生成的，别人中途提交了，你下一秒查数据就变了，这叫不可重复读。
RR (可重复读 - MySQL 默认)：静态滤网。开启事务瞬间世界静止，别人怎么改你看到的都是初见的样子，解决了不可重复读。并且 InnoDB 极其强悍，用间隙锁（Gap Lock）锁住了查询范围的空位，把别人偷偷插数据的幻读问题也一并解决了大半。
Serializable (串行化)：退化成悲观锁单行道。读写互相排队，解决一切并发异常，但也把系统性能干瘫痪了。”

[满分回答]：

“它们是保证 ACID 的底层核心，区别在于：

redo log（重做日志）：记录的是数据页的物理变化。它是为了应对服务突然宕机后的数据恢复，保证了事务的 持久性 (D)。
undo log（回滚日志）：记录的是逻辑日志（比如你 Insert，它就记 Delete）。它是为了事务失败时能回滚恢复原始数据，以及支持 MVCC 多版本控制，保证了事务的 原子性 (A) 和 一致性 (C)。”

[满分回答]：

“主从同步核心靠的是二进制日志（Binlog），分为三步接力：

[满分回答]：

“随着我们业务的演进，垂直和水平拆分我们都用到了。

垂直拆分：配合微服务，我们把业务解耦，比如把订单库和用户库物理分离开来。
水平拆分（解决痛点）：后来『订单库』单表突破了一千万，成为严重瓶颈。我们在 SkyRoute 短链项目中引入了 ShardingSphere 做了单库内的水平分表。
路由策略：我们将短链表按 short_code、日志表按 tenant_id（租户）进行 Hash 取模，路由到了 4 张物理表中。
最终效果：对业务代码完全无感知。C 端短链跳转查询能通过 short_code 精确击中单表，速度极快；如果是后台那种没带分片键的报表查询，ShardingSphere 会自动广播到 4 张表查询后再在内存里合并结果。彻底解决了海量数据下的单表读写性能瓶颈。”