Go语言星球

September 24, 2025

qcrao 的博客

把DDIA读厚（八）：数据库复制的“冰与火之歌”

导语：你是否遇到过这样的场景：明明在后台看到了“操作成功”的提示，刷新后数据却“穿越”回了修改前的状态？这并非灵异事件，而是分布式系统中一个经典而残酷的现实。本文将带你深入《设计数据密集型应用》的核心章节，从一个诡异的“数据丢失”谜题开始，揭开数据库复制的两种核心模式——物理复制与逻辑复制的神秘面纱，并最终探索它们如何驱动了现代实时数据架构的脉搏。

序幕——一个“幽灵”数据引发的血案

想象一下，你正在为一个电商系统负责。在一次大促活动前，运营同事紧急修改一件爆款商品的价格，从￥ 100 降为￥ 80。他在后台点击“保存”，系统弹出“修改成功！”的绿色提示。他长舒一口气。

几分钟后，主数据库服务器因为机房电源抖动而宕机。幸运的是，你们的架构有高可用设计，系统在半分钟内自动将一个从库提升为新的主库，服务恢复。但这时，用户和运营同时发现，那件商品的价格依然是￥ 100。那个“成功”的修改，如同幽灵一般，消失得无影无踪。

“我明明存上了！数据库的持久性（Durability）承诺呢？” 运营同事的质问，直击了问题的核心。

要解开这个谜题，我们必须潜入数据库的“复制”世界。复制，即在不同的机器上保存相同数据的副本，其目的无外乎三点：

高可用性：一台挂了，另一台顶上。
读扩展性：更多副本分担读请求。
降低延迟：在用户附近部署副本。

而“幽灵数据”问题的根源，在于主从节点间同步数据的方式——尤其是异步复制（Asynchronous Replication）。

在一个异步复制系统中，主节点处理完写操作后，会立刻向客户端返回“成功”，然后才“抽空”将变更发送给从节点。主从之间存在一个微小的时间窗口，我们称之为复制延迟（Replication Lag）。我们的“血案”，正是在这个延迟窗口内，主节点倒下了。新上任的主节点（原从库）根本没来得及收到那次改价操作，导致了数据的“丢失”。

这是为了高性能和高可用性，必须付出的代价。那么，数据库是如何在内部传递这些变更信息的呢？这里，就引出了两条截然不同的技术路线，宛如冰与火之歌，各有千秋——物理复制与逻辑复制。

物理复制的“凛冬”——PostgreSQL 的 WAL 之道

物理复制，顾名思义，它复制的是数据变更的物理痕跡。它不关心变更的业务含义，只关心“在哪个文件的哪个位置，哪些字节发生了改变”。

这方面最经典的代表，就是 PostgreSQL 的预写日志（Write-Ahead Log, WAL）流复制。

什么是 WAL？

首先，WAL 是单机数据库为了保证崩溃安全而设计的。任何对数据文件的修改，都必须先以日志的形式、顺序地写入到 WAL 文件中。如果数据库在修改数据页的半途中崩溃，重启后可以通过回放 WAL 来恢复到一致的状态。

如何用于复制？

PostgreSQL 的工程师们想出了一个绝妙的主意：既然主库为了自身安全必须生成 WAL，何不将这份“操作录像带”直接流式地发送给从库呢？从库接收到后，像快进一样回放这份录像带，在自己数据文件的相同位置上，执行完全相同的字节修改。

主库：先写 WAL，再改内存 buffer。
从库：先接收 WAL，再改内存 buffer（相当于 replay）。
所以从库的数据页始终是 由 WAL 驱动的只读重放。

物理复制的“冰”之特性

这种方式如同寒冰一般，极致、高效、但也非常“僵硬”。

优点：性能极致。这是几乎没有额外开销的复制方式。主库生成 WAL 是刚需，从库应用 WAL 就像是 memcpy，速度极快。
缺点：紧密耦合。这是它的致命弱点。
- 版本锁定：如果主从库的 PostgreSQL 大版本不同，其内部的数据页存储结构可能存在差异。一份来自 v15 的 WAL “录像带”，在 v14 的从库上“回放”，很可能导致数据文件彻底损坏。
- 架构锁定：无法跨异构数据库或不同硬件架构进行复制。
- 灵活性差：你无法只复制一个库或一张表，因为 WAL 记录的是整个实例的物理变化。

物理复制就像一位严谨的复印员，能完美克隆，但对复印稿的格式要求极为苛刻。

逻辑复制的“烈火”——MySQL Binlog 的涅槃

逻辑复制则走上了一条完全不同的道路。它复制的是变更的逻辑含义，它关心的是“发生了什么业务操作”。

这方面的王者，当属 MySQL 的二进制日志（Binary Log, Binlog）。

什么是 Binlog？

Binlog 记录的是所有修改了数据库数据的“事件（Events）”。它与具体的存储引擎（如 InnoDB）解耦，位于 MySQL Server 层。最关键的是，它的记录格式是逻辑的。

以目前主流的 ROW 格式为例，当一个修改发生时，Binlog 记录的不是字节变化，而是：

“对于 products 表，主键为 123 的那一行，它的 price 字段的值从 100 变成了 80。”

逻辑复制的“火”之特性

这种方式如火焰一般，灵活、强大，能够适应各种形态。

优点：灵活性与解耦。
- 版本兼容：只要数据类型兼容，主从库的 MySQL 版本可以不同。
- 异构复制：你可以将 Binlog 解析后，写入到任何其他系统，如 PostgreSQL、Elasticsearch 或数据仓库。
- 选择性复制：可以轻松配置只复制某个库、某几张表，甚至可以过滤某些类型的操作。
缺点：性能开销略高。相比于直接传输字节，生成和解析逻辑日志会带来一些额外的计算开销，但对于大多数场景而言，这种开销是完全可以接受的。

逻辑复制就像一位口齿清晰的信使，他不在乎消息是用什么纸笔写的，只负责清晰地传达消息的内容本身。

现代数据架构的脉搏——“伪装”的艺术

逻辑复制的解耦特性，催生了一项革命性的技术范式：CDC（Change Data Capture，变更数据捕获）。

像 Debezium、Canal 这样的 CDC 工具，正是利用了逻辑复制的开放性。它们的工作原理，就是**“伪装”成一个 MySQL 的从库**。

这是如何做到的？答案在于遵循标准的复制协议。

认证：CDC 工具使用一个被授予 REPLICATION SLAVE 权限的 MySQL 账号连接到主库。
“接头暗号”：连接成功后，它不发送 SELECT 查询，而是发送一个特殊的 COM_BINLOG_DUMP 命令，并告诉主库它想从哪个 Binlog 文件的哪个位置开始“收听”。
收听与转播：MySQL 主库收到这个“暗号”后，便开始将 Binlog 事件源源不断地以二进制流的形式发送给 CDC 工具。
翻译与发布：CDC 工具接收到二进制流后，将其解析成结构化的逻辑变更事件（通常是 JSON），然后发布到消息队列（如 Kafka）中。

通过这种“伪装”的艺术，CDC 工具将传统的关系型数据库从一个被动的数据存储中心，转变为了一个主动的、实时的事件源。整个公司的下游应用，都可以订阅这份“数据日报”，实时响应业务的变化。

总结与思考：选择“冰”还是“火”？

回到我们最初的问题，无论是物理复制还是逻辑复制，在异步模式下都无法从根本上消除数据丢失的风险，但这促使我们更深刻地理解了系统设计中的权衡。

物理复制（冰）：追求极致的性能和数据的一致性（副本与主库字节级一致），适用于构建同构数据库的高可用集群。它简单、粗暴、高效，但缺乏弹性。
逻辑复制（火）：追求极致的灵活性和生态的开放性，是现代异构数据同步和实时数据管道的基石。它优雅、强大、富有创造力。

作为后端工程师，理解这两种复制模式的内核差异至关重要。它不仅能帮助你排查类似“幽灵数据”的诡异问题，更能让你在进行技术选型和架构设计时，拥有更广阔的视野。

在今天，数据库早已不只是业务的终点，更是实时数据的起点。而开启这一切的钥匙，就藏在这冰与火的复制之歌中。

September 24, 2025 12:00 AM

September 23, 2025

qcrao 的博客

把DDIA读厚（七）：从SSTable到LSM树，再到MySQL的B+树之辩

在深入数据系统的世界时，我们常常惊叹于上层架构的宏伟，但支撑这一切的，往往是那些看似朴素却充满智慧的底层设计。在 DDIA 第三章中，SSTable 与 LSM 树无疑就是这样的基石。

这趟探索之旅，始于一个简单构件——SSTable，它像一块块乐高积木，虽好用但略显呆板。随后，我们将看到 LSM 树这套“动态系统”是如何赋予这些积木生命，搭建出能抵御写入洪流的坚固堡垒。最后，我们将站在更高的视角，探讨一个经典问题：既然 LSM 树如此强大，为何像 MySQL 这样的关系型数据库巨头，却选择坚守 B+ 树的阵地？

这不仅是对一个数据结构的剖析，更是一场关于设计哲学与工程权衡的深度思辨。

第一幕：SSTable——一块有序且不可变的坚实地基

SSTable（Sorted String Table）是 LSM 树在磁盘上的基本组成单位。它的设计法则纯粹而简单，牢记两点即可：

内部有序：文件内的键值对，严格按照键（Key）排序。
不可变（Immutable）：一旦写入，永不修改。

一个 SSTable 文件并非一块铁板，而是由多个部分精密组成的，好比一本字典：

数据块 (Data Block)：字典的“书页”，存储着一小段连续的、有序的键值对。一个 SST 文件中通常会有成百上千个 Data Block（取决于文件大小和 block size 配置，例如 4MB 数据 flush 下来，block size=16KB，大约会有 256 个 Data Block）。
索引块 (Index Block)：字典的“页眉导引词”，记录每个 Data Block 的边界键及其位置，便于快速定位。
元索引块 (Metaindex Block)：记录 Bloom Filter、属性信息等元数据块的位置。
文件尾 (Footer)：固定在文件末尾，记录索引块和元索引块的位置，并带有魔数，是读取 SSTable 的入口。

这种结构带来了显而易见的好处：

读取高效：在常见缓存命中的场景下，查找通常只需一次磁盘 I/O（目标 Data Block），范围查询更是高效的磁盘顺序读。
合并顺序化：多个 SSTable 的合并过程逻辑上类似归并排序，以顺序读写为主，相对高效。但同时，也会带来写放大的问题。

然而，“不可变”的特性，也带来了致命的弱点：无法高效地处理单次写入。为一个新键值对而重写整个几 GB 的文件，无异于天方夜谭。SSTable 是优秀的“只读”构件，但它需要一套动态系统来盘活它。

第二幕：LSM 树的诞生——化零为整的写入艺术

LSM 树（Log-Structured Merge-Tree）就是那套盘活 SSTable 的系统。它没有改变 SSTable，而是设计了一套全新的工作流，其核心思想是：将所有随机、零散的写入，在内存中“攒”成有序的大块，再“铸造”成新的 SSTable。

这个过程由两大核心组件驱动：

MemTable (内存表)：一个内存中的有序数据结构（如跳表）。所有写请求（增、删、改）都先在这里完成，速度如电光石火。
刷盘 (Flush)：当 MemTable 达到预设大小（例如 4MB），它会被冻结为 Immutable MemTable。随后后台线程会将它的内容整体写入磁盘，生成一个新的 SST 文件。

关键点：一次 flush = 一个新的 SST 文件。但这个文件内部会根据配置的 block size（如 16KB）被切分成多个 Data Block（例如 4MB ÷ 16KB ≈ 256 个 Data Block），并在文件末尾生成索引块、元索引块和 Footer。

这个过程周而复始。随着系统运行，磁盘上会不断出现新的 SST 文件：0001.sst, 0002.sst, 0003.sst…

第三幕：与“熵增”的对抗——在混沌中维持秩序

多个 SST 文件的存在，引出了 LSM 树设计中最核心的一个事实，也是初学者最容易困惑的地方：新生成的 SST 文件之间，键范围是会重叠的，它们并非全局有序！

0001.sst 可能存储了键 apple 和 zebra，而 0002.sst 可能存储了键 banana。这种“混沌”状态，是为换取极致写入性能的必然结果，但也给系统带来了新的挑战：

读放大：在 Level-0，由于文件范围可能重叠，查找一个键需要从最新文件开始逐个回溯。而在更高层（L1+），文件范围不重叠，可以二分定位到唯一文件，大幅优化读取效率。
空间放大：被更新或删除的旧数据，依然躺在旧 SST 文件中，浪费着磁盘空间。

为了对抗这种无序带来的“熵增”，LSM 树必须依赖它的第三个核心组件：后台合并 (Compaction)：这是一个持续运行的“内务整理”线程。它不知疲倦地：

选择磁盘上若干个 SST 文件；
将它们读入内存，进行归并，丢弃所有过时和已删除的数据；
将合并后的、更紧凑、更干净的结果，写入一个新的、更大的 SST 文件；
最后，安全地删除那些被合并的旧文件。

在更精巧的实现（如 RocksDB）中，Compaction 还引入了**分层（Levels）**策略。新刷盘的文件都位于允许键范围重叠的 Level-0，而 Compaction 会将它们不断合并、推向更高层级（Level-1, Level-2…）。在这些高层级中，SST 文件之间保证键范围互不重叠，从而极大地优化了读取效率。

至此，LSM 树的全貌浮出水面：它是一个由 MemTable、磁盘上动态增删的 SST 文件集合、以及后台 Compaction 三者协同工作的精密系统。它牺牲了数据的“规整性”，换来了写入的“流畅性”，再通过后台任务，孜孜不倦地将系统从混沌中拉回秩序。

终幕：B+树之辩——为什么 MySQL 不选择 LSM 树？

理解了 LSM 树的内在权衡，我们便能回答那个经典问题：为何 MySQL（InnoDB）坚守着 B+ 树的阵地？

答案是：它们的“天命”不同。

MySQL/InnoDB 的使命，是服务在线事务处理（OLTP）。它的战场是电商、金融、社交应用。这些场景最需要的是：

稳定且极低的读取延迟：B+ 树紧凑的页结构，保证了通过主键查找，通常只需 3–4 次磁盘 I/O，延迟稳定可控。LSM 树的读取路径则更长，延迟抖动也更大。
高效的更新模型：B+ 树支持页级原位修改，通常能在少量页操作中完成更新。虽然可能发生页分裂，但整体延迟比 LSM 的“追加新版本”模式更可控。
成熟的事务与锁：B+ 树的行、页结构，是实现行级锁、间隙锁等复杂并发控制的天然土壤。

LSM 树的使命，是服务写入密集型负载。它的战场在日志、监控、物联网等数据摄取场景。它优先保证的是极致的写入吞吐量。

因此，这不是一场谁更先进的较量，而是一场场景适配性的选择。MySQL 为了最广泛的 OLTP 用户，选择了 B+ 树这件“通用性最强、读取最稳的甲胄”。

当然，世界在融合。Facebook 为 MySQL 开发的 MyRocks 存储引擎，就是将 LSM 树的心脏植入了 MySQL 的身体，以应对其自身独特的、写入超密集且空间敏感的业务。这恰恰证明，没有万能的架构，只有最合适的选择。

结语

从 SSTable 的静态之美，到 LSM 树的动态之衡，再到与 B+ 树的哲学之辩，我们完成了一次深入数据引擎核心的旅行。我们看到，任何一个优秀的设计，都不是在追求某个单一指标的极致，而是在一系列相互冲突的目标之间，寻找一个优雅的平衡点。理解这些权衡，并内化为自己的设计直觉，正是我们“把 DDIA 读厚”的意义所在。

September 23, 2025 12:00 AM

September 09, 2025

qcrao 的博客

把DDIA读厚（六）：一次“写入”的奇幻漂流——从应用到磁盘

这是《把 DDIA 读厚》系列的第六篇文章。在 DDIA 的精读之旅中，我们已经聊过了可靠性、可扩展性等宏大主题。今天，我想和你一起，做一次微观探险。我们将聚焦于一个最基础、最频繁的动作——“写入”，跟踪一次小小的写入请求，从它在应用程序中诞生，到最终在磁盘上安家，看看这段旅程中都发生了哪些惊心动魄、充满权衡的故事。

这一切，都始于 DDIA 第三章中的一句话：

“对于极其简单的场景，日志追加式的写入拥有非常好的性能。”

这句话很符合直觉。我们深挖下去，发现无论是对于 HDD 还是 SSD，顺序追加都能完美地顺应硬件的“天性”，获得极佳的性能。不仅如此，我们还了解到，操作系统（OS）的**页缓存（Page Cache）**机制，更是将这个优势发挥到了极致——它将我们应用层无数次微小的写入，在内存中“攒”成大块，再如行云流水般一次性顺序刷入磁盘。

一切看起来如此完美。

但一个致命的疑问也随之浮现：如果 OS 还没来得及把缓存中的数据刷盘，就发生了断电，数据不就丢了吗？

对于任何严肃的业务系统，这都是不可接受的。为了堵上这个漏洞，我们找到了操作系统提供的“保险开关”——fsync系统调用。它能强制命令 OS 将缓存数据刷入磁盘，确保数据“落盘为安”。

然而，当我们尝试为每一次写入都系上fsync这条“安全带”时，一个诡异的现象出现了：我们引以为傲的性能优势不仅消失殆尽，整个写入模式甚至会退化。这正是本次探索的核心谜题：

为什么在一个繁忙的系统里，为一个逻辑上“顺序追加”的文件频繁调用fsync，最终会导致物理上“随机 I/O”的性能表现？

这个看似矛盾的现象背后，隐藏着一场应用、操作系统与硬件之间，关于性能与持久性的复杂博弈。别急，泡杯咖啡，让我们顺着这个疑问，一探究竟。

第一站：理想乡——顺序写入的物理学优势

想象一下最纯粹的写入模型，就像 DDIA 开篇的db_set脚本一样，它只是简单地将数据追加（append）到一个文件末尾。这在物理上意味着什么？

对于机械硬盘（HDD）：磁头无需耗费毫秒级的“寻道时间”在盘片上空到处乱飞，只需移动到文件末尾，然后就可以像老式唱片机一样，在盘片旋转时连续不断地刻录数据。
对于固态硬盘（SSD）：它避免了 SSD 最头疼的“先擦除再写入”的放大效应。对于一个已有的数据块，原地修改意味着“读取整个块 -> 内存中修改 -> 擦除整个块 -> 写回整个块”的酷刑。而顺序追加，则是轻松地在干净的闪存页上连续写入，轻快而优雅。

无论在哪种介质上，顺序 I/O 都牢牢抓住了硬件的“天性”，是写入操作的“理想态”。

第二站：缓冲区——操作系统的好心与谎言

既然顺序写入这么快，那问题出在哪？答案在我们和硬件之间隔着的第一个“中间商”——操作系统。

当我们调用write()时，应用程序很快就拿到了“写入成功”的回执。但这是一个“善意的谎言”。数据并未抵达磁盘，而是进入了操作系统内核的页缓存（Page Cache）。

这是 OS 的一片苦心：

性能：把成百上千次微小的写入请求，在内存里“攒”成一大块，然后一次性交给磁盘，将零散的写入合并成大块的顺序 I/O，效率倍增。
响应：让应用程序不必等待缓慢的磁盘，立刻就能返回，继续处理其他任务。

这个缓冲机制也顺带解答了一个底层细节问题：我们逻辑上是连续写入，物理上如何保证磁盘在写完扇区 N 后，紧接着就去写 N+1 呢？答案就在于，文件系统在为这“一大块”攒好的数据申请磁盘空间时，会倾向于分配一片连续的物理块（Extent），从而将逻辑上的顺序追加，转化为了物理上的顺序写入。

然而，这个“中间商”在带来效率的同时，也带来了第一个致命风险：断电会丢数据！ 内存是易失的，任何在页缓存里还没来得及去磁盘“安家落户”的数据，都会在断电瞬间烟消云散。

第三站：`fsync`的审判——追求真理的代价

为了对抗这种风险，操作系统给了我们一个“杀手锏”——fsync()系统调用。它像一张神圣的审判令，强制命令 OS：“放下一切缓冲和优化，把我要求的数据，立刻、马上、同步地刷到磁盘上去！直到确认它安全了再回来见我。”

有了fsync，我们似乎拥有了“数据金身”。但回到我们最初的问题，如果我们为每一次微小的写入都调用fsync，为何反而会陷入“同步随机 I/O”的泥潭？

想象一下你的服务器后台，它是一个繁忙的十字路口：

你的应用刚为database文件完成了一次fsync，磁头停在了它的末尾。
就在下几毫秒，操作系统的日志服务syslog抢到了 CPU，要求在/var/log/messages里写一条日志。为此，磁盘磁头不得不长途跋涉，飞到盘片的另一个位置。
紧接着，你的应用又来了一次写入请求，再次调用fsync。此时，磁头必须从syslog文件的位置，再千里迢迢地飞回来。

看到了吗？在多任务环境下，磁盘磁头的所有权在不同进程间被疯狂抢夺。我们逻辑上对单一文件的顺序追加，在物理层面被“插队”的其他进程打碎，磁头的移动轨迹和随机写入毫无二致。每一次fsync都几乎要支付一次完整的“寻道+旋转”的重税。

我们为了追求极致的“真”（数据持久性），却付出了极致的“慢”作为代价。

第四站：架构师的智慧——“成组提交"的救赎

那么，真正的数据库系统是如何走出这个两难困境的呢？它们引入了一种更高级的博弈策略——预写日志（WAL）与成组提交（Group Commit）。

这个策略的精髓在于：用吞吐量换延迟，用批处理摊销成本。

当 100 个事务在同一时刻请求提交时，一个繁忙的数据库并不会傻傻地调用 100 次fsync。它会：

组队：对第一个请求说“稍等”，然后开启一个极短的计时窗口。
缓冲：将这 100 个事务的日志记录，在内存的 WAL 缓冲区里拼接成一个大大的数据块。
冲刺：对这个包含了 100 个事务的大数据块，执行一次write()和一次fsync()。
解放：一旦这次fsync成功返回，数据库会同时唤醒那 100 个等待的线程，告诉它们：“你们都成功了！”

这个过程就像坐公交车，虽然第一个到站的乘客需要等其他人上车，牺牲了一点即时性（Latency），但整辆公交车一次运送了大量乘客，极大地提升了系统的总运力（Throughput）。

通过“成组提交”，数据库把对fsync的调用，从“为每一次写入”变成了“为每一批写入”。昂贵的fsync成本被几十上百个事务分摊，而写入 WAL 这个动作本身，又保持了纯粹的顺序 I/O 特性。这是一个近乎完美的工程壮举。

终点站，也是新的起点：不确定性的世界

我们的探险似乎已接近尾声，但最极限的挑战才刚刚开始。一个直击灵魂的问题是：

“如果在fsync成功后，数据库还没来得及通知客户端，就崩溃了，会发生什么？”

这是一个制造了“不确定性”的幽灵时刻：

数据库（重启后）：知道事务已成功，数据永不丢失。
客户端：只知道连接断了，完全不知道事务的最终状态。

如果客户端冒失地重试，可能会导致用户被重复扣款。此时，我们发现，问题的边界已经超出了数据库自身。数据库保证了它的D（Durability），但无法解决网络通信的D（Delivery uncertainty）。

解决这个问题的责任，历史性地交到了我们应用架构师手中。业界的标准答案是：设计幂等（Idempotent）接口。

通过在请求中加入唯一的事务 ID，让服务器有能力识别出：“哦，这个请求我处理过了，虽然上次没来得及告诉你，但现在可以直接给你成功回执，不会重复执行。”

旅程总结

一次写入的奇幻漂流，带我们穿越了硬件物理、操作系统内核、数据库引擎和应用架构四个截然不同的层面。我们看到：

为了性能，我们拥抱顺序写入和 OS 缓冲。
为了持久性，我们引入fsync进行约束。
为了在持久性下重获吞吐量，我们发明了 WAL 和成组提交。
为了应对系统间的不确定性，我们必须在应用层设计幂等性。

这趟旅程的每一站，都充满了精妙的权衡。没有绝对的“好”与“坏”，只有面向特定场景的“取”与“舍”。而理解这些权衡，并能在自己的设计中运用自如，或许就是“把 DDIA 读厚”的真正意义。

希望这次的探险，能让你在未来每一次写下db.save()时，都能会心一笑，洞察其背后那波澜壮阔的世界。

September 09, 2025 12:00 AM

August 30, 2025

李文周的博客

Go CLI 开发利器：Cobra 简明教程

在 Go 语言的生态中，有许多优秀的库可以帮助我们极大地提升开发效率。今天，我们要聊的是一个在构建命令行（CLI）应用时几乎绕不开的王者级项目——Cobra。

August 30, 2025 08:37 AM

July 15, 2025

李文周的博客

Go实战指南：使用 go-redis 执行 Lua 脚本

Redis 是开发中常用的高性能缓存数据库。除了常规的 GET/SET 操作，Redis 还支持通过 Lua 脚本实现复杂的原子操作。本文将带你循序渐进地学习如何在 Go 语言中，利用 go-redis 执行 Lua 脚本，并进一步讲解脚本缓存（script load）与 Go 的 embed 特性的结合使用。

July 15, 2025 02:41 PM

June 30, 2025

李文周的博客

基于泛型的轻量级依赖注入工具 do

在 Go 语言的开发实践中，我们经常需要处理各种依赖关系，例如，一个 service 层可能依赖一个或多个 repository 层。如何优雅地管理这些依赖，是我们在项目开发中需要重点关注的问题。一个好的依赖管理方案，可以显著提高代码的可读性、可维护性和可测试性。

June 30, 2025 01:50 PM

June 22, 2025

qcrao 的博客

把DDIA读厚（五）：图数据库实战——手把手带你挖出一个“欺诈团伙”

这是《把 DDIA 读厚》系列的第五篇文章。在上一篇，我们深入探讨了关系模型与文档模型的世纪之争，核心在于它们如何处理数据的“关系”。今天，我们要把“关系”这个词推向极致，聊一聊为“关系”而生的数据模型——图。

引子：当 JOIN 遇见了"六度空间"

你跟产品经理说：“这个‘猜你喜欢’的功能，要查用户好友的好友，还得看共同兴趣，SQL 写起来太复杂，跑起来也慢，不好做。”

产品经理两手一摊：“Facebook 不就能做吗？”

这个场景很真实。当我们的业务需求，不再是简单的“查 A 查 B”，而是变成了“探索 A 和 B 之间千丝万缕的、不确定的、多层次的联系”时，我们熟悉的 JOIN 就开始力不从心了。这时，我们需要一件专门为此而生的神兵利器。

本篇锚点：为"关系"而生的数据模型

我们今天的“锚点”，是 DDIA 第二章关于图模型的核心观点：

图数据模型专为“多对多”关系是常态、数据连接的深度和复杂性是核心挑战的场景而设计。

它的世界里，万物皆为顶点（Nodes），万物之间的联系皆为边（Relationships）。我们的任务，就是在这个由点和线构成的宇宙里，探索那些隐藏的路径和模式。

发散深潜：手把手挖出一个"欺诈团伙"

理论总是枯燥的，我们直接开干。下面，我将手把手带你用当今最流行的图数据库 Neo4j，来完成一次真实的反欺诈“案件侦破”。

第一步：环境准备

请您前往 Neo4j 的官方网站下载并安装 Neo4j Desktop。它对个人开发者完全免费，且安装过程非常简单。

安装后，请按以下步骤操作：

打开 Neo4j Desktop，新建一个项目（Project）。
在这个项目里，点击 “Add Database” -> “Create a Local Database”。
给你的数据库起个名字（比如 fraud-detection），设置一个密码（比如 password），然后点击 “Create”。
数据库创建好后，点击旁边的 “Start” 按钮启动它。
启动成功后，点击 “Open”，这会自动在浏览器中打开 Neo4j Browser 操作台。

至此，您的图数据库环境就已经准备就绪了！

第二步：数据建模与导入

在我们的反欺诈场景中，用户、设备、IP地址 都是顶点。它们之间的 使用、来自 等都是关系。现在，请在 Neo4j Browser 的输入框中，一次性地复制并执行以下所有代码。

Cypher

// 使用 MERGE 命令，它能确保节点和关系只被创建一次，重复执行也不会出错
// --- 创建顶点 ---
MERGE (:User {id: 'user-A', name: '张三'});
MERGE (:User {id: 'user-B', name: '李四'});
MERGE (:User {id: 'user-C', name: '王五'});
MERGE (:User {id: 'user-D', name: '赵六'});
MERGE (:User {id: 'user-E', name: '无辜的路人甲'});
MERGE (:Device {id: 'device-123'});
MERGE (:Device {id: 'device-456'});
MERGE (:Device {id: 'device-789'});
MERGE (:IP {id: '192.168.1.10'});
MERGE (:IP {id: '192.168.1.11'});

// --- 创建关系边 ---
// 找到需要连接的节点，然后创建它们之间的关系
MATCH (u1:User {id: 'user-A'}), (d1:Device {id: 'device-123'}) MERGE (u1)-[:USED_DEVICE]->(d1);
MATCH (u2:User {id: 'user-B'}), (d1:Device {id: 'device-123'}) MERGE (u2)-[:USED_DEVICE]->(d1);
MATCH (u1:User {id: 'user-A'}), (ip1:IP {id: '192.168.1.10'}) MERGE (u1)-[:FROM_IP]->(ip1);
MATCH (u3:User {id: 'user-C'}), (ip1:IP {id: '192.168.1.10'}) MERGE (u3)-[:FROM_IP]->(ip1);
MATCH (u3:User {id: 'user-C'}), (d2:Device {id: 'device-456'}) MERGE (u3)-[:USED_DEVICE]->(d2);
MATCH (u4:User {id: 'user-D'}), (d2:Device {id: 'device-456'}) MERGE (u4)-[:USED_DEVICE]->(d2);
MATCH (u5:User {id: 'user-E'}), (d3:Device {id: 'device-789'}) MERGE (u5)-[:USED_DEVICE]->(d3);
MATCH (u5:User {id: 'user-E'}), (ip2:IP {id: '192.168.1.11'}) MERGE (u5)-[:FROM_IP]->(ip2);

第三步：案件侦破 - 探索关系网络

数据已就绪，我们的侦查正式开始。

一度关联查询：“找到和张三用同一台设备的人”

Cypher
```
MATCH (u1:User {name: '张三'})-[:USED_DEVICE]->(d:Device)<-[:USED_DEVICE]-(u2:User)
WHERE u1 <> u2
RETURN u1.name, u2.name
```
解析：这个查询在寻找一个 V 字形的模式：从“张三”出发，沿着 USED_DEVICE 关系找到一台设备，再从这台设备出发，沿着反向的 USED_DEVICE 关系找到另一个用户。WHERE u1 <> u2 是为了排除他自己。结果会清晰地告诉你，是“李四”。
终极武器：不定深度查询 - “挖出整个团伙！”

现在，我们不知道团伙有多深，只知道他们之间可能通过各种方式关联。我们想看看，从“张三”出发，走 4 步之内能牵扯出多少人。

Cypher
```
MATCH p = (u1:User {name:'张三'})-[*1..4]-(u2:User)
WHERE u1 <> u2
RETURN p
```
解析：这句查询是图数据库的精髓！
- -[*1..4]-：星号*代表任意类型、任意方向的关系，1..4代表探索的深度在 1 到 4 步之间。
- p = ... 和 RETURN p：意思是将整个匹配到的**路径（Path）**返回。
见证奇迹的时刻：执行后，请立刻点击结果框左侧的 “Graph” 视图。

你将看到一幅清晰的图谱，它直观地勾勒出了整个欺诈网络：张三 通过共享设备关联到 李四，通过共享 IP 关联到 王五，而 王五 又通过另一个共享设备关联到 赵六。整个团伙的脉络一目了然！而“无辜的路人甲”则孤零零地，与这个网络毫无瓜葛。
原理解析：为什么这么快？

这背后的核心技术，就是我们之前提到的**“免索引邻接 (Index-Free Adjacency)”**。

MySQL 做多层关联查询，就像一个人在北京西站，想去国贸，但他不知道怎么走。他只能先查站内地图（索引）找到去军事博物馆的路线，到了军事博物馆再查地图去天安门，到了天安门再查地图……每一步换乘都是一次昂贵的查找。

而图数据库，就像你上地铁前就拿到了一张完整的线路图。从“张三”这个点出发，它只是顺着已经画好的线路（物理指针），一步步地“走”下去，直到找到所有目的地。这个过程是高效的遍历，而不是低效的重复查找。

收束：我们能学到什么？

给 Go 开发者的代码级清单

了解 Go 生态：Go 社区有成熟的 Neo4j 官方驱动 neo4j-go-driver。你可以像使用 database/sql 一样，在你的 Go 代码里方便地执行 Cypher 查询，并处理返回的复杂结果。
切换思维模式：下次遇到涉及“路径发现”（如规划物流路线）、“关系推荐”（如猜你喜欢）、“网络分析”（如社交网络或金融风控）等问题时，可以自问一句：“这本质上是不是一个图的问题？”
组合使用，而非替代：图数据库不一定要替代你现有的 MySQL。你可以将高度关联的数据（如用户关系、风控特征）放入图数据库，然后通过应用层将它与你存储在 MySQL 中的核心业务数据结合起来，各司其职。

给准架构师的架构级教训

扩充你的“兵器谱”：一个优秀的架构师，必须知道对于特定类别的问题，图数据库是完成任务的正确工具，而不是一个“锦上添花”的玩具。用错误的工具（如尝试在 MySQL 里做实时的多层图遍历）必然会导致项目失败。
理解“写时预处理”的成本：图模型的威力，源于它在写入时就将“关系”预处理并存储为物理指针。架构师必须理解这个写路径的成本，并判断它对于应用的读路径性能增益是否是值得的。
它能创造新的业务可能性：图数据库不仅仅是更快地解决老问题。它强大的关系发现能力，可以催生出用其他模型难以实现的全新产品功能。架构师应该思考，这种能力能为业务创造出什么样的新价值。

June 22, 2025 12:00 AM

June 21, 2025

qcrao 的博客

把DDIA读厚（四）：关系模型 vs 文档模型，世纪之争与你的抉择

这是《把 DDIA 读厚》系列的第四篇文章。今天，咱们不聊那些高大上的分布式共识，而是回到一切开始之前，聊一个每个后端工程师都必须面对的、最朴素也最重要的问题：你的数据，到底应该怎么存？

引子：建表，还是塞个 JSON？

老哥们，拿到一个新需求，是不是脑子里第一反应就是“这数据存哪个库，表怎么建”？紧接着，灵魂拷问就来了：

是一板一眼地遵循三范式，把数据拆分到好几张关联的表里，然后靠 JOIN 过活？
还是图个痛快，直接在表里弄个 TEXT 或 JSON 字段，把整个对象序列化之后“一把梭”塞进去？

这个问题，表面上是“规范”与“便捷”之争，实际上，背后是两种数据模型哲学的激烈碰撞。这个选择，将在你写下第一行代码之前，就深远地影响你整个系统的架构、性能和未来的可维护性。

回顾与衔接：那些年，我们维护过的"屎山"

在上一篇的结尾，我们留下了一个关于“屎山”系统的思考题。很多时候，一个系统之所以变得难以维护，正是源于其早期做出的、看似无伤大雅的数据模型选择。一个不恰当的模型，会像一根歪掉的顶梁柱，让后续所有的添砖加瓦都变得异常痛苦。

本篇锚点：一切始于数据模型

我们今天讨论的“锚点”，是 DDIA 在第二章开篇的核心论断：

数据模型可能是软件开发中最重要的部分，它不仅影响软件的编写方式，更影响我们对问题的思考方式。

你选择用关系模型还是文档模型，这个决定，定义了你的数据世界观。接下来，我们就通过一个每个 Go 工程师都感同身受的例子，来看看这两种世界观的巨大差异。

发散深潜：一个 Go struct 的"坎坷下凡路"

1. 天堂：我们的"完美"Go `struct`

在我们的代码世界里，业务对象是纯洁无瑕、高度内聚的。比如，我们要为一个求职网站设计一个“用户简历”结构体，在 Go 里它长这样，非常自然：

type UserProfile struct {
    ID          int64
    Name        string
    Summary     string
    Positions   []Position  // 工作经历
    Educations  []Education // 教育背景
}

type Position struct {
    JobTitle     string
    Organization string
    StartDate    time.Time
    EndDate      time.Time
}

type Education struct {
    SchoolName string
    Degree     string
    StartDate  time.Time
    EndDate    time.Time
}

在内存里，它就是一个清晰的、自包含的树状结构。我们操作它，就是一个整体。

2. 凡间第一站（关系模型）：惨遭"大卸八块"

现在，这个完美的 UserProfile struct 要“下凡”持久化到我们最熟悉的 MySQL 里。于是，一场“悲剧”发生了：

ID, Name, Summary 这些简单字段，被存入了 users 表。
Positions 这个切片，里面的每一个 Position 元素，都被拆出来，存入了 positions 表。为了知道这些工作经历属于谁，我们还得加个 user_id 外键。
Educations 切片也一样，被存入了 education 表，同样需要 user_id。

看，为了存储一个对象，我们却要同时操作三张表。当要读取时，又需要一个三表 JOIN 的复杂查询，才能在内存里把这个对象辛辛苦苦地“组装”回来。

这种应用代码里的“单一整体”和数据库里的“多张碎表”之间的转换和映射的别扭感觉，就是 DDIA 所说的“对象-关系阻抗不匹配（Object-Relational Impedance Mismatch）”。

3. 凡间第二站（文档模型）：“救赎"与新的"困境”

此时，文档数据库（如 MongoDB）像“救世主”一样出现了。它可以完美地解决上面的问题。整个 UserProfile struct 可以被序列化成一个 JSON，作为一个单一文档存进去。

JSON

{
  "id": 123,
  "name": "张三",
  "summary": "资深后端工程师...",
  "positions": [
    { "job_title": "高级工程师", "organization": "A公司", ... },
    { "job_title": "架构师", "organization": "B公司", ... }
  ],
  "educations": [ ... ]
}

一次写入，一次读取，干脆利落，几乎没有“阻抗”。爽！

但是，爽是有代价的。 当你的数据关系不再是简历这种简单的树状，而是出现了多对多的网状关系时，文档模型的“阻抗不匹配”就来了。

比如，简历里的“公司”应该是一个独立的实体，很多人可能都在同一个“A 公司”工作过。这时，你怎么办？

方案 A（嵌入）：你在每份简历里都冗余地存一份“A 公司”的详细信息。如果 A 公司改名了，你就得去更新所有曾在 A 公司工作过的成千上万份“简历”文档。这简直是场灾难。
方案 B（引用）：你在“简历”文档里只存一个 company_id。当需要显示公司名时，你的 Go 代码就得先查出简历，再根据 company_id 去发起第二次查询获取公司信息。这等于把 JOIN 的工作从数据库硬生生搬到了你的应用代码里。

看，文档模型并没有消灭“阻抗不匹配”，它只是在这种场景下，将“阻抗”从数据库层转移到了你的应用层。

4. 历史的回响：今天的我们，昨天的他们

DDIA 提出了一个惊人的观点：今天的文档数据库，像极了上世纪 70 年代的层次模型数据库 IMS。IMS 当时也是王者，数据结构和今天的 JSON 如出一辙，同样擅长处理一对多关系，也同样在多对多关系上栽了跟头。

最终，关系模型凭借其灵活的 JOIN 和声明式的 SQL，击败了 IMS 和网络模型，统治了世界三十年。

这段历史给我们的启发是：技术是个圈。我们今天在文档模型上遇到的多对多关系的纠结，半个世纪前的工程师们早已经历过。 理解这一点，能让我们在做技术选型时，多一分清醒，少一分盲从。

看到这里，有经验的工程师可能会有个疑问：今天我们津津乐道的文档模型，把数据按树状结构嵌套存储，这听起来和上世纪 70 年代就被关系模型“淘汰”掉的层次模型数据库（如 IMS）何其相似。难道说，技术发展了半个世纪，只是在原地打转吗？

这当然不是技术的倒退。用“螺旋上升”来形容这个过程，要精确得多。

我们确实是在一个相似的“问题地形”上作战——即如何高效处理**“一对多”的、自包含的树状数据**——但我们今天的武器装备，早已鸟枪换炮。当年的 IMS 运行在内存和算力极其宝贵的巨型机上，而今天的文档数据库，则享受着海量内存、高速网络和原生分布式架构的红利。它们的查询语言、灵活性和容错能力，更是 IMS 望尘莫及的。

然而，尽管技术天翻地覆，那个根本性的架构权衡却从未改变。

这个永恒的权衡就是：当你选择一个为特定场景高度优化的“专家”时，你必然会牺牲它在其他场景下的“通用性”。

文档模型，就是一位处理“树状数据”的顶级专家。它能用最自然、最高效的方式来存取一份简历、一张订单或者一篇博客及其评论。这是它的“专长领域”。

而它为此付出的“代价”，就是在处理高度互联、复杂交织的**“网状数据”（多对多关系）**时，会变得笨拙。这时，反而是看似“传统”的关系模型和它的 JOIN 操作，来得更直接、更优雅。

所以，理解这段历史，不是为了厚古薄今，或者给技术选型下一个简单的结论。它的真正价值在于，赋予我们一种架构上的“模式识别”能力。

它能帮助我们超越“哪个技术更时髦”的表面争论，在接到一个新需求时，能立刻在脑中判断出其核心数据的“形状”，并清醒地自问：“我眼前的这个‘问题地形’，究竟是更像一棵树，还是一张网？”

只有回答了这个问题，我们才能真正做出明智的、经得起时间考验的技术抉择。

收束：我们能学到什么？

给 Go 开发者的代码级清单

优雅地处理 NULL：当你的 Go 代码与关系型数据库交互时，请善用 database/sql 包中的 sql.NullString, sql.NullInt64 等类型。这能让你清晰地处理数据库中 NULL 和空值（''或0）的区别。
防御性解析 JSON：当你的 Go 代码处理来自文档数据库的 JSON 时，要时刻假设任何字段都可能缺失。在 struct 中使用指针类型 *string，或者利用 json 标签的 omitempty 选项，能帮你更好地处理数据的不确定性。
选型心法：如果你的核心业务对象是自包含的、很少需要与其他对象做复杂关联的（比如一篇文章和它的评论），文档模型可能非常适合。如果你的对象之间引用关系复杂（比如一个电商订单关联了用户、多个商品、优惠券、仓库等），关系模型通常是更稳妥、长期来看更易维护的选择。

给准架构师的架构级教训

洞察数据的“关系重心”：作为架构师，首要任务是洞察业务领域的核心数据结构。数据的关系“重心”是层次化的（一对多），还是网络化的（多对多）？这个判断是所有数据存储决策的基石。
权衡“灵活性”与“约束”：DDIA 提出了“写时模式”与“读时模式”的对比。这本质上是在权衡“前期灵活性”和“长期维护成本”。架构师需要决定，管理数据多样性的“痛苦”应该由谁（数据库还是应用层）、在哪个阶段来承担。
预判数据的“成长性”：数据之间的连接只会越来越多。今天的简单文档，明天可能就要关联五个新实体。架构师需要选择一个不仅能解决当前问题，更能优雅地演进以支持未来更复杂连接的模型。避免让团队在一年后陷入“模拟 JOIN”的地狱。

June 21, 2025 12:00 AM

June 20, 2025

qcrao 的博客

把DDIA读厚（三）：写给“未来你”的系统设计原则

这是《把 DDIA 读厚》系列关于第一章的最后一篇文章。在开始前，我们先快速回顾一下本系列的创作“心法”：我们以 DDIA 的核心思想为锚点，用一个接地气的深潜案例将其“翻译”成我们的实战经验，最后收束为可供 Go 工程师和准架构师借鉴的行动指南。

回顾与衔接：我们究竟在维护什么？

在上一篇的结尾，我们留下了一个拷问灵魂的问题：

我们都经历过维护“屎山”代码的痛苦。回想一下，你觉得那个系统最让你头疼的地方，是它的运维极其复杂（可操作性差），还是代码逻辑绕来绕去难以理解（简单性差），亦或是牵一发而动全身，难以修改（可演化性差）？

这个问题没有标准答案，因为通常一个“屎山”系统，这三个问题会并发出现，形成一个令人绝望的恶性循环。

比如一个陈旧的订单系统：

可操作性差：当一个订单状态卡住时，没有任何有效的监控和后台工具。唯一的办法就是 SSH 到线上机器，用 grep 在几百 GB 的非结构化日志里大海捞针，祈祷能找到点线索。运维团队视其为“禁区”。
简单性差：核心的 Order 结构体有超过 100 个字段，其中一半你都不知道是干嘛的。核心的 ProcessOrder 函数长达 2000 行，里面是层层嵌套的 if-else。没人敢动它，因为没人能完全理解它。
可演化性差：系统与一个古老的支付网关实现紧密耦合。当业务要求接入一个新的支付渠道（比如微信或支付宝）时，你发现支付相关的逻辑像鬼一样散落在 15 个不同的文件里。每次修改都像在拆炸弹。

这三种痛苦，恰好就是 DDIA 为我们总结的“可维护性”的三大支柱。它们是我们今天讨论的起点。

本篇锚点：软件的真正成本

我们今天的“锚点”，是 DDIA 提出的一个朴素但常被忽视的真理：

软件的大部分成本不在于初始开发，而在于其持续的、长期的维护。 1

这个维护工作包括：修复 Bug、保持系统平稳运行、调查失效、适配新的平台、为新的业务场景修改功能、偿还技术债，以及添加新功能。我们写的每一行代码，都是在给“未来的自己”或“未来的同事”挖坑或铺路。

为了让未来的路更好走，DDIA 提出了可维护性的三大设计原则：可操作性（Operability）、简单性（Simplicity）**和**可演化性（Evolvability）。

发散（一）：可维护性的三大支柱

可操作性 (Operability)：让运维不再“背锅”

这指的是，我们的系统设计应该让运维团队的生活尽可能轻松 22。一个具有良好可操作性的系统，应该有好的监控、完善的自动化支持、清晰的文档和可预测的行为 3。这不仅仅是运维团队的事，更是我们开发者的责任。
简单性 (Simplicity)：用好的抽象对抗复杂度

这里的简单，不是指功能简陋，而是指移除“意外的”复杂度（accidental complexity） 4。这种复杂度并非问题本身所固有的，而是由我们拙劣的实现方式引入的。

对抗复杂度的最强武器，就是好的抽象。一个好的抽象，能将大量的实现细节隐藏在一个干净、易于理解的外观背后 5。DDIA 举了 SQL 的例子：一句简单的 SELECT 查询，背后隐藏了存储引擎、查询优化器、并发控制等极其复杂的实现，但作为使用者，我们无需关心这些细节 6。
可演化性 (Evolvability)：让系统拥抱变化

这指的是我们应该让工程师在未来能轻松地对系统进行修改 777。它也被称为可修改性或可塑性。这是实现敏捷开发在系统层面的基石。

发散（二）深潜：从"代码重构"到"架构重构"的视野升级

马丁·福勒的经典著作《重构》是我们每个开发者的必读物，它教会我们如何在代码层面保持整洁、提高可维护性。

而 DDIA 则将“重构”这个思想，提升到了一个全新的维度——架构重构。书中提到：“在本书中，我们将探索在更大数据系统层面上提高敏捷性的方法，可能由几个不同的应用或服务组成。” 8

我们上一篇文章深入剖析的 Twitter 时间线案例，就是这种“架构重构”的完美体现。我们不妨从可演化性的角度，重新审视那次迁移：

那次从“读放大”到“写放大”的迁移，之所以能够在线上平滑地完成，而不是演变成一场灾难，正是因为其系统设计具备了良好的可演化性。

它允许新旧逻辑并行：通过“双写”，新（写时扇出）旧（写入tweets表）两条写路径可以同时存在。
它允许增量迁移：通过“灰度发布”，可以先让一小部分用户使用新的读路径（从缓存读），验证正确性后再逐步放量。
它允许组件解耦：整个迁移可以被拆解为“扇出服务”、“时间线缓存”、“回填批处理任务”等多个独立的组件，由不同团队开发和部署。

这种能力，就是架构层面的“可演化性”。它允许我们对系统的核心进行“外科手术”式的改造，而不需要“推倒重来”。一个无法演进的系统，最终的命运就是被完全重写，而这往往是项目失败的开始。

收束：我们能学到什么？

给 Go 开发者的代码级清单：

（可操作性）写给人也写给机器的日志：别再用 fmt.Println 或简单的 log.Print。使用结构化的日志库（如 zerolog, slog），输出 JSON 格式的日志。这能让日志不仅人可读，更可以被 Fluentd、Logstash 等工具轻松地采集和分析。
（可操作性）让你的服务会“说话”：使用 prometheus/client_golang 库，为你的服务暴露核心的业务和性能指标。并提供一个 /health 端点，清晰地告诉外部系统你的健康状况。
（简单性）用好 Go 的接口（interface）：接口是 Go 语言中创造抽象的利器。将你的数据访问逻辑、外部服务调用逻辑等，都隐藏在清晰的接口背后。这能让你的核心业务逻辑与具体的实现细节（比如是用 MySQL 还是 PostgreSQL）解耦。
（可演化性）拥抱依赖注入：不要在代码里写死组件的创建逻辑。通过参数传递接口，而不是创建具体的结构体。这能让你的代码极易测试，也为未来更换组件实现铺平了道路。

给准架构师的架构级教训：

像外科医生一样思考“系统接缝”：一个架构师的核心工作之一，就是识别出系统中未来最可能发生变化的“接缝（Seams）”。在这些接缝处，设计出稳定、清晰的接口（如 API、消息格式）。这能让接口两边的系统可以独立演进。
从第一天起就投资“可操作性”：不要把监控、自动化部署、日志规范等当作“以后再说”的事情。它们是一个可维护系统的核心功能，而不是附属品。架构师必须为这些看似“不产出业务价值”的工作争取资源，因为它们决定了系统能活多久。
简单是深思熟虑的结果，而不是起点：一个看起来简单的架构，背后往往是设计者对业务和技术极其深刻的理解，以及对无数种复杂可能性的“拒绝”。架构师的工作，很大程度上是“说不”的艺术——对不必要的复杂性说不，对模糊不清的边界说不。

总结与第一章回顾

DDIA 第一章的三个核心概念，就像是支撑系统设计这座大厦的三根支柱，它们之间相互关联，也相互制约。

我们可以用一个比喻来总结：

可靠性，是确保你这辆车在各种路况下（风霜雨雪、路面坑洼）都能安全地把你送到目的地。
可扩展性，是确保当车上坐满了乘客、装满了行李后，它依然能以足够快的速度平稳行驶。
可维护性，是确保这辆车的设计足够好，让任何一个合格的修理工都能轻松地对它进行保养、维修，甚至在未来给它更换更强大的引擎。

作为系统设计师和架构师，我们的工作，就是在理解业务的前提下，在这三个目标之间做出明智的、有意识的权衡（Trade-offs）。这，就是贯穿 DDIA 全书，也是我们所有后端工程师需要修炼的“心法”。

June 20, 2025 12:00 AM

June 19, 2025

qcrao 的博客

把DDIA读厚（二）：从推特时间线，看懂可扩展性的本质

这是《把 DDIA 读厚》系列的第二篇文章。在上一篇，我们聊了“可靠性”，探讨了如何从“凭感觉”的容错，进化到真正的“可靠性工程”。今天，我们来啃下一个更硬、也更容易被误解的骨头：可扩展性（Scalability）。

回顾与衔接：当"加机器"也解决不了问题

在上一篇的结尾，我们留下了一个思考题：

你是否曾遇到过一个性能瓶颈，是简单的水平扩展无法解决的？它背后的“负载模式”是什么？

这是一个非常经典的问题，几乎每个后端工程师的职业生涯里都会遇到。一个常见的例子就是**“热点账户”或“热点数据”**问题。

想象一个在线教育平台，所有学员都需要在晚上 8 点准时参加一场热门直播课。8 点一到，成千上万的学员同时涌入，系统需要为每个人记录登录、签到等行为。即使你的应用服务器可以轻松地水平扩展（加机器），但所有的写请求最终都指向了同一个逻辑实体——比如数据库里代表这门课程的同一行数据，或者需要更新的同一个总签到人数。

这时，无论你加多少台应用服务器，数据库的那一行数据、那一个计数器，就成了整个系统的瓶颈。所有的请求都在排队等待更新它。这就是一个典型的“加机器”也解决不了的问题。它背后的“负载模式”就是：对单一实体的极度写请求集中。

这个问题引出了我们今天要讨论的核心：在思考“扩展性”之前，我们必须先学会如何描述负载。

本篇锚点：究竟什么是可扩展性？

我们今天讨论的“锚点”，源自 DDIA 对“可扩展性”的精辟定义：

可扩展性不是一个简单的“是/否”标签，而是关于“如果系统的负载以某种特定的方式增长，我们有哪些应对方案？”的讨论。 1

换句话说，当有人问你“你的系统能扩展吗？”时，一个专业的回答不是“能”或“不能”，而是反问：“你指的是哪方面的扩展性？是应对并发用户数增长，还是读写比例变化，或者是数据总量的增加？”

所以，要谈扩展性，我们必须先拥有一套描述它的语言。书中给了我们两个关键工具：描述负载和描述性能。

发散（一）：扩展性的语言

描述负载 (Describing Load)

DDIA 告诉我们，负载不能用单一数字来描述，而应该用一组最能反映系统架构特点的**“负载参数”**来刻画 2。比如：
- Web 服务器的每秒请求数。
- 数据库的读写比例。
- 实时聊天室的同时在线人数。
- 缓存的命中率。
描述性能 (Describing Performance)
- 响应时间 vs 延迟
  
  ：响应时间是用户感受到的端到端时间，是我们的金标准 3
  
  。而延迟，通常指请求在队列中等待服务的那部分时间 4
  
  。
- 百分位点的重要性
  
  ：别再用“平均响应时间”来衡量性能了！它极具欺骗性。一个耗时 10 秒的请求，会被 99 个耗时 100 毫秒的请求平均得无影无踪。我们必须关注
  
  p95、p99 甚至 p999 的响应时间
  
  。DDIA 引用了亚马逊的例子：那些请求耗时最长的用户，往往是账户里数据最多的“高价值用户” 5
  
  。为了他们的体验，优化长尾延迟至关重要。

发散（二）深潜：Twitter 时间线背后的"读/写放大"之战

掌握了描述负载和性能的语言，我们就可以来解剖一个神级案例了。这个案例几乎是所有后端工程师理解“读/写放大”和架构权衡的必修课。

Twitter 的核心功能之一是展示用户的“主页时间线”（你关注的所有人发的推文列表）。我们来看它的负载参数：发推请求平均 4.6k QPS，而时间线读取请求高达 300k QPS 6。读请求是写请求的近 65 倍。

面对这个负载模式，Twitter（或者说我们）有两种截然不同的实现思路：

思路一：读时合并（读放大 Read Amplification）

这是最符合直觉的方案，就像传统的数据库设计。

写操作：当一个用户发推时，操作非常简单，只需向一个全局的 tweets 表里插入一条记录。成本极低。
读操作

：当一个用户要看自己的主页时间线时，操作非常复杂：
1. 查找该用户关注的所有人。
2. 对每一个被关注的人，去 tweets 表里查询他们最近的推文。
3. 将所有这些推文在内存中合并、按时间排序。这个过程涉及大量的数据库 JOIN 和计算。一次简单的用户读取，会“放大”成一场数据库的查询风暴。这就是典型的**“读放大”**架构。

思路二：写时扇出（写放大 Write Amplification）

这个方案反其道而行之。

写操作

：当一个用户（比如拥有 1000 个粉丝的
```
user_A
```
）发推时，操作变得非常复杂：
1. 将推文写入 tweets 表。
2. 立刻查询出user_A的 1000 个粉丝。
3. 将这条新推文的 ID，分别写入这 1000 个粉丝的“时间线缓存”中。一次用户写入，被“放大”成了 1001 次数据库写入。这就是**“写放大”**架构。
读操作：当一个用户要看自己的主页时间线时，操作变得极其简单：直接从自己的“时间线缓存”里读取推文 ID 列表即可，快如闪电。

权衡的艺术：

Twitter 最终选择了思路二。为什么？因为它们的负载模式（300k 读 vs 4.6k 写）决定了，让少数的写操作付出巨大代价，来换取海量的读操作能极速完成，是绝对划算的买卖 7。

这个案例告诉我们，可扩展性设计的本质，就是识别出你系统中那个被放大得最厉害的负载，然后将你的架构重心倾向于优化它。

当然，故事还没完。对于有三千万粉丝的明星用户，一次发推就要写入三千万次缓存，这谁也顶不住。所以 Twitter 最终采用了混合模型：对普通用户使用“写放大”，对明星用户则退回“读放大”的模式，在用户读取时再单独拉取和合并 8。这再次证明了，没有一招鲜的银弹，好的架构总是充满了务实的权衡。

收束：我们能学到什么？

给 Go 开发者的代码级清单：

把观测作为本能：别只满足于 log.Printf。使用 Prometheus 客户端库（prometheus/client_golang）来武装你的 Go 服务。你不仅要记录平均延迟，更要用 Histogram 或 Summary 类型来追踪 p95/p99 延迟。你无法优化你衡量不了的东西。
识别你代码中的“放大”模式：审视你的代码。获取一个列表，然后在 for 循环里挨个查询详情，这是“读放大”。更新一个商品，然后去刷新十个相关的缓存，这是“写放大”。识别它们是优化的第一步。
拥抱批量处理：在你的 Go 服务中，主动提供批量处理的接口（比如 GET /api/users?ids=1,2,3），而不是只有 GET /api/users/:id。这能让你的服务成为一个“友好”的上游，帮助整个系统的其他部分避免“读放大”。

给准架构师的架构级教训：

可扩展性是一个“故事”，而不是一个“数字”：别再问“这个系统能扩展吗？”。要学会问：“这个系统在应对‘读请求/秒’这个负载参数增长时，表现如何？”或者“当‘单个用户数据量’增长时，它的瓶颈在哪里？”。架构师的语言必须是精确的。
找到你系统的“核心矛盾”：你的系统里，哪个负载参数比其他的要高出一到两个数量级？是读 QPS？是写 QPS？还是并发连接数？整个架构设计都应该围绕这个最主要的矛盾来展开。
写路径 vs. 读路径的权衡是一门艺术：Twitter 的案例完美展示了，架构师的一个关键工作，就是决定把计算的复杂性更多地放在“写路径”（如发推时的扇出），还是“读路径”（如读时间线时的合并）。这个决策的杠杆，就是你的核心负载模式。
不存在“万能灵药”：Twitter 对明星用户的特殊处理告诉我们，一个好的架构，往往是多种策略的混合体。不要试图用一个方案解决所有问题，要学会对负载进行切分，并应用不同的优化策略。

总结与下一篇的思考题

可扩展性不是简单地“加机器”，它是一门基于量化分析和架构权衡的严谨工程学科。它的核心，在于深刻理解你的系统所承受的独特“负载模式”，并把你的设计重心，放在解决那个被放大得最厉害的矛盾上。

留给你的思考题（我们将在下一篇探讨）：

我们都经历过维护“屎山”代码的痛苦。回想一下，你觉得那个系统最让你头疼的地方，是它的运维极其复杂（可操作性差），还是代码逻辑绕来绕去难以理解（简单性差），亦或是牵一发而动全身，难以修改（可演化性差）？

June 19, 2025 12:00 AM

June 18, 2025

qcrao 的博客

把DDIA读厚（一）：从“凭感觉”到可靠性工程

这是《把 DDIA 读厚》系列的第一篇文章。在开始前，我想先跟您聊聊这个系列想做什么。市面上解读经典的书不少，但大多是摘要和复述。咱们想玩点不一样的，真正把这本“屠龙宝刀”读厚。

我们的方法很简单，称之为 “锚点-发散-收束”：

锚点 (Anchor)：每一篇，我们都从 DDIA 中精炼出一个最核心、最关键的思想作为“锚点”，确保我们的讨论不偏离航道。

发散 (Diverge)：我们会围绕这个“锚点”，结合一个你我他在工作中都可能遇到的具体场景，进行深度剖析，把书中的理论“翻译”成看得见、摸得着的工程实践。

收束 (Conclude)：最后，我们会把这些讨论“收束”成可以立即应用的经验和教训，既有给一线开发者的代码级清单，也有给准架构师的架构级思考。

好了，交代完毕。现在，让我们正式开始第一次的“读厚”之旅。

引子：你的服务可靠吗？还是只是"没出事"？

干咱们这行的，谁没在半夜三点被电话叫起来过？当一个新服务上线，我们嘴上说着“应该没问题”，心里可能早就开始“烧香拜佛”了。这种“靠天吃饭”的感觉，其实源于我们对“可靠性”的理解还停留在直觉层面。

DDIA 的第一章，正是要帮助我们完成这个转变：从“凭感觉”做设计，到用“工程思维”构建可靠性。

本篇锚点：故障 (Fault) vs. 失效 (Failure)

DDIA 开篇就给我们扔出了一个最基础，但 90%的工程师都会混淆的概念模型，这也是我们今天讨论的“锚点”：

一个可靠的系统，其目标不是杜绝故障（Fault），而是防止故障演变成失效（Failure）。

这两个词儿必须掰扯清楚：

故障 (Fault)：指的是系统里某个零件出问题了。比如，数据库突然一个慢查询，网络抖了一下丢了几个包，你写的一个 Go 服务因为空指针 panic 了。
失效 (Failure)：指的是整个系统拉胯了，没法给用户提供服务了。比如，用户的 API 请求直接收到了 500 错误。

这就好比你感觉有点头晕（这是故障），但你还能继续跟产品经理 battle（系统没失效）。可要是你直接晕倒了（这就是失效），那需求评审会就得黄。

理解了这个区别，我们就明白了，我们的工作不是幻想一个“零故障”的乌托邦，而是设计一个皮实的、能容忍故障的系统。

发散深潜：一个"普通"的重试，如何引发"雪崩"？

聊到容错，咱们的肌肉记忆第一反应就是“加上重试”。调用下游服务超时了？没事，加个重试，再加个几十毫秒的随机延迟，齐活。我知道，你肯定也写过这样的代码。别不好意思，我也写过。

在大多数情况下，这个模式工作得很好。 它能有效地处理网络偶尔的抖-动、下游服务临时的、随机的抖动。这些都属于瞬时性、非系统性的故障。

但是，当故障模式改变时，这个“好”模式就可能变成“帮凶”。

场景还原：

假设你的服务 A 需要处理一个请求，这个请求需要去服务 B 获取一批用户的详细信息。服务 B 是一个稳定的第三方服务，但有速率限制：100 QPS。

一个隐藏的“坑”：

你在服务 A 里写了段逻辑，它需要处理一个包含 100 个用户 ID 的列表。最直观的写法，自然就是 for 循环这个列表，然后挨个去用户服务 B 查询。这种“啰嗦”的调用模式，在低负载下，可能并不会暴露问题。

风暴的来临：

某天，一个营销活动让服务 A 的流量飙升到了 2 QPS。现在，服务 A 会尝试在 1 秒内向服务 B 发起 200 次调用。

灾难开始了：

前 100 次调用成功了，瞬间耗尽了服务 B 在这一秒的全部配额。
后 100 次调用，全部因为限流而失败（收到了 429 Too Many Requests）。
这 100 次失败的调用，全部进入了我们那个“看似良好”的重试逻辑。
紧接着，下一秒到来了，服务 A 新的 200 次请求又来了。但与此同时，上一秒失败的 100 次重试请求也跟着涌入！
现在，在同一个时间窗口内，有 200 次新请求 + 100 次重试请求，总共 300 个请求涌向了只有 100 QPS 容量的服务 B。
服务 B 的配额再次被瞬间耗尽，导致更大规模的 429 错误和更多的重试。

系统进入了“重试风暴”，恶性循环，最终雪崩。我们那个平时处理瞬时故障的“好”模式，在面对系统性的、与负载强相关的故障时，不但没有解决问题，反而放大了故障，最终导致了整个功能的“失效”。

收束（一）：从"治本"到"治标"的正确姿势

光吐槽不给方案，那是耍流氓。这事儿得两手抓，一手治本，一手治标。

治本（战略层）：优化你的调用模式

最根本的解决方案，是让服务 A 成为一个“友好”的调用方。我们应该修复那个在循环中调用的逻辑，用一次“批量调用”替代多次“循环调用”。先收集所有需要查询的用户 ID，然后通过服务 B 提供的一个批量接口（如 GET /users?ids=1,2,3）一次性获取所有数据。
治标（战术层）：用“组合拳”代替“王八拳”

即使我们优化了调用模式，也仍然可能因为突发流量而遇到限流。此时，我们需要一套比“简单重试”更成熟的战术组合。
1. 指数退避 + 随机抖动：别傻乎乎地每次都等同样的时间。每次重试的间隔应该指数级增长（如 100ms, 200ms, 400ms…），并在这个基础上增加一个随机量。这能给下游服务真正的恢复时间，并避免所有客户端“同步”重试。
2. 断路器模式：这是咱们工具箱里的大杀器。就像你家里的保险丝，烧了就断，总比把整个房子点了强。当来自服务 B 的失败在短时间内达到阈值时，断路器“跳闸”，在接下来的一段时间内，服务 A 所有对服务 B 的调用都会在内部立即失败，根本不发网络请求。这既保护了我们自己，也保护了下游。Go 社区有许多成熟的库如 sony/gobreaker 可以轻松实现。
3. 客户端限流：做个有素质的调用方。如果服务 B 明确告知了它的速率限制，我们可以在服务 A 内部就实现一个对应的限流器（例如使用 Go 官方的 golang.org/x/time/rate 包），主动将对 B 的调用速率控制在限制之内。

收束（二）：我们能学到什么？

从这个案例中，不同角色的工程师可以汲取不同的经验。

给 Go 开发者的代码级清单：

区分错误，别一视同仁：在你的 if err != nil 之后，判断错误的类型。网络超时可以重试，但 4xx 类的客户端错误、429 限流，就不应该无脑重试。
让你的写接口支持幂等：这是让调用方敢于重试的底气。最简单的方式，就是让调用方在 Header 里传一个唯一的 X-Request-ID，你在服务端检查并存储它，防止重复处理。
为每一个外部调用包裹 context 超时：无论是数据库、Redis 还是 gRPC 调用，永远使用 context.WithTimeout 或 context.WithDeadline，别让一个慢下游拖垮你的整个服务。
在测试里“搞破坏”：别只测正常流程。用 mock 模拟你的下游依赖返回超时、返回429、返回503。这能逼着你写出更健壮的容错代码。

给准架构师的架构级教训：

定义你的故障模型：作为架构师，你需要思考：“我的系统主要会遇到哪种类型的故障？是随机瞬时的，还是和负载相关的系统性的？” 不同的故障模型，需要完全不同的容错策略。
设计服务间的“契约”：服务间的关系不是随意的。一个好的架构师会去推动定义清晰的“服务契约”，这包括：明确的速率限制、提供批量处理接口（以避免“啰嗦”的调用模式）、以及规范化的错误码。
将“可观测性”作为一级公民：设计系统时，就要想好如何去观测它。我需要哪些 metrics 才能区分出“瞬时网络抖动”和“持续的限流”？日志里需要记录哪些关键信息（比如请求 ID，下游延迟），才能快速定位到是哪个上游在“滥用”我的服务？
选择可预测的失效模式：一个因“重试风暴”而雪崩的系统，其行为是混乱且不可预测的。而一个因“断路器”跳闸而暂时拒绝服务的系统，其行为是可预测的。架构师的工作，很多时候就是选择一种更安全、更可预测的“死法”。

总结与下一篇的思考题

DDIA 第一章“可靠性”部分的核心，是帮助我们建立一种工程化的思维方式，去替代“凭感觉”的直觉。它要求我们深入理解故障的本质，并设计出能够容忍故障，而不是掩盖故障的系统。

我们今天深挖的“重试”案例，正是这一思想的绝佳注脚。

留给你的思考题（我们将在下一篇探讨）：

我们经常听到用“加机器”来解决性能问题。但书中 Twitter 的例子告诉我们，有时架构选择比加机器更重要。你是否曾遇到过一个性能瓶颈，是简单的水平扩展无法解决的？它背后的“负载模式”是什么？

June 18, 2025 12:00 AM

June 04, 2025

李文周的博客

使用 gzip 拯救你的 varchar

在处理大量数据时，数据压缩是优化存储和传输效率的重要手段。在 Go 语言中，我们可以通过自定义 JSON 的 Marshal 方法，实现在数据入库前自动进行 gzip 压缩，从而减少存储空间占用并提高传输效率。

June 04, 2025 03:14 PM

April 06, 2025

李文周的博客

使用 chromedp 操作 chrome

chromedp 是一个基于 Go 语言开发的 Chrome/Chromium 浏览器自动化工具，通过 DevTools Protocol 实现高效页面控制。

April 06, 2025 11:32 AM

March 31, 2025

李文周的博客

pulsar 介绍及Pulsar Go client 使用指南

Pulsar 是一种分布式消息流平台，具有高性能、可扩展性和多租户支持，适用于实时数据处理和消息传递。

March 31, 2025 01:14 PM

January 31, 2025

李文周的博客

[译]Go Protobuf：新的 Opaque API

Go Protobuf 新增了一套 Opaque API，通过生成不透明结构体和实现惰性解码，来减少消息体内存占用并提高性能。

January 31, 2025 01:22 PM

December 24, 2024

李文周的博客

Go语言中的迭代器和 iter 包

很多流行的编程语言中都以某种方式提供迭代器，其中包括 C++、Java、Javascript、Python 和 Rust。Go 语言现在也加入了迭代器。iter 包是 Go 1.23 新增的标准库，提供了迭代器的基本定义和相关操作。

December 24, 2024 08:27 AM

November 30, 2024

李文周的博客

SQL优先的 Go ORM 框架——Bun 介绍

Bun 是一个 SQL 优先的 Golang ORM（对象关系映射），支持 PostgreSQL、MySQL、MSSQL和SQLite。它旨在提供一种简单高效的数据库使用方法，同时利用 Go 的类型安全性并减少重复代码。

November 30, 2024 08:09 AM

November 07, 2024

李文周的博客

ORM 框架 ent 介绍

ent 是 Facebook 开源的一款 Go 语言实体框架，是一款简单而强大的用于建模和查询数据的 ORM 框架。

November 07, 2024 01:18 PM

August 04, 2024

李文周的博客

[译] Prometheus 运算符

Prometheus 支持许多二元和聚合运算符。

August 04, 2024 05:36 AM

July 16, 2024

李文周的博客

[译]查询 Prometheus

Prometheus 提供了一种名为 PromQL (Prometheus Query Language) 的功能性查询语言，允许用户实时选择和聚合时间序列数据。表达式的结果既可以显示为图形，也可以在 Prometheus 的表达式浏览器中显示为表格数据，或者被外部系统通过 HTTP API 使用。

July 16, 2024 03:26 PM

July 15, 2024

李文周的博客

Prometheus 介绍

prometheus 是目前主流的一个开源监控系统和告警工具包，它可以与 Kubernetes 等现代基础设施平台配合，轻松集成到云原生环境中，提供对容器化应用、微服务架构等的全面监控。本文将带你快速了解 Prometheus 相关概念。

July 15, 2024 03:31 PM