并发编程概述

三个容易混淆的概念

在进入具体代码之前，必须先分清：异步（asynchrony）、并发（concurrency）、并行（parallelism）。

概念	更关注什么	一个直观例子
异步	顺序是否可以被放宽	两个互不依赖的文件保存任务，谁先完成都可以
并发	多个任务能否被同时推进	服务器同时处理多个客户端请求
并行	多个任务是否真的在物理上同时运行	多核 CPU 上多个线程同时执行

这三个概念贯穿后续所有并发相关话题。

异步：“顺序是否重要”

异步首先讨论的是正确性约束，而不是“有没有多线程”。

如果两个操作只要最终都完成即可，中间顺序并不重要，那么它们就具有异步性。

并发：“系统是否能同时推进多个任务”

并发讨论的是组织方式。

即使只有一个 CPU 核心，系统也可以通过任务切换，在时间上交替推进多个任务。这仍然是并发，但不一定是并行。

并行：“硬件层面是否真的同时执行”

并行强调的是物理同时执行。这通常依赖多核 CPU，或者其他底层并行资源。

因此，常见的关系可以这样理解：

并发不一定并行
异步不一定并发
并行通常是实现并发的一种方式

Zig 中并发编程的阅读重点

Zig 在并发上的一个重要特点是：尽量把成本和机制显式化。

这意味着在 Zig 中更常直接面对：

线程
锁
条件变量
原子操作
共享数据和生命周期边界

而不是一开始就被隐藏在“自动调度器”或“语言级运行时”之后。

这有两个直接后果：

能更清楚地看到并发成本和数据边界
也更需要自己做出正确的设计判断

什么时候需要并发？

不是所有程序都需要并发。

更准确地说，通常在下面这些场景里才真的需要它：

需要同时处理多个任务
存在明显的等待时间，希望程序更有响应性
希望利用多核 CPU 加速独立计算任务
希望把某些后台工作与主流程解耦

常见例子包括：

多客户端服务器
并行数据处理
图像、音频、视频处理
后台日志、监控、缓存刷新

而对于很小的 CLI 工具或纯串行的数据转换脚本，并发往往不是起点。

最基础的并发工具：线程

在 Zig 中，最直接的并发入口通常是 std.Thread。

创建线程

const std = @import("std");

fn worker(id: usize) void {
    std.debug.print("worker {} start\n", .{id});
    var i: usize = 0;
    while (i < 100_000_000) : (i += 1) {} // 模拟耗时
    std.debug.print("worker {} done\n", .{id});
}

pub fn main() !void {
    const t1 = try std.Thread.spawn(.{}, worker, .{1});
    const t2 = try std.Thread.spawn(.{}, worker, .{2});

    t1.join();
    t2.join();
}

这段代码展示了最基本的线程模型：

主线程创建两个工作线程
每个线程执行自己的任务
主线程通过 join() 等待它们结束

`join()` 与 `detach()`

线程创建之后，通常要明确选择如何结束它的生命周期。

`join()`：等待线程完成

适用于：

需要确认工作已经完成
后续逻辑依赖线程结果
希望生命周期最清晰

`detach()`：让线程独立运行

适用于：

不打算等待该线程
它确实是一个后台任务
能保证它不会访问已经释放的资源

注意：

大多数教程和普通工程代码里，优先选择 join() 会更安全。detach() 更容易引入生命周期错误，尤其是后台线程引用了栈对象、临时缓冲区或即将销毁的分配器时。

共享状态：为什么需要同步？

一旦多个线程访问同一份数据，就会出现并发编程里最核心的问题：

数据竞争
竞态条件
内存可见性

例如，下面这个“看起来很简单”的计数器递增，在多线程里其实并不安全：

counter += 1;

因为这并不是一个不可分割的操作。它至少包含：

读取旧值
计算新值
写回结果

多个线程交错执行时，最终结果就可能丢更新。

互斥锁：最常见的共享数据保护方式

对于复杂共享数据，最常见的第一选择通常是互斥锁 std.Io.Mutex。

const std = @import("std");

const Counter = struct {
    mutex: std.Io.Mutex = .init,
    value: usize = 0,

    pub fn increment(self: *Counter, io: std.Io) !void {
        try self.mutex.lock(io);
        defer self.mutex.unlock(io);
        self.value += 1;
    }

    pub fn get(self: *Counter, io: std.Io) !usize {
        try self.mutex.lock(io);
        defer self.mutex.unlock(io);
        return self.value;
    }
};

fn worker(data: *struct { counter: *Counter, io: std.Io }) void {
    for (0..1000) |_| {
        data.counter.increment(data.io) catch unreachable;
    }
}

pub fn main(init: std.process.Init) !void {
    const io = init.io;
    var counter = Counter{};

    var threads: [4]std.Thread = undefined;
    for (&threads) |*thread| {
        thread.* = try std.Thread.spawn(.{}, worker, .{.{ .counter = &counter, .io = io }});
    }
    for (threads) |thread| thread.join();

    std.debug.print("final = {}\n", .{try counter.get(io)});
}

要点：

0.16 中 Mutex.lock() / unlock() 需要显式传入 io——和文件 I/O 同样的设计
defer 能帮助减少忘记解锁的风险
把锁和数据封装在一起，通常比在外面散落管理更清晰

什么时候优先用锁？

当面对的是：

结构体
map / list / 缓冲区
需要多个步骤组成的修改操作
不容易用单个原子变量表达的共享状态

这时，锁往往比“试图全部用原子操作硬拼”更清晰、更可靠。

条件变量：让线程等待“某个条件成立”

有时线程不是要“抢同一把锁”，而是要等待某个状态变化，例如：

队列里终于有数据了
某个后台步骤完成了
生产者已经放入新任务

这时可以使用 std.Io.Condition。

const std = @import("std");

const State = struct {
    mutex: std.Io.Mutex = .init,
    cond: std.Io.Condition = .init,
    ready: bool = false,
    io: std.Io,
};

fn producer(state: *State) void {
    var i: usize = 0;
    while (i < 50_000_000) : (i += 1) {}
    state.mutex.lock(state.io) catch unreachable;
    defer state.mutex.unlock(state.io);
    state.ready = true;
    state.cond.signal(state.io);
}

fn consumer(state: *State) void {
    state.mutex.lock(state.io) catch unreachable;
    defer state.mutex.unlock(state.io);
    while (!state.ready) {
        state.cond.wait(state.io, &state.mutex) catch unreachable;
    }
    std.debug.print("consumer: resource is ready\n", .{});
}

pub fn main(init: std.process.Init) !void {
    var state = State{ .io = init.io };
    const p = try std.Thread.spawn(.{}, producer, .{&state});
    const c = try std.Thread.spawn(.{}, consumer, .{&state});
    c.join();
    p.join();
}

等待条件变量时，要和一把互斥锁配合使用
条件检查通常写在 while 循环里，而不是 if
0.16 中 Condition.wait() / signal() 同样需要传入 io

原子操作：适合小而明确的共享状态

如果共享状态非常简单，例如：

计数器
标志位
统计值

那么原子操作往往比锁更轻量。

const std = @import("std");

const AtomicCounter = struct {
    value: std.atomic.Value(usize) = std.atomic.Value(usize).init(0),

    pub fn increment(self: *AtomicCounter) void {
        _ = self.value.fetchAdd(1, .monotonic);
    }

    pub fn get(self: *AtomicCounter) usize {
        return self.value.load(.monotonic);
    }
};

什么时候适合用原子操作？

适合：

单个数值
简单状态位
不需要把多个字段作为一个整体同时维护

不适合：

复杂结构体的一致性维护
多字段必须一起更新的状态
逻辑已经很难一眼看懂的并发代码

注意：

如果在写原子代码时已经开始怀疑“这到底是否还容易验证”，那通常就该重新评估，看看是不是应该回到锁。

线程局部变量：避免不必要的共享

并发设计里，一个很重要的思路是：如果能不共享，就尽量不共享。

线程局部变量（threadlocal）正是这个方向的一种工具。

const std = @import("std");

// threadlocal 变量必须声明在模块级。每个线程都会拥有自己独立的一份副本，
// 互不干扰，因此不需要锁保护。
threadlocal var local_counter: usize = 0;

fn worker(id: usize) void {
    for (0..3) |_| {
        local_counter += 1;
        std.debug.print("thread {} local = {}\n", .{ id, local_counter });
    }
}

pub fn main(_: std.process.Init) !void {
    var threads: [3]std.Thread = undefined;

    for (&threads, 0..) |*t, i| {
        t.* = try std.Thread.spawn(.{}, worker, .{i});
    }

    for (threads) |t| {
        t.join();
    }

    // 主线程也有自己的 local_counter 副本，它从未被修改过，仍然是 0
    std.debug.print("main thread local = {}\n", .{local_counter});
}

运行后会看到，每个线程的 local_counter 都从 0 独立递增到 3，互不影响。主线程的副本始终为 0。

每个线程都会拥有自己独立的一份 local_counter，因此它不需要互斥锁保护。

它适合什么场景？

每个线程自己的缓存区
线程自己的临时状态
每个线程独立的统计信息

它不适合什么场景？

多个线程必须共享和协调的数据
需要全局一致性的计数或状态

该选线程、锁、原子，还是条件变量？

可以先用下面这张表建立直觉：

场景	更常见的起点
把几个独立计算任务分给多个 CPU 核心	线程
多线程共享复杂结构体	互斥锁
只维护一个计数器或标志位	原子操作
一个线程等待另一个线程准备好数据	条件变量
每个线程维护自己的临时状态	`threadlocal`

这张表不是绝对规则，但很适合作为第一判断。

线程模型与 `std.Io` 的关系

在 std.Io 接口详解中，我们介绍了 std.Io 的异步和并发能力。那么，本章讲的线程模型与 std.Io 是什么关系？

std.Io 提供了基于线程池的更高层抽象：

io.async(f, args) — 将任务提交给运行时执行，调用线程不会阻塞。底层可能使用线程池、也可能在当前线程上顺序执行——它只承诺任务会被推进，不承诺一定会并发
io.concurrent(f, args) — 与 io.async 类似，但额外要求运行时为任务分配真实的并发执行资源。如果无法提供并发（线程池已满或平台不支持），返回 error.ConcurrencyUnavailable