Rust 2026 经验谈 - 常见 bug 模式与防御性编程

Rust 的类型系统消除了整类 bug（空指针、数据竞争、use-after-free），但这不代表 Rust 程序就不会有 bug。unwrap 滥用、整数溢出、索引越界、死锁——这些仍然是生产事故的常客。本文从真实踩坑经验出发，总结常见 bug 模式和防御性编码策略，让你在 Code Review 时一眼识别这些问题。

unwrap 滥用与替代方案#

为什么 unwrap 是危险的？#

unwrap 的语义是”我断言这里有值，否则 panic”。在以下场景中它是有意义的：

测试代码
初始化阶段（程序刚启动，失败就该死）
经过逻辑证明不可能为 None/Err 的地方

但实际代码中，80% 的 unwrap 用法都不属于这些场景。

替代方案矩阵#

场景	错误做法	正确做法
Option 有值	`.unwrap()`	`.expect("为什么一定有值")`
Option 可能为空	`.unwrap()`	`.ok_or(Error::Missing)?`
Result 一定成功	`.unwrap()`	`.expect("为什么一定成功")`
Result 可能为 Err	`.unwrap()`	`?` 操作符
集合查找	`.unwrap()`	`if let Some(v) = map.get(key)`
解析输入	`.unwrap()`	`.parse().map_err(...)?`

expect：让 panic 有语义#

1
// 不好：panic 消息是 "called `Option::unwrap()` on a `None` value"
2
let port = config.get("port").unwrap();
3

4
// 好：panic 消息告诉你"为什么"这里不该失败
5
let port = config.get("port")
6
    .expect("config must contain 'port' — check config.toml");
7

8
// 更好：返回 Result，让调用者决定
9
let port = config.get("port")
10
    .ok_or(ConfigError::MissingField("port"))?;

经验：每次写 .unwrap()，问自己”如果这里是 None/Err，是 bug 还是可预期的失败？“如果是后者，改成 ?。

ok_or / ok_or_else：将 Option 转为 Result#

1
// unwrap：失败时 panic
2
let user = users.find_by_id(id).unwrap();
3

4
// ok_or：失败时返回错误
5
let user = users.find_by_id(id)
6
    .ok_or(AppError::UserNotFound(id))?;
7

8
// 注意：ok_or 会急切求值错误表达式
9
// 如果创建错误对象有开销，用 ok_or_else
10
let user = users.find_by_id(id)
11
    .ok_or_else(|| AppError::UserNotFound(id))?;

ok_or vs ok_or_else 的区别类似于 Option::or vs Option::or_else——前者总是求值，后者只在 None 时求值。如果错误类型包含 String 或 Box，用 ok_or_else 避免不必要的分配。

unwrap_or_default / unwrap_or：提供默认值#

1
// 有合理默认值的场景
2
let timeout = config.get("timeout")
3
    .and_then(|v| v.parse().ok())
4
    .unwrap_or(30);  // 默认 30 秒
5

6
// 或用 unwrap_or_default（需要 Default trait）
7
let flags: Vec<String> = config.get_list("flags")
8
    .unwrap_or_default();  // 空Vec

整数溢出：debug vs release 的行为差异#

这是 Rust 最阴险的 bug 模式之一——在 debug 和 release 模式下行为不同。

行为对比#

1
let x: u8 = 255;
2
let y = x + 1;  // debug: panic!  |  release: 静默溢出为 0

Debug 模式：整数溢出触发 panic（运行时检查）
Release 模式：整数溢出静默回绕（为了性能，编译器假定不会溢出）

这意味着：你的测试不会捕获溢出 bug，因为测试跑在 debug 模式下。 而 bug 在 release 模式下才会显现。

真实事故案例#

1
// 计算缓冲区大小
2
let buf_size = header_len + body_len;  // 如果 header_len + body_len > usize::MAX 呢？
3
let buf = vec![0u8; buf_size];  // 分配了一个"很小"的缓冲区（回绕后）
4

5
// 然后 body 数据写入时越界——但不是 Rust 的边界检查先捕获，
6
// 而是 buf_size 已经错了，写入的语义就不对了

防御方案#

1. saturating 操作：溢出时停在边界值

1
let x: u8 = 250;
2
let y = x.saturating_add(10);  // 255，而非回绕到 4
3

4
// 常用场景：计数器、进度条
5
progress.saturating_add(step);
6
remaining.saturating_sub(consumed);

2. wrapping 操作：显式声明”我就是想要回绕”

1
// 哈希计算、CRC、加密——这些场景回绕是正确的语义
2
let hash = hash.wrapping_mul(31).wrapping_add(byte as u64);

3. checked 操作：检测溢出并处理

1
let buf_size = header_len.checked_add(body_len)
2
    .ok_or(Error::BufferTooLarge)?;
3

4
// 或者用 ? 传播
5
let total = a.checked_add(b)?;  // 溢出时返回 None

4. overflowing 操作：获取溢出标志

1
let (result, did_overflow) = x.overflowing_add(y);
2
if did_overflow {
3
    log::warn!("integer overflow detected: {} + {}", x, y);
4
}

Cargo 配置：在 release 中也检查溢出#

1
[profile.release]
2
overflow-checks = true  # release 也检查溢出（约 5-10% 性能开销）

经验：如果你的领域涉及金融、密码学、或者任何”数字正确性至关重要”的场景，overflow-checks = true 是必需品而非可选项。

索引越界与 get 替代#

panic vs Option：两种访问风格#

1
let v = vec![1, 2, 3];
2

3
// panic 风格：越界时 panic
4
let x = v[10];  // thread 'main' panicked at 'index out of bounds: the len is 3 but the index is 10'
5

6
// Option 风格：越界时返回 None
7
let x = v.get(10);  // None

什么时候用哪个？

v[i]：当你有逻辑保证 i < v.len()，越界意味着 bug
v.get(i)：当 i 来自外部输入，越界是可预期的

常见坑：切片迭代中的索引#

1
// 反模式：手动索引 + unwrap
2
for i in 0..items.len() {
3
    let item = items[i];       // OK 但多余
4
    let next = items[i + 1];   // 潜在越界！最后一个元素时会 panic
5
}
6

7
// 正确：用迭代器
8
for item in &items {
9
    // 安全，无需索引
10
}
11

12
// 需要相邻元素时
13
for window in items.windows(2) {
14
    let (prev, next) = (window[0], window[1]);
15
}
16

17
// 或者用 enumerate + get
18
for (i, item) in items.iter().enumerate() {
19
    let next = items.get(i + 1);  // Option，安全
20
}

HashMap / BTreeMap 的 get 习惯#

1
// 反模式：contains_key + 索引（两次查找）
2
if map.contains_key(&key) {
3
    let value = map[&key];  // 第二次查找
4
}
5

6
// 正确：get 一次
7
if let Some(value) = map.get(&key) {
8
    // 使用 value
9
}
10

11
// 需要 mutable 引用时
12
if let Some(value) = map.get_mut(&key) {
13
    *value += 1;
14
}
15

16
// 或者 entry API（一次查找，可插入默认值）
17
let count = map.entry(key).or_insert(0);
18
*count += 1;

Deadlock 常见模式#

Rust 的类型系统防止了数据竞争，但不防止死锁。Mutex 在 Rust 中和在其他语言中一样容易死锁。

模式 1：Mutex 嵌套——最经典的死锁#

1
use std::sync::Mutex;
2

3
let a = Mutex::new(0);
4
let b = Mutex::new(0);
5

6
// 线程 1
7
let mut ga = a.lock().unwrap();
8
let mut gb = b.lock().unwrap();  // 如果线程 2 先拿了 b，这里就死锁
9

10
// 线程 2（在另一个线程中）
11
let mut gb = b.lock().unwrap();
12
let mut ga = a.lock().unwrap();  // 等待线程 1 释放 a → 死锁

防御方案：永远按相同顺序加锁

1
// 方案 1：文档约定锁顺序
2
// "所有代码必须先锁 A 再锁 B"
3

4
// 方案 2：用层级 Mutex（编译期强制顺序）
5
// 参见 parking_lot::ReentrantMutex 或 layeredlock crate
6

7
// 方案 3：缩小锁的范围，避免同时持有两把锁
8
{
9
    let ga = a.lock().unwrap();
10
    *ga += 1;
11
} // 释放 a
12
{
13
    let gb = b.lock().unwrap();
14
    *gb += 1;
15
} // 释放 b

模式 2：ReentrantMutex 的”伪死锁”#

1
use parking_lot::ReentrantMutex;
2

3
let m = ReentrantMutex::new(0);
4

5
let guard1 = m.lock();
6
// 同一线程可以再次加锁——但这是否是你想要的？
7
let guard2 = m.lock();  // 不会死锁，但可能导致逻辑错误

ReentrantMutex 避免了同线程死锁，但引入了更隐蔽的 bug：你以为拿了锁就独占了数据，但同线程的其他代码可能已经改了它。能用普通 Mutex 解决的，不要用 ReentrantMutex。

模式 3：循环依赖中的 async Mutex#

1
use tokio::sync::Mutex;
2

3
// async Mutex 的死锁更难调试，因为"持有锁"的时间可能跨越 .await 点
4
let mut guard = cache.lock().await;
5
let data = fetch_from_db(&key).await;  // 持有 cache 锁的同时等待网络！
6
guard.insert(key, data);               // 其他任务无法访问 cache

防御：永远在 .await 之前释放锁

1
let data = {
2
    let guard = cache.lock().await;
3
    guard.get(&key).cloned()  // 克隆数据
4
}; // 锁已释放
5

6
let data = match data {
7
    Some(d) => d,
8
    None => fetch_from_db(&key).await,  // 不持有锁
9
};
10

11
cache.lock().await.insert(key, data);  // 短暂加锁

死锁检测#

1
// 在测试中启用 parking_lot 的死锁检测
2
// [dependencies]
3
// parking_lot = { version = "0.12", features = ["deadlock_detection"] }
4

5
// 在 main 函数开头
6
#[cfg(test)]
7
fn check_deadlocks() {
8
    use parking_lot::deadlock;
9
    let deadlocks = deadlock::check_deadlock();
10
    if !deadlocks.is_empty() {
11
        for (i, threads) in deadlocks.iter().enumerate() {
12
            eprintln!("Deadlock #{}:", i);
13
            for t in threads {
14
                eprintln!("  Thread {:?} holding lock at {:?}", t.thread_id(), t.backtrace());
15
            }
16
        }
17
        panic!("{} deadlocks detected", deadlocks.len());
18
    }
19
}

clippy lint 驱动的防御性编码#

Clippy 是防御性编程的最佳工具——让 lint 在 CI 中替你把关。

核心 lint 配置#

1
# .clippy.toml 或 Cargo.toml [lints.clippy]
2
# 推荐的防御性 lint 集合

1
#![warn(
2
    clippy::unwrap_used,           // 禁止 unwrap，强制 expect 或 ?
3
    clippy::expect_used,           // 可选：也禁止 expect（更严格）
4
    clippy::indexing_slicing,      // 禁止 v[i]，强制 v.get(i)
5
    clippy::arithmetic_side_effects,  // 禁止裸算术，强制 checked/saturating
6
    clippy::panic,                 // 禁止显式 panic!
7
    clippy::todo,                  // 禁止 todo!（确保没有未完成代码）
8
    clippy::unimplemented,         // 禁止 unimplemented!
9
    clippy::unreachable,           // 禁止 unreachable!（用 unreachable_unchecked 显式标注）
10
)]
11

12
#![allow(
13
    clippy::expect_used,           // 在测试中允许 expect
14
)]

实战配置：分模块设置严格度#

1
// lib.rs — 库代码严格
2
#![warn(clippy::unwrap_used, clippy::indexing_slicing)]
3

4
// 只在特定模块中放宽
5
#[cfg(test)]
6
mod tests {
7
    #![allow(clippy::unwrap_used)]  // 测试中允许 unwrap
8

9
    #[test]
10
    fn test_something() {
11
        let v = vec![1, 2, 3];
12
        assert_eq!(v[0], 1);  // 测试中索引 OK
13
    }
14
}
15

16
// FFI 模块特殊处理
17
mod ffi {
18
    #![allow(clippy::panic)]  // FFI 边界的 panic 有时是合理的（防御 UB）
19

20
    pub unsafe extern "C" fn callback() {
21
        if !is_valid_state() {
22
            panic!("invalid state in FFI callback — potential UB");
23
        }
24
    }
25
}

常用防御性 lint 一览#

lint	防御的 bug	建议级别
`unwrap_used`	unwrap 导致的意外 panic	warn
`indexing_slicing`	索引越界 panic	warn
`arithmetic_side_effects`	整数溢出	warn (领域相关)
`panic`	显式 panic	warn
`todo`	未完成代码上线	deny
`string_slice`	UTF-8 边界错误	warn
`or_fun_call`	`unwrap_or(expensive())` 性能问题	warn
`if_then_some_else_none`	手写 Option filter	warn
`semicolon_if_nothing_returned`	混淆表达式/语句	warn

CI 中强制 clippy#

1
# GitHub Actions
2
- name: Clippy
3
  run: cargo clippy --all-targets --all-features -- -D warnings

-D warnings 把所有 warn 级别的 lint 提升为 deny（编译失败），确保防御性规则在 CI 中被强制执行。

渐进式采用：不要一次性全开#

在已有项目中开启防御性 lint 的策略：

1
# 第一步：只允许，不强制
2
cargo clippy -- -W clippy::unwrap_used
3

4
# 第二步：修复高频 lint，在 CI 中强制
5
# 逐个 lint 开启，每次只加一个
6

7
# 第三步：全面强制
8
cargo clippy --all-targets -- -D warnings

实战经验总结#

unwrap 默认拒绝：用 expect 语义化、用 ? 传播、用 ok_or 转换
整数溢出是隐蔽的 release bug：用 saturating_*/checked_*/wrapping_* 显式声明意图
索引操作默认用 get：只在逻辑保证安全时用 []
死锁不是类型系统能防的：锁顺序约定 + 缩小锁范围 + 测试中检测
async 中的锁要特别小心：不要在持有锁时 .await
clippy 是最好的防御性工具：在 CI 中强制，分模块设严格度
overflow-checks = true：金融/密码/关键计算场景的必需配置

音乐

音乐