Rust 2026 经验谈 - Unsafe 的哲学与边界

unsafe 是 Rust 最被误解的关键字——它不是”禁用安全检查”，而是”我手动保证安全不变量，请编译器信任我”。unsafe 的哲学核心是：unsafe 是安全的基石，安全的边界由 unsafe 划定。本文深入 unsafe 的语义四件、边界最小化原则、模块级 unsafe 变更，以及 Soundness 概念。

unsafe 语义四件详解#

unsafe {} 块解锁四项额外能力，其余一切安全规则不变：

第一件：解引用原始指针#

1
let mut x = 42;
2
let ptr: *mut i32 = &mut x as *mut i32;
3

4
// 安全代码中不能解引用原始指针
5
// let val = *ptr;  // error: dereference of raw pointer requires unsafe
6

7
// unsafe 块中可以
8
unsafe {
9
    *ptr = 99;
10
    let val = *ptr;
11
    assert_eq!(val, 99);
12
}

为什么需要 unsafe：原始指针可能空、悬垂、未对齐、指向无效数据——编译器无法验证。

正确姿势：在 unsafe 块中用注释说明为什么这次解引用是安全的：

1
unsafe {
2
    // SAFETY: ptr 来自 Box::into_raw，保证非空、对齐、有效
3
    // 且在此次解引用期间没有其他引用访问 *ptr
4
    *ptr = 99;
5
}

第二件：调用 unsafe 函数#

1
unsafe fn dangerous_operation(ptr: *const i32) -> i32 {
2
    // Edition 2024: unsafe fn 函数体不再是隐式 unsafe 上下文
3
    // 解引用原始指针需要显式 unsafe {} 块
4
    unsafe { *ptr }
5
}
6

7
// unsafe 函数只能在 unsafe 块中调用
8
unsafe {
9
    let val = dangerous_operation(&42 as *const i32);
10
    assert_eq!(val, 42);
11
}

unsafe fn 的含义：该函数的安全调用需要满足某些前置条件，编译器不会帮你检查，调用者必须自行保证。

常见的 unsafe 函数：

函数	安全前置条件
`std::ptr::read(ptr)`	`ptr` 非空、对齐、指向有效已初始化数据
`std::ptr::write(ptr, val)`	`ptr` 非空、对齐、指向可写有效内存
`std::slice::from_raw_parts(ptr, len)`	`ptr` 到 `ptr + len` 是有效、非重叠、已初始化的
`String::from_utf8_unchecked(bytes)`	`bytes` 是合法 UTF-8
`Vec::from_raw_parts(ptr, len, cap)`	`ptr` 来自同分配器的 `Vec`，len/cap 有效

第三件：访问或修改可变静态变量#

1
static mut COUNTER: usize = 0;
2

3
// 安全代码中不能访问 mut static
4
// COUNTER += 1;  // error: access to mutable static requires unsafe
5

6
unsafe {
7
    COUNTER += 1;
8
    let val = COUNTER;
9
}

为什么需要 unsafe：static mut 没有同步机制，多线程同时访问是数据竞争——UB。

现代替代方案：

1
use std::sync::atomic::{AtomicUsize, Ordering};
2

3
static COUNTER: AtomicUsize = AtomicUsize::new(0);
4

5
// 不需要 unsafe！
6
COUNTER.fetch_add(1, Ordering::Relaxed);
7
let val = COUNTER.load(Ordering::Relaxed);

规则：新代码几乎不应该使用 static mut，用 Atomic* 或 OnceLock/Mutex 替代。

第四件：实现 unsafe trait#

1
unsafe trait TrustedLen: Iterator {
2
    // 实现 unsafe trait 意味着实现者保证：
3
    // .size_hint() 返回精确长度
4
}
5

6
// unsafe trait 只能在 unsafe impl 中实现
7
unsafe impl TrustedLen for std::ops::Range<usize> {
8
    // Range<usize> 的 size_hint 是精确的
9
}

为什么需要 unsafe：unsafe trait 的正确性是安全代码的推理基础——如果有人错误实现，安全代码可能触发 UB。

常见的 unsafe trait：

trait	安全要求
`Send`	值可以安全转移到其他线程
`Sync`	值可以安全被多线程共享引用
`GlobalAlloc`	分配器满足语义要求（对齐、非重叠等）
`TrustedLen`	`size_hint()` 精确

unsafe 块不做的事#

常见误解：unsafe 会”关闭借用检查器”——不会。

1
let mut x = 1;
2
let r = &x;
3
unsafe {
4
    // x = 2;  // 仍然错误！违反借用规则
5
    // 借用检查在 unsafe 块中完全有效
6
}

unsafe 块只解锁上述四项能力，所有其他安全规则（借用检查、类型检查、生命周期检查）仍然生效。

unsafe 边界最小化原则#

核心原则：unsafe 块越小越好#

1
// 不好：大块 unsafe，无法审计
2
unsafe fn process(data: *const u8, len: usize) -> Vec<u8> {
3
    // Edition 2024: unsafe fn 函数体需显式 unsafe {}
4
    let slice = unsafe {
5
        // SAFETY: 调用者保证 data 指向 len 个有效已初始化字节
6
        std::slice::from_raw_parts(data, len)
7
    };
8
    let mut result = Vec::with_capacity(len);
9
    for &byte in slice {
10
        result.push(byte.wrapping_add(1));
11
    }
12
    result
13
}
14

15
// 好：unsafe 块仅包裹必要的操作，其余在安全代码中
16
fn process(data: *const u8, len: usize) -> Vec<u8> {
17
    let slice = unsafe {
18
        // SAFETY: 调用者保证 data 指向 len 个有效已初始化字节
19
        std::slice::from_raw_parts(data, len)
20
    };
21
    // 后续操作全是安全代码
22
    let mut result = Vec::with_capacity(len);
23
    for &byte in slice {
24
        result.push(byte.wrapping_add(1));
25
    }
26
    result
27
}

最小化策略一：安全封装函数#

将 unsafe 操作封装在安全函数中，函数签名隐藏了 unsafe 细节：

1
mod raw_buffer {
2
    pub struct RawBuffer {
3
        ptr: *mut u8,
4
        len: usize,
5
        cap: usize,
6
    }
7

8
    impl RawBuffer {
9
        pub fn new(cap: usize) -> Self {
10
            let layout = std::alloc::Layout::array::<u8>(cap).unwrap();
11
            let ptr = unsafe {
12
                // SAFETY: layout.size() > 0（cap > 0），全局分配器有效
13
                std::alloc::alloc(layout)
14
            };
15
            if ptr.is_null() {
16
                std::alloc::handle_alloc_error(layout);
17
            }
18
            RawBuffer { ptr, len: 0, cap }
19
        }
20

21
        pub fn push(&mut self, byte: u8) {
22
            if self.len < self.cap {
23
                unsafe {
24
                    // SAFETY: len < cap，ptr 指向 cap 字节有效内存
25
                    std::ptr::write(self.ptr.add(self.len), byte);
26
                }
27
                self.len += 1;
28
            }
29
        }
30

31
        pub fn as_slice(&self) -> &[u8] {
32
            unsafe {
33
                // SAFETY: ptr 指向 len 个已初始化字节
34
                std::slice::from_raw_parts(self.ptr, self.len)
35
            }
36
        }
37
    }
38

39
    impl Drop for RawBuffer {
40
        fn drop(&mut self) {
41
            let layout = std::alloc::Layout::array::<u8>(self.cap).unwrap();
42
            unsafe {
43
                // SAFETY: ptr 来自 alloc，layout 匹配
44
                std::alloc::dealloc(self.ptr, layout);
45
            }
46
        }
47
    }
48
}

外部代码只看到 RawBuffer::new()、push()、as_slice()——全是安全的。

最小化策略二：SAFETY 注释#

每个 unsafe 块都应该有 SAFETY 注释，说明为什么这次操作是安全的：

1
unsafe {
2
    // SAFETY:
3
    // - self.ptr 来自 Box::into_raw，保证非空且对齐
4
    // - self.len <= self.cap 保证不越界
5
    // - &mut self 保证独占访问，无数据竞争
6
    std::ptr::write(self.ptr.add(self.len), byte);
7
}

Clippy 强制：#![warn(clippy::undocumented_unsafe_blocks)] 会在缺少 SAFETY 注释时警告。

最小化策略三：不暴露原始指针#

1
// 不好：暴露原始指针，调用者可能误用
2
pub struct Container {
3
    pub data: *mut u8,  // 公开的！
4
    pub len: usize,
5
}
6

7
// 好：原始指针是私有的，只暴露安全接口
8
pub struct Container {
9
    data: *mut u8,  // 私有
10
    len: usize,
11
    cap: usize,
12
}
13

14
impl Container {
15
    pub fn get(&self, index: usize) -> Option<&u8> {
16
        if index < self.len {
17
            unsafe {
18
                // SAFETY: index < len，data 指向 len 个有效字节
19
                Some(&*self.data.add(index))
20
            }
21
        } else {
22
            None
23
        }
24
    }
25
}

模块级 unsafe（Edition 2024 变更）#

Edition 2024 之前的 `unsafe impl`#

在 Edition 2021 及之前，unsafe impl 可以出现在任何地方：

1
// Edition 2021：合法
2
struct MyType;
3

4
unsafe impl Send for MyType {}  // 直接写，不需要外围 unsafe 块
5
unsafe impl Sync for MyType {}

问题：unsafe impl 散落在代码各处，不易审计。

Edition 2024 的变更#

Edition 2024 允许 unsafe 块包含 impl 项，在 unsafe 块内可以省略 unsafe 关键字（RFC 3329）：

1
// Edition 2024：unsafe 块中可以直接写 impl
2
struct MyType;
3

4
// 传统写法（仍然合法）
5
// unsafe impl Send for MyType {}
6
// unsafe impl Sync for MyType {}
7

8
// 新写法一：在 unsafe 块中，省略 impl 前的 unsafe
9
unsafe {
10
    impl Send for MyType {}
11
    impl Sync for MyType {}
12
}
13

14
// 新写法二：在 unsafe fn 中也可以
15
unsafe fn assert_send_sync() {
16
    // Edition 2024: 这里可以写 impl Send/Sync
17
    // 但函数体中的 unsafe 操作仍需显式 unsafe {} 块
18
}

意义：将 unsafe 操作集中到可见的区域，方便审计。

`unsafe` 关键字的新位置#

Edition 2024 中，unsafe 可以出现在更多位置，明确标记”这里需要 unsafe 证明”：

1
// unsafe trait 声明
2
unsafe trait TrustedAlloc {}
3

4
// unsafe impl 必须在 unsafe 上下文中
5
unsafe {
6
    impl TrustedAlloc for std::alloc::Global {}
7
}
8

9
// unsafe fn 声明
10
unsafe fn raw_read(ptr: *const u8) -> u8 {
11
    // Edition 2024: unsafe fn 函数体需显式 unsafe {}
12
    unsafe { *ptr }
13
}
14

15
// 方法中的 unsafe
16
impl MyType {
17
    // 方法声明中的 unsafe
18
    unsafe fn access_raw(&self, ptr: *const u8) -> u8 {
19
        // Edition 2024: unsafe fn 函数体需显式 unsafe {}
20
        unsafe { *ptr }
21
    }
22
}

unsafe 与安全抽象的关系#

核心论点：unsafe 是安全的基石#

Rust 的安全保证不是凭空而来的——它建立在大量精心审查的 unsafe 代码之上：

Vec<T> 的内部用了原始指针和手动内存管理
Arc<T> 的引用计数用了 AtomicUsize 和 unsafe impl Send/Sync
Mutex<T> 的内部用了操作系统的 futex/pthread
thread::spawn 的内部用了 libc 的 pthread_create
Box<T> 的析构用了 alloc::dealloc

没有这些 unsafe 的”地基”，就没有安全的”大厦”。

安全抽象的定义#

一个**安全抽象（safe abstraction）**是指：

内部使用 unsafe 代码实现
对外只暴露安全接口
只要调用者只使用安全接口，就不可能触发 UB

1
pub struct MyVec<T> {
2
    ptr: *mut T,
3
    len: usize,
4
    cap: usize,
5
}
6

7
// 对外接口全是安全的
8
impl<T> MyVec<T> {
9
    pub fn new() -> Self { /* 内部用 unsafe */ }
10
    pub fn push(&mut self, val: T) { /* 内部用 unsafe */ }
11
    pub fn get(&self, i: usize) -> Option<&T> { /* 内部用 unsafe */ }
12
    pub fn len(&self) -> usize { self.len }
13
}
14

15
// 只要不通过外部手段获取 self.ptr，就不可能造成 UB

安全抽象的验证#

如何验证一个安全抽象是正确的？

1. 代码审查：每行 unsafe 都必须有 SAFETY 注释

2. Miri 测试：Miri 是 Rust 的 UB 检测器

1
cargo +nightly miri test
2
# Miri 会检测：
3
# - 未初始化内存读取
4
# - 悬垂指针解引用
5
# - 数据竞争
6
# - 无效的引用创建
7
# - 越界访问

3. 形式化验证：对于关键代码，用工具如 Prusti 或 Kani 进行验证

1
cargo kani
2
# Kani 对 Rust 代码进行有界模型检查
3
# 验证断言在所有可能的执行路径上成立

踩坑：安全抽象的常见漏洞#

漏洞一：忘记处理 panic 安全性

1
impl<T> MyVec<T> {
2
    pub fn push(&mut self, val: T) {
3
        if self.len == self.cap {
4
            self.grow();  // 如果 grow() panic，self 可能处于不一致状态
5
        }
6
        unsafe {
7
            std::ptr::write(self.ptr.add(self.len), val);
8
        }
9
        self.len += 1;
10
    }
11
}

如果 grow() panic，self.len 还没更新，但 self.cap 可能已经变了。后续操作可能基于不一致的状态。

修复：在修改 self.cap 之前完成所有可能 panic 的操作，或者用 ManuallyDrop 保护。

漏洞二：忘记 Drop

1
impl<T> MyVec<T> {
2
    pub fn pop(&mut self) -> Option<T> {
3
        if self.len == 0 {
4
            return None;
5
        }
6
        self.len -= 1;
7
        unsafe {
8
            // 如果 T 的 Drop panic，ptr 指向的数据已经被"取出"
9
            // 但 MyVec 的 drop 不会再 drop 这个元素——泄漏！
10
            Some(std::ptr::read(self.ptr.add(self.len)))
11
        }
12
    }
13
}

漏洞三：错误的 Send/Sync 推导

1
use std::cell::Cell;
2

3
struct MyWrapper<T> {
4
    inner: Cell<T>,
5
}
6

7
// Cell<T> 不是 Sync——因为 Cell 允许内部可变性
8
// 如果我们错误地实现 Sync：
9
// unsafe impl<T> Sync for MyWrapper<T> {}  // 错误！
10
// 多线程可以同时通过 &MyWrapper 修改 Cell——数据竞争

Soundness 概念#

定义#

Soundness（健全性）：一个 Rust 库是 sound 的，当且仅当：

使用该库的安全 API，不可能在不使用 unsafe 的情况下触发未定义行为

换句话说：如果安全代码出问题了，一定是库的 unsafe 代码有 bug，而不是调用者的错。

Soundness 的形式化#

1
对于所有可能的调用者 C：
2
  如果 C 只使用库 L 的安全 API，且 C 本身不使用 unsafe：
3
  那么 C 的执行不会触发 UB

等价表述：Sound 库的 unsafe 代码对安全调用者是不可见的。

常见的 Unsound 模式#

模式一：通过安全 API 泄漏原始指针

1
pub struct BuggyVec<T> {
2
    data: *mut T,
3
    len: usize,
4
    cap: usize,
5
}
6

7
impl<T> BuggyVec<T> {
8
    // Unsound！安全的 get_ptr 方法暴露了原始指针
9
    pub fn get_ptr(&self) -> *mut T {
10
        self.data  // 安全代码可以拿到原始指针
11
    }
12
}
13

14
// 调用者（安全代码）可以造成 UB：
15
let mut v = BuggyVec::new();
16
v.push(1);
17
let ptr = v.get_ptr();  // 安全代码拿到指针
18
v.push(2);              // 可能 reallocate，ptr 悬垂
19
unsafe { *ptr = 99; }   // UB！但调用者只用了安全 API

模式二：错误的生命周期逃逸

1
pub fn buggy_as_slice<'a>(ptr: *const u8, len: usize) -> &'a [u8] {
2
    unsafe {
3
        // Unsound！返回的引用没有绑定到任何所有者
4
        // 调用者可以任意延长生命周期
5
        std::slice::from_raw_parts(ptr, len)
6
    }
7
}

模式三：错误的 Send/Sync 实现

1
use std::rc::Rc;
2

3
struct Bad<T> {
4
    inner: Rc<T>,
5
}
6

7
// Unsound！Rc<T> 不是 Sync
8
unsafe impl<T> Sync for Bad<T> {}
9
// 多线程共享 &Bad<T>，等于多线程共享 &Rc<T>——数据竞争

如何证明 Soundness#

1. 模块边界是 Soundness 的边界

1
mod my_module {
2
    // 私有字段 + 安全公开接口 = soundness 封装
3
    pub struct SafeWrapper {
4
        ptr: *mut u8,  // 私有！外部不能直接访问
5
        len: usize,
6
    }
7

8
    impl SafeWrapper {
9
        pub fn new(data: Vec<u8>) -> Self { /* ... */ }
10
        pub fn as_slice(&self) -> &[u8] { /* ... */ }
11
    }
12
    // 只要内部 unsafe 正确，外部安全代码不可能触发 UB
13
}

2. Rust 的隐私规则保证 Soundness

私有字段外部不可访问 → 外部无法绕过安全抽象 → Soundness 成立

3. Miri 是 Soundness 的实验验证

1
# 用 Miri 运行测试，检测 UB
2
cargo +nightly miri test
3

4
# 用 Miri 运行特定测试
5
cargo +nightly miri test -- test_my_vec

Miri 能检测大多数（非全部）UB，是验证 unsafe 代码的必备工具。

unsafe 实战经验总结#

1. 每行 unsafe 都要 SAFETY 注释#

1
unsafe {
2
    // SAFETY: self.ptr 来自 self.vec.as_mut_ptr()，
3
    // self.index < self.vec.len()（由 new 的断言保证），
4
    // 且 &mut self 保证独占访问
5
    std::ptr::write(self.ptr.add(self.index), value);
6
}

2. unsafe 块不超过 5 行#

如果 unsafe 块超过 5 行，说明你在 unsafe 中做了太多”安全”操作。把安全操作移到 unsafe 块外面：

1
// 不好
2
unsafe {
3
    let slice = std::slice::from_raw_parts(ptr, len);
4
    let result = slice.iter().map(|&x| x + 1).collect::<Vec<_>>();
5
    // map 和 collect 不需要 unsafe
6
}
7

8
// 好
9
let slice = unsafe {
10
    // SAFETY: ...
11
    std::slice::from_raw_parts(ptr, len)
12
};
13
let result = slice.iter().map(|&x| x + 1).collect::<Vec<_>>();

3. 用 Miri 测试所有 unsafe 代码#

1
[dev-dependencies]
2
# 无需添加，Miri 是工具而非依赖

1
rustup +nightly component add miri
2
cargo +nightly miri test

4. 优先用 `static` + `Atomic` 代替 `static mut`#

1
// 不好
2
static mut FLAG: bool = false;
3

4
// 好
5
use std::sync::atomic::{AtomicBool, Ordering};
6
static FLAG: AtomicBool = AtomicBool::new(false);

5. 优先用安全抽象代替裸 unsafe#

1
// 不好：到处用 unsafe
2
unsafe { std::ptr::write(ptr1, val1); }
3
unsafe { std::ptr::write(ptr2, val2); }
4

5
// 好：封装为安全函数
6
fn write_pair(buf: &mut [u8], offset: usize, val1: u8, val2: u8) {
7
    buf[offset] = val1;
8
    buf[offset + 1] = val2;
9
}

音乐

音乐

unsafe 语义四件详解#

第一件：解引用原始指针#

第二件：调用 unsafe 函数#

第三件：访问或修改可变静态变量#

第四件：实现 unsafe trait#

unsafe 块不做的事#

unsafe 边界最小化原则#

核心原则：unsafe 块越小越好#

最小化策略一：安全封装函数#

最小化策略二：SAFETY 注释#

最小化策略三：不暴露原始指针#

模块级 unsafe（Edition 2024 变更）#

Edition 2024 之前的 `unsafe impl`#

Edition 2024 的变更#

`unsafe` 关键字的新位置#

unsafe 与安全抽象的关系#

核心论点：unsafe 是安全的基石#

安全抽象的定义#

安全抽象的验证#

踩坑：安全抽象的常见漏洞#

Soundness 概念#

定义#

Soundness 的形式化#

常见的 Unsound 模式#

如何证明 Soundness#

unsafe 实战经验总结#

1. 每行 unsafe 都要 SAFETY 注释#

2. unsafe 块不超过 5 行#

3. 用 Miri 测试所有 unsafe 代码#

4. 优先用 `static` + `Atomic` 代替 `static mut`#

5. 优先用安全抽象代替裸 unsafe#

支持与分享

评论区

音乐

文章目录

音乐

音乐

Rust 2026 经验谈 - Unsafe 的哲学与边界

unsafe 语义四件详解#

第一件：解引用原始指针#

第二件：调用 unsafe 函数#

第三件：访问或修改可变静态变量#

第四件：实现 unsafe trait#

unsafe 块不做的事#

unsafe 边界最小化原则#

核心原则：unsafe 块越小越好#

最小化策略一：安全封装函数#

最小化策略二：SAFETY 注释#

最小化策略三：不暴露原始指针#

模块级 unsafe（Edition 2024 变更）#

Edition 2024 之前的 unsafe impl#

Edition 2024 的变更#

unsafe 关键字的新位置#

unsafe 与安全抽象的关系#

核心论点：unsafe 是安全的基石#

安全抽象的定义#

安全抽象的验证#

踩坑：安全抽象的常见漏洞#

Soundness 概念#

定义#

Soundness 的形式化#

常见的 Unsound 模式#

如何证明 Soundness#

unsafe 实战经验总结#

1. 每行 unsafe 都要 SAFETY 注释#

2. unsafe 块不超过 5 行#

3. 用 Miri 测试所有 unsafe 代码#

4. 优先用 static + Atomic 代替 static mut#

5. 优先用安全抽象代替裸 unsafe#

支持与分享

评论区

音乐

文章目录

Edition 2024 之前的 `unsafe impl`#

`unsafe` 关键字的新位置#

4. 优先用 `static` + `Atomic` 代替 `static mut`#